Amazon cloud meluncurkan fungsi agen AI, menjadikan AI sebagai asisten, bukan sekadar obrolan

Sumber: Makalah

Reporter Shao Wen

Fitur Agen Amazon Bedrock akan memungkinkan perusahaan membangun aplikasi AI yang dapat mengotomatiskan tugas tertentu, seperti membuat reservasi restoran, bukan sekadar mendapatkan rekomendasi tempat makan.

"Banyak orang sangat fokus pada model ini dan ukuran modelnya, tetapi menurut saya yang paling penting adalah bagaimana membangun aplikasi dengannya, dan itulah alasan utama mengapa kami merilis fitur Agen hari ini."

Pada tanggal 26 Juli waktu setempat, Swami Sivasubramanian, Global Vice President of Amazon Cloud Technology Database, Data Analysis and Machine Learning, berbicara di New York Summit.

Di KTT New York, salah satu KTT tahunan Amazon Web Services (AWS), beberapa pengumuman berpusat pada kecerdasan buatan generatif. "Teknologi ini telah mencapai titik kritis," kata Swami Sivasubramanian, wakil presiden global Amazon untuk database teknologi cloud, analitik data, dan pembelajaran mesin.

Pada tanggal 26 Juli Waktu Bagian Timur, di KTT New York, AWS meluncurkan fungsi Agen (agen) dari Amazon Bedrock, layanan AI generatif, untuk membantu model dasar menyelesaikan tugas kompleks. "Ini akan memungkinkan perusahaan untuk membangun aplikasi AI yang dapat mengotomatiskan tugas-tugas tertentu, seperti membuat reservasi restoran, daripada hanya mendapatkan rekomendasi tempat makan," kata Sivasubramanian.

Selain itu, AWS juga telah meluncurkan alat kecerdasan buatan baru, termasuk ketersediaan resmi asisten pemrograman Amazon CodeWhisperer, Amazon HealthScribe, layanan medis cerdas baru untuk membuat catatan klinis setelah kunjungan pasien, dan Amazon Entity Resolution, layanan analisis. Pada saat yang sama, instans P5 Amazon EC2 untuk AI generatif yang dipercepat dan aplikasi komputasi performa tinggi telah tersedia secara resmi.

Vasi Philomin, Wakil Presiden Global untuk AI Generatif di Amazon Cloud Technology, berbagi dengan The Paper bahwa di antara semua rilis, yang paling dia khawatirkan dan banggakan adalah fungsi Agen." Banyak orang sangat fokus pada model ini dan ukuran modelnya, tetapi menurut saya yang paling penting adalah bagaimana Anda membangun aplikasi dari model tersebut, dan itulah alasan utama mengapa kami merilis fitur Agen hari ini."

Kompetisi Agen AI

Model AI generatif seperti OpenAI's GPT-4 atau Meta's Llama 2 sangat kuat, tetapi mereka tidak dapat mengotomatiskan tugas tertentu untuk pengguna tanpa bantuan tambahan, seperti plugin.

Amazon Bedrock menawarkan cara untuk membangun aplikasi AI generatif melalui model yang telah dilatih sebelumnya dari startup serta teknologi cloud Amazon itu sendiri, tanpa berinvestasi pada server. Fitur Agen Amazon Bedrock memungkinkan perusahaan untuk menggunakan data mereka sendiri untuk mengajarkan model dasar dan kemudian membuat aplikasi lain untuk menyelesaikan tugas. Pengembang dapat memilih model dasar mana yang akan digunakan, memberikan beberapa instruksi, dan memilih data mana yang akan dibaca oleh model tersebut.

Ini mirip dengan sistem plugin OpenAI yang baru diperkenalkan untuk GPT-4 dan ChatGPT, yang memperluas kemampuan model dengan membiarkan mereka memanfaatkan API dan database pihak ketiga. Faktanya, baru-baru ini ada tren ke arah model generatif yang "dipersonalisasi", dengan startup seperti alat bangunan AI Kontekstual untuk menambah model dengan data perusahaan.

Misalnya, perusahaan perjalanan dapat menggunakan kecerdasan buatan generatif untuk memberikan rekomendasi perjalanan, kemudian membangun agen lain (Agen) untuk menerima riwayat perjalanan dan minat pengguna, kemudian menggunakan agen untuk menemukan jadwal penerbangan, dan terakhir membangun agen untuk memesan pilihan Anda. penerbangan.

AWS bukan satu-satunya yang antusias dengan Agen. Pada bulan April, CEO Meta Mark Zuckerberg (Mark Zuckerberg) juga memberi tahu investor bahwa mereka memiliki kesempatan untuk menghadirkan agen kecerdasan buatan (Agen) "ke miliaran orang dengan cara yang bermanfaat dan bermakna." Pada bulan Juli, CEO OpenAI Sam Altman terjun ke agen AI dan bagaimana mereka dapat diimplementasikan dengan baik dalam sebuah wawancara dengan The Atlantic.

Reuters melaporkan pada bulan Juli bahwa perlombaan untuk agen intelijen buatan (Agen) "otonom" sedang menyapu Lembah Silikon. Ini mengutip satu startup, Inflection AI, yang mengumpulkan dana $1,3 miliar pada akhir Juni. Menurut pendirinya di podcast, perusahaan sedang mengembangkan asisten pribadi yang dikatakan dapat bertindak sebagai mentor atau menangani tugas-tugas seperti mendapatkan kredit penerbangan dan hotel setelah penundaan perjalanan.

Pada 26 Juli, Sivasubramanian mengatakan dalam sebuah wawancara dengan media bahwa pelanggan seperti Sony (SONY), Ryanair (Ryanair), dan Sun Life (Sun Life) telah mencoba Amazon Bedrock. Sivasubramanian mengatakan Amazon Bedrock akan segera tersedia untuk semua pelanggan. Dia menolak mengatakan kapan, menambahkan bahwa perusahaan bertujuan untuk mengatasi alokasi biaya dan kontrol perusahaan terlebih dahulu.

Layanan Amazon Bedrock diluncurkan pada bulan April, ketika Amazon Bedrock menawarkan Amazon Titan (model dasar AWS sendiri) serta model yang dibuat oleh stable.ai, AI21Labs, dan Anthropic.

Pada KTT New York kali ini, AWS mengumumkan penambahan Cohere sebagai pemasok model dasar, bergabung dengan chatbot model dasar terbaru dari Anthropic and Stability AI. Model pembuatan teks perintah Cohere dilatih untuk mengikuti petunjuk pengguna dan mengembalikan ringkasan, transkrip, dan percakapan, dan alat ini juga dapat mengekstrak informasi dan menjawab pertanyaan.

Platform AWS dapat memanggil chip Nvidia H100

Di KTT New York, AWS juga meluncurkan instans P5 Amazon EC2 yang ditenagai oleh chip Nvidia H100. Di satu sisi, ini adalah tonggak penting dalam kerja sama lebih dari sepuluh tahun antara AWS dan Nvidia.

Salah satu fitur penting dari GPU H100 adalah pengoptimalan Transformer, teknologi utama yang digunakan dalam model bahasa besar. Instans P5 Amazon EC2 menawarkan 8 GPU NVIDIA H100 dengan memori GPU bandwidth tinggi 640 GB, prosesor AMD EPYC generasi ke-3, memori sistem 2 TB, dan penyimpanan NVMe lokal 30 TB untuk mempercepat AI generatif dan aplikasi komputasi kinerja tinggi.

Amazon EC2 P5 mengurangi waktu pelatihan hingga 6x (dari hari ke jam) dibandingkan dengan instans berbasis GPU generasi sebelumnya. Menurut AWS, peningkatan kinerja ini akan mengurangi biaya pelatihan sebesar 40% dibandingkan generasi sebelumnya.

Faktanya, sejak peluncuran chip Amazon Nitro pertama pada tahun 2013, AWS adalah vendor cloud pertama yang menginjakkan kaki dalam chip yang dikembangkan sendiri.Ini sudah memiliki tiga lini produk chip jaringan, chip server, dan pembelajaran mesin kecerdasan buatan mandiri. chip yang dikembangkan. Pada awal 2023, Amazon Inferentia 2 yang dibuat khusus (yang dapat mendukung inferensi terdistribusi melalui koneksi langsung berkecepatan sangat tinggi antar chip) dirilis, mendukung hingga 175 miliar parameter, menjadikannya pesaing kuat untuk inferensi model skala besar.

Mengenai apakah dia khawatir penyediaan chip Nvidia H100 akan mengurangi daya tarik chip yang dikembangkan sendiri oleh AWS, Ferromin menanggapi Teknologi Pengpai ("Kami menyambut kompetisi. Perangkat keras akan menjadi lebih baik setiap beberapa tahun. Ini adalah Norma. Masalah besar bukan sekarang AI generatif cukup mahal, oleh karena itu tidak ada yang benar-benar memasukkannya ke dalam beban kerja produksi, semua orang masih dalam tahap percobaan.Begitu mereka benar-benar memasukkannya ke dalam beban kerja produksi, mereka akan menyadari bahwa 90% dari biaya dihasilkan Dengan itu. Skenario kasus terbaik adalah Anda tidak kehilangan uang pada setiap panggilan, Anda benar-benar menghasilkan uang. Untuk mencapai ini, saya pikir kita perlu bersaing."

Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)