Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas
Setelah sukses besar ChatGPT, OpenAI telah beralih ke tujuan berikutnya - Agen AI (badan cerdas).
"Jika sebuah makalah mengusulkan metode pelatihan yang berbeda, OpenAI akan mencemooh secara internal, berpikir bahwa itu semua ditinggalkan oleh kami. Tetapi ketika makalah Agen AI baru keluar, kami akan membahasnya dengan sangat serius dan bersemangat.** Orang biasa, pengusaha dan geek memiliki keunggulan dibandingkan perusahaan seperti OpenAI dalam hal membangun Agen AI.**” kata Andrej Karpathy, salah satu pendiri OpenAI dan mantan direktur TeslaAI.
Pidato publik Karpathy telah menambahkan banyak panas ke Agen AI. Tapi penilaiannya tidak eksklusif.
Pada awal Maret, AutoGPT menerima 74.000 bintang di GitHub, dan dengan cepat menjadi proyek open source dengan pertumbuhan tercepat dalam sejarah; BabyAGI dan AgentGPT, yang dirilis kemudian, bermunculan seperti jamur: memesan pizza, mengatur kotak surat, membuat blog, dan bahkan Mengadakan Pesta Hari Valentine...
Semakin banyak Agen AI muncul di berbagai adegan kehidupan orang, dan kegemaran menyebar dengan cepat dari Silicon Valley.
Self-executing dan beroperasi secara mandiri, Agen AI diberi ekspektasi tinggi oleh para teknolog, yang menganggapnya sebagai "alat produktivitas yang mengubah masyarakat." Beberapa orang bahkan menganggapnya sebagai "awal era kecerdasan buatan umum (AGI)".
Tapi suara-suara itu tidak bisa menyembunyikan masalah yang ada.
"Model besar adalah prasyarat untuk Agen AI. Hanya dengan fondasi perangkat keras yang cukup baik kita dapat mengembangkan Agen AI," kata Dai Yusen, mitra pengelola ZhenFund, kepada "Jiazi Guangnian".
Sebenarnya, hanya ChatGPT yang memiliki basis model besar yang "berkualitas" di pasar. Dibatasi oleh daya komputasi model, masih terdapat kekurangan lahan untuk pengembangan Agen AI di China.
Masa depan cerah, tetapi kenyataannya kejam. Penelitian dan pengembangan teknologi dan modal ventura semuanya berjalan lancar. Tidak ada yang tahu kapan periode dividen Agen AI benar-benar datang dengan gelombang model besar. Namun yang pasti, perubahan diam-diam telah dimulai.
Agen 1.AI: "asisten digital" yang membantu Anda melakukan berbagai hal
Daripada memperlakukan Agen AI sebagai versi ChatGPT yang ditingkatkan, lebih tepat menganggapnya sebagai "asisten digital" untuk manusia.
Ini tidak hanya memberi tahu Anda "bagaimana melakukannya", tetapi juga "membantu Anda melakukannya". Sebagai media, Agen AI menggantikan manusia dan berinteraksi berulang kali dengan model Bahasa Besar (LLM) seperti GPT. Selama tujuan diberikan, ia dapat mensimulasikan perilaku cerdas, membuat tugas secara mandiri, menentukan kembali prioritas daftar tugas, dan selesaikan tugas Tugas pertama, dan ulangi sampai tujuan tercapai.
Tidak seperti kecerdasan buatan tradisional, AI Agen dapat beroperasi secara mandiri tanpa kendali manusia. **Dengan mengakses API, Agen AI bahkan dapat menelusuri web, menggunakan aplikasi, membaca dan menulis file, membayar dengan kartu kredit, dan banyak lagi.
Sederhananya, Anda hanya perlu memberikan tujuan, dan AI **Agen dapat melakukan sisanya. Misalnya, agen AI yang dikembangkan oleh HyperWrite dapat memesan pizza secara otomatis untuk Anda melalui program kontrol browser Chrome. **
Sumber: akun Twitter CEO HyperWrite Matt Shumer
Imajinasi semacam ini tidak sulit untuk dimasukkan ke dalam film fiksi ilmiah, tetapi dalam proses eksplorasi kecerdasan buatan, telah berlangsung selama hampir setengah abad.
Pada awal 1980-an, ilmuwan komputer mulai mengeksplorasi cara mengembangkan perangkat lunak cerdas yang dapat berinteraksi seperti manusia. Namun, karena keterbatasan data dan daya komputasi, Agen AI tidak memiliki kondisi realistis yang diperlukan.
Joon Park, seorang Ph.D. dalam ilmu komputer di Universitas Stanford, pernah berkata dalam sebuah wawancara: "Kami telah bekerja ke arah itu, tetapi semua metode dalam beberapa dekade terakhir bahkan belum mendekati apa yang kami capai sekarang. dengan LLM... Itu sebabnya kami melupakan visi itu. Tapi ketika LLM datang, kami menyadari bahwa ada peluang.”
Model bahasa besar adalah otak inti Agen AI. Dengan membongkar tugas yang kompleks, kebutuhan pengguna yang kompleks dapat dibongkar menjadi metode tugas yang dapat dicapai.
Di satu sisi, pelatihan model besar dibangun berdasarkan Internet dan berisi sejumlah besar data perilaku manusia, yang merupakan elemen kunci untuk membangun Agen AI yang kredibel.
Di sisi lain, dengan kapasitas pengetahuan yang cukup besar, model besar muncul dengan kemampuan pembelajaran konteks dan kemampuan penalaran yang sangat baik. Dengan membangun rantai pemikiran untuk mewujudkan model pemikiran dan pengambilan keputusan yang berkelanjutan, Agen AI dapat menganalisis masalah yang kompleks dan membongkarnya menjadi sub-tugas yang sederhana dan terperinci.
Pada saat yang sama, penggunaan bahasa LLM sebagai media juga telah mengubah bentuk interaksi front-end. Wen Yongteng, kepala jalur aplikasi AI BV Baidu Ventures dan wakil presiden investasi, mengatakan kepada "Jiazi Guangnian": "BV Baidu Ventures mulai memperhatikan pengembangan Agen AI sejak dini. Melalui penelitian dan penilaian, kami percaya bahwa antarmuka pengguna grafis asli (GUI) Dimungkinkan untuk berubah menjadi antarmuka pengguna bahasa (LanguageUI), dan aplikasi front-end Agen AI akan ada dalam semua bentuk front-end yang dapat berinteraksi dengan manusia."
Itu hanya tugas membongkar, dan itu jauh dari pintar. AI didorong oleh LLMAgen tidak dapat bekerja tanpa tiga komponen utama:
**Perencanaan: **Membagi tugas berskala besar menjadi sub-tujuan yang lebih kecil dan dapat dikelola; melakukan refleksi dan penyempurnaan, menganalisis, meringkas, dan menyempurnakan perilaku masa lalu untuk meningkatkan kecerdasan dan kemampuan beradaptasi mereka, Meningkatkan kualitas hasil akhir.
**Memori (Memori): **Memori jangka pendek, pembelajaran kontekstual; memori jangka panjang, kemampuan untuk menyimpan dan mengingat informasi tak terbatas untuk waktu yang lama, umumnya dicapai melalui penyimpanan operator eksternal dan pengambilan cepat.
Penggunaan alat: dapat belajar memanggil API eksternal untuk mendapatkan informasi tambahan yang hilang dalam bobot model.
Tinjauan Agen AI yang digerakkan oleh LLM, sumber gambar: blog pribadi Lilian Weng
Dengan kerjasama ketiga komponen tersebut, AI Agent tidak hanya dapat berpikir seperti manusia, tetapi juga bertindak seperti manusia.
Sama seperti manusia, saat melakukan tugas yang rumit, sering kali ada proses penalaran di antara setiap langkah. Agen AI juga akan menggunakan komponen ReAct (perpustakaan Java untuk membangun antarmuka pengguna) untuk menggabungkan secara dekat kemampuan penalaran model besar dengan keputusan perilaku, sehingga model bahasa dapat direncanakan dan diatur secara logis berdasarkan pengetahuan.
Framework Reflexition memberi Agen AI memori dinamis dan kemampuan refleksi diri. Memperkuat Agen Bahasa melalui umpan balik bahasa daripada memperbarui bobot memungkinkannya memperbaiki keputusan tindakan di masa lalu dan memperbaiki kesalahan di masa lalu untuk terus meningkatkan kinerjanya.
Dalam proses perolehan, penyimpanan, retensi, dan pengambilan informasi, Agen AI juga mencoba meniru komposisi memori manusia dan membangun sistem memori yang efisien.
Mensimulasikan cara memori manusia, Agen AI akan mengekspresikan memori sensorik, memori jangka pendek, dan memori jangka panjang sebagai pembelajaran yang melekat pada input asli (seperti teks, gambar, dll.), pembelajaran konteks, dan penyimpanan vektor eksternal . Tugas dan hasil disimpan dalam modul memori, dan ketika informasi dipanggil kembali, informasi yang disimpan dalam memori dikembalikan ke dialog dengan pengguna, sehingga menciptakan konteks yang lebih erat.
Salah satu sifat manusia yang paling khas adalah penggunaan dan penciptaan alat. Dengan dilengkapi alat eksternal dan menggunakan API untuk memanggil berbagai antarmuka, Agen AI dapat mensimulasikan penggunaan alat oleh manusia untuk menyelesaikan tugas yang lebih kompleks.
Meskipun tingkat teknisnya belum sepenuhnya matang, masalah seperti pengelolaan data dan memori jangka panjang masih dapat diselesaikan. Namun, kemampuan Agen AI untuk mengeksekusi secara mandiri, mengoptimalkan secara iteratif, dan "tangan bebas" juga membuatnya menjadi populer.
2. Menggantikan LLM, Agen AI menjadi hotspot AI berikutnya
Kelahiran ChatGPT telah menyadari fungsi AI yang melakukan banyak percakapan dengan manusia dan memberikan informasi dan saran. Pengenalan Copilot telah memungkinkan AI melakukan kemampuan menyelesaikan draf pertama pekerjaan untuk manusia, seperti Github Copilot, Microsoft 365 Copilot, dan Midjourney, yang telah menjadi "smart copilot" orang-orang di bidang pemrograman, pekerjaan kantor, dan pembuatan gambar.
Beri tahu AI untuk melakukan tugas, dan itu akan melakukan tugas—menulis salinan, menjawab pertanyaan, atau membuat foto yang sulit dilihat oleh mata manusia asli atau palsu. Pada saat yang sama, orang seringkali perlu memberikan petunjuk yang spesifik dan jelas untuk setiap langkah AI.
AI saat ini seperti anak magang yang baru datang, belum punya pengalaman, dan perlu diajar secara manual. Namun, bagaimana jika Anda menginginkan karyawan yang baik yang mematuhi perintah, menyelesaikan sendiri kesulitan dalam eksekusi, dan berusaha untuk tidak menimbulkan masalah bagi orang lain?
Pada bulan Maret dan April, Camel, AutoGPT, BabyAGI, Westworld Township, dan Agen AI lainnya meledak bersamaan, yang sepertinya membuat orang melihat kemungkinan seperti itu.
Sejak AutoGPT sumber terbuka Significant Gravitas pada bulan Maret, dalam waktu dua bulan setelah dirilis, AutoGPT telah menerima 130.000 bintang di GitHub, menjadikannya proyek sumber terbuka dengan pertumbuhan tercepat dalam sejarah.
Kota Westworld dibuat oleh Stanford University
Sumber gambar: Makalah "Agen Generatif: Simulakra Interaktif Perilaku Manusia"
Andrej Karpathy pernah berkata di Twitter: "Perbatasan selanjutnya dari rekayasa cepat (teknik) adalah AutoGPT". Hingga saat ini, AutoGPT telah memperoleh lebih dari 140.000 bintang di platform hosting kode Github, peringkat ke-25 dalam sejarah.
Salah satu pendiri dan CEO OpenAI Sam Altman telah beberapa kali menyatakan bahwa era membangun model AI yang besar telah berakhir, dan tantangannya adalah tubuh yang cerdas.
Dalam sebuah artikel yang memperkenalkan agen otonom, penulis, Matt Schlicht, salah satu pendiri dan CEO Octane AI (penyedia platform pemasaran data), mengumpulkan pandangan dan pendapat lebih dari seratus orang dari kalangan industri, akademisi, dan investasi. Pakar dari perusahaan besar seperti Meta, Nvidia, Stability AI atau AI start-up, serta anggota fakultas Stanford CS dan investor AI termasuk Hugging Face, sebagian besar dari mereka mengungkapkan ekspektasi dan prospek mereka terhadap potensi Agen AI, bahkan disebut "AGI mentah".
Mengambil alih dari model besar, Agen AI tampaknya menjadi hal besar berikutnya dalam AI.
Tetapi pada saat yang sama, suara oposisi tidak ada habisnya.
Pemenang Penghargaan Turing Yoshua Bengio menyebutkan dalam posting blognya "How AI that Harms Humans Appears" yang diterbitkan pada Mei tahun ini bahwa manusia dapat mengontrol tugas dan tujuan umum Agen AI, tetapi itu tidak berarti bahwa manusia dapat mengontrol Agen AI berdasarkan Untuk subtugas dan subtujuan yang diuraikan oleh kecerdasannya sendiri, kecuali penelitian tentang penyelarasan AI membuat terobosan, manusia tidak akan memiliki jaminan keamanan yang kuat.
Kemunculan kolektif agen cerdas, pengejaran dan keraguan bos besar, gelombang Agen AI cepat dan panas.
Namun, Agen AI bukanlah istilah baru dalam lingkaran kecerdasan buatan.
Pada tahun 2014, Go AI AlphaGo yang diluncurkan oleh DeepMind sebenarnya adalah sejenis Agen AI. Mirip dengan ini adalah OpenAI Five yang diluncurkan oleh OpenAI pada 2017 untuk memainkan "Dota2", dan pada 2019 DeepMind mengumumkan AlphaStar untuk memainkan "StarCraft 2".
Tren industri saat itu adalah melatih dan meningkatkan Agen AI melalui pembelajaran penguatan, yang terutama digunakan dalam skenario game, terutama dalam beberapa game konfrontatif dengan pemenang dan pecundang yang jelas. Tapi itu pertanyaan terbuka jika seseorang ingin mencapai keumuman di dunia nyata.
Dalam beberapa tahun ke depan, OpenAI beralih ke model bahasa skala besar, dan seri GPT diluncurkan satu demi satu. Model skala besar menjadi jalur untuk berbagai produsen teknologi. Ini juga merupakan pengembangan model skala besar yang memungkinkan Agen AI menerobos kemacetan dan mengembangkan kembali peluang.
Dibandingkan dengan terbatas pada skenario game beberapa tahun yang lalu, apa yang bisa dicapai Agen AI berdasarkan model besar? Wen Yongteng, kepala jalur aplikasi AI BV Baidu Ventures dan wakil presiden investasi, berkata kepada "Jiazi Guangnian": "Apa yang kami lihat bukan hanya kemajuan teknologi yang telah sangat meningkatkan kemampuan AI untuk memahami maksud pengguna, mengumpulkan informasi, dan melakukan tugas. Lebih penting lagi, Agen AI sepenuhnya mampu merekonstruksi ekosistem aplikasi masa depan."
Tak lama setelah peluncuran AutoGPT, banyak netizen yang menggunakan AutoGPT untuk membuat asisten pribadi otomatis. Misalnya, Udit Goenka, pendiri dan CEO FirstSales.io, memposting bahwa dia menggunakan AutoGPT untuk membuat mesin calon pelanggan yang dapat mencari perusahaan yang menerima investasi awal tahun lalu dan menjelaskan detail pembuatan daftar.
Yew Jin Lim, seorang insinyur perangkat lunak di Google, mengatakan dia menggunakan AutoGPT untuk membuat asisten email yang mengirimkan detail tugas ke Agen AI melalui email.
Dai Yusen, mitra pengelola ZhenFund, mengatakan kepada "Jiazi Guangnian": "Agen adalah arah yang benar-benar dapat meningkatkan produktivitas, karena jika orang masih melakukan sesuatu, orang selalu terbatas."
"Agen AI akan menjadi alat produktivitas dalam kehidupan dan pekerjaan sehari-hari." Matt Schlicht menulis, "Dari mengelola akun media sosial, berinvestasi di pasar, hingga menerbitkan buku anak-anak terbaik, Agen AI akan ada di setiap industri dan setiap industri. tugas yang bisa dibayangkan." Misalnya, aomni adalah agen AI yang dapat mencari informasi tentang topik apa pun di Internet, dan akan menyelesaikan tujuan pengguna satu per satu dengan membuat daftar.
Selain kebutuhan produktivitas, AI Agent Pi pribadi Inflection AI memberikan kemungkinan arah aplikasi lainnya.
Berbeda dari pemosisian ChatGPT dan kecerdasan buatan umum Claude, Pi berfokus pada EQ tinggi, persahabatan emosional, dan memberikan nilai emosional. Pi juga akan mengingat percakapan historis dengan pengguna. Selain berpartisipasi dan membantu pekerjaan dan kehidupan orang lain, Pi juga akan mempelajari cara menghubungi teman dan keluarga untuk menjalin hubungan dengan pengguna. Saat ini, Infleksi AI telah menerima investasi lebih dari 1,5 miliar dolar AS, melampaui Antropik dan nomor dua setelah OpenAI.
**3. Apakah Agen AI akan menjadi tren selanjutnya? **
"Membangun semacam JARVIS (bangunan mirip JARVIS)", ini adalah update terbaru dari profil Andrej Karpathy di Twitter, JARVIS adalah asisten kecerdasan buatan dari superhero Marvel Iron Man, yang memiliki kemampuan berpikir mandiri dan dapat membantu pemilik Menangani berbagai urusan dan menghitung berbagai informasi.
Pengenalan Karpathy juga berarti senjata awal dari jalur Agen AI telah ditembakkan.
Media asing "The Information" menunjukkan bahwa Sam Altman secara pribadi telah memberi tahu beberapa pengembang pada bulan Mei bahwa OpenAI berharap menjadikan ChatGPT sebagai asisten kerja pribadi, dan seseorang yang mengetahui masalah tersebut menunjukkan bahwa OpenAI telah memperhatikan cara menggunakan chatbots untuk membuat AI otonom **Agen, fungsi terkait kemungkinan akan diterapkan di asisten ChatGPT. **
Secara kebetulan, Meta juga melihat peluang untuk Agen AI.
Kembali pada bulan April, Zuckerberg memberi tahu investor bahwa Meta melihat "peluang untuk memperkenalkan agen AI kepada miliaran orang dengan cara yang berguna dan bermakna," tetapi dia tidak menentukan aplikasi spesifik saat ini.
Dan pada pertemuan dengan karyawan pada bulan Juni, Zuckerberg mengumumkan serangkaian teknologi dalam berbagai tahap pengembangan, salah satunya akan menghadirkan Agen AI dengan kepribadian dan kemampuan berbeda untuk membantu atau menghibur, awalnya terutama untuk Messenger dan WhatsApp.
Di China, AI **Produk terkait agen juga telah lahir satu demi satu. **
Di situs WAIC pada awal Juli, Alibaba Cloud merilis badan cerdas pertamanya, ModelScopeGPT, untuk komunitas pengembang, dan akan meluncurkan serangkaian badan cerdas di masa mendatang untuk menangani berbagai skenario aplikasi. **
**Huawei juga terlibat dalam bidang ini, tetapi lebih berfokus pada AI yang Diwujudkan (Embodied AI), yaitu kombinasi antara model besar dan robot. **
Selain pabrikan besar, AI Agents juga menjadi peluang bagi pengusaha. Salah satu pendiri OpenAI, Karpathy, secara khusus menyebutkan dalam pidatonya sebelumnya: "Orang biasa, pengusaha, dan geek memiliki lebih banyak keuntungan dalam membangun Agen AI daripada perusahaan seperti OpenAI."
Wen Yongteng, kepala jalur aplikasi AI BV Baidu Venture Capital dan wakil presiden investasi, mengatakan bahwa tim BV saat ini juga optimis dengan peluang start-up di bidang Agen AI.
“Ekosistem aplikasi masa depan akan terdiversifikasi, bukan didominasi oleh satu raksasa. Munculnya Agen AI telah membawa peluang untuk perubahan paradigma, dan banyak aplikasi tradisional menghadapi kemungkinan terganggu. Dalam proses ini, startup Ada banyak peluang untuk membuka bidang baru. Untuk setiap tugas tertentu, Agen AI memiliki banyak ruang untuk pengoptimalan, termasuk pembuatan algoritme dan layanan tertentu, data pengguna, dan desain produk. Startup dapat membangun keunggulan diferensiasi."
“Selain itu, ekologi Agen AI saat ini tidak cukup jelas, yang memberikan peluang pengembangan yang menguntungkan bagi para pemula, karena mereka tidak perlu bersaing di bawah aturan yang ditetapkan. Dari perspektif ini, para pemula dan perusahaan besar berdiri di atas garis awal yang sama, start-up lebih fleksibel dan dapat dengan cepat menyesuaikan produk mereka.”
Mengandalkan akumulasi pengetahuan selama bertahun-tahun di bidang kecerdasan buatan, BV Baidu Ventures tidak percaya bahwa perusahaan model akan memonopoli peluang di lapisan aplikasi. Karena untuk perusahaan model yang mendasarinya, pentingnya membangun ekologi jauh lebih besar daripada memonopoli aplikasi.Jika perusahaan model yang mendasari mengadopsi strategi eksklusif untuk mendapatkan keunggulan kompetitif di lapisan aplikasi, hal itu dapat membahayakan ekologi mereka sendiri. Perusahaan model yang mendasari dapat membangun Agen AI yang kuat di satu atau dua area yang mereka fokuskan, tetapi mereka tidak harus bersaing dengan startup di semua area.
**Ekologi yang belum ditentukan, arena yang belum dirumuskan, dan semua orang kembali ke garis awal yang sama. **
Namun tidak dapat dipungkiri bahwa selama ini selain banyak demonstrasi, AI Agents belum muncul sebagai produk nyata.
Dai Yusen, mitra pengelola ZhenFund, membandingkan tingkat kerja sama antara AI dan manusia dengan berbagai tahap mengemudi otonom, dan Agen AI seperti tahap L4 mengemudi otonom. Namun seperti halnya L4, Agen AI mudah untuk dibayangkan dan didemonstrasikan, tetapi sulit untuk diwujudkan.Aplikasi nyata dari Agen AI masih dalam masa depan yang tidak pasti.
Tingkat kerja sama antara AI dan manusia dibandingkan dengan berbagai tahapan mengemudi otonom Sumber gambar: akun instan Dai Yusen @yusen
Dai Yusen menekankan bahwa untuk mewujudkan Agen AI yang dapat digunakan, kemampuan model besar perlu ditingkatkan secara signifikan.Bahkan untuk OpenAI tingkat atas, masih banyak ruang untuk peningkatan dalam hal penundaan dan kinerja.
“Kalau dianalogikan mesin uap, uap hanya bisa dihasilkan saat air dipanaskan sampai 100 derajat. Kalau kecerdasan AI Agents belum mencapai level tertentu, air hanya dipanaskan sampai 50 derajat. Kalaupun banyak energi telah dihabiskan, uap tetap tidak dapat diproduksi. Ini 0."
Senjata awal untuk jalur Agen AI telah dimulai, tetapi ini jelas bukan sprint hanya dalam beberapa bulan, tetapi maraton jarak jauh yang ditakdirkan untuk berlangsung selama beberapa tahun, atau bahkan sepuluh tahun.
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Apakah Agen AI yang dibicarakan para petinggi Silicon Valley benar-benar hot atau tidak?
Pengarang|Li Han Zhu Yue
Sunting|Chestnut
Sumber: Jiazi Guangnian
Setelah sukses besar ChatGPT, OpenAI telah beralih ke tujuan berikutnya - Agen AI (badan cerdas).
"Jika sebuah makalah mengusulkan metode pelatihan yang berbeda, OpenAI akan mencemooh secara internal, berpikir bahwa itu semua ditinggalkan oleh kami. Tetapi ketika makalah Agen AI baru keluar, kami akan membahasnya dengan sangat serius dan bersemangat.** Orang biasa, pengusaha dan geek memiliki keunggulan dibandingkan perusahaan seperti OpenAI dalam hal membangun Agen AI.**” kata Andrej Karpathy, salah satu pendiri OpenAI dan mantan direktur TeslaAI.
Pidato publik Karpathy telah menambahkan banyak panas ke Agen AI. Tapi penilaiannya tidak eksklusif.
Pada awal Maret, AutoGPT menerima 74.000 bintang di GitHub, dan dengan cepat menjadi proyek open source dengan pertumbuhan tercepat dalam sejarah; BabyAGI dan AgentGPT, yang dirilis kemudian, bermunculan seperti jamur: memesan pizza, mengatur kotak surat, membuat blog, dan bahkan Mengadakan Pesta Hari Valentine...
Semakin banyak Agen AI muncul di berbagai adegan kehidupan orang, dan kegemaran menyebar dengan cepat dari Silicon Valley.
Self-executing dan beroperasi secara mandiri, Agen AI diberi ekspektasi tinggi oleh para teknolog, yang menganggapnya sebagai "alat produktivitas yang mengubah masyarakat." Beberapa orang bahkan menganggapnya sebagai "awal era kecerdasan buatan umum (AGI)".
Tapi suara-suara itu tidak bisa menyembunyikan masalah yang ada.
"Model besar adalah prasyarat untuk Agen AI. Hanya dengan fondasi perangkat keras yang cukup baik kita dapat mengembangkan Agen AI," kata Dai Yusen, mitra pengelola ZhenFund, kepada "Jiazi Guangnian".
Sebenarnya, hanya ChatGPT yang memiliki basis model besar yang "berkualitas" di pasar. Dibatasi oleh daya komputasi model, masih terdapat kekurangan lahan untuk pengembangan Agen AI di China.
Masa depan cerah, tetapi kenyataannya kejam. Penelitian dan pengembangan teknologi dan modal ventura semuanya berjalan lancar. Tidak ada yang tahu kapan periode dividen Agen AI benar-benar datang dengan gelombang model besar. Namun yang pasti, perubahan diam-diam telah dimulai.
Agen 1.AI: "asisten digital" yang membantu Anda melakukan berbagai hal
Daripada memperlakukan Agen AI sebagai versi ChatGPT yang ditingkatkan, lebih tepat menganggapnya sebagai "asisten digital" untuk manusia.
Ini tidak hanya memberi tahu Anda "bagaimana melakukannya", tetapi juga "membantu Anda melakukannya". Sebagai media, Agen AI menggantikan manusia dan berinteraksi berulang kali dengan model Bahasa Besar (LLM) seperti GPT. Selama tujuan diberikan, ia dapat mensimulasikan perilaku cerdas, membuat tugas secara mandiri, menentukan kembali prioritas daftar tugas, dan selesaikan tugas Tugas pertama, dan ulangi sampai tujuan tercapai.
Tidak seperti kecerdasan buatan tradisional, AI Agen dapat beroperasi secara mandiri tanpa kendali manusia. **Dengan mengakses API, Agen AI bahkan dapat menelusuri web, menggunakan aplikasi, membaca dan menulis file, membayar dengan kartu kredit, dan banyak lagi.
Sederhananya, Anda hanya perlu memberikan tujuan, dan AI **Agen dapat melakukan sisanya. Misalnya, agen AI yang dikembangkan oleh HyperWrite dapat memesan pizza secara otomatis untuk Anda melalui program kontrol browser Chrome. **
Imajinasi semacam ini tidak sulit untuk dimasukkan ke dalam film fiksi ilmiah, tetapi dalam proses eksplorasi kecerdasan buatan, telah berlangsung selama hampir setengah abad.
Pada awal 1980-an, ilmuwan komputer mulai mengeksplorasi cara mengembangkan perangkat lunak cerdas yang dapat berinteraksi seperti manusia. Namun, karena keterbatasan data dan daya komputasi, Agen AI tidak memiliki kondisi realistis yang diperlukan.
Joon Park, seorang Ph.D. dalam ilmu komputer di Universitas Stanford, pernah berkata dalam sebuah wawancara: "Kami telah bekerja ke arah itu, tetapi semua metode dalam beberapa dekade terakhir bahkan belum mendekati apa yang kami capai sekarang. dengan LLM... Itu sebabnya kami melupakan visi itu. Tapi ketika LLM datang, kami menyadari bahwa ada peluang.”
Model bahasa besar adalah otak inti Agen AI. Dengan membongkar tugas yang kompleks, kebutuhan pengguna yang kompleks dapat dibongkar menjadi metode tugas yang dapat dicapai.
Di satu sisi, pelatihan model besar dibangun berdasarkan Internet dan berisi sejumlah besar data perilaku manusia, yang merupakan elemen kunci untuk membangun Agen AI yang kredibel.
Di sisi lain, dengan kapasitas pengetahuan yang cukup besar, model besar muncul dengan kemampuan pembelajaran konteks dan kemampuan penalaran yang sangat baik. Dengan membangun rantai pemikiran untuk mewujudkan model pemikiran dan pengambilan keputusan yang berkelanjutan, Agen AI dapat menganalisis masalah yang kompleks dan membongkarnya menjadi sub-tugas yang sederhana dan terperinci.
Pada saat yang sama, penggunaan bahasa LLM sebagai media juga telah mengubah bentuk interaksi front-end. Wen Yongteng, kepala jalur aplikasi AI BV Baidu Ventures dan wakil presiden investasi, mengatakan kepada "Jiazi Guangnian": "BV Baidu Ventures mulai memperhatikan pengembangan Agen AI sejak dini. Melalui penelitian dan penilaian, kami percaya bahwa antarmuka pengguna grafis asli (GUI) Dimungkinkan untuk berubah menjadi antarmuka pengguna bahasa (LanguageUI), dan aplikasi front-end Agen AI akan ada dalam semua bentuk front-end yang dapat berinteraksi dengan manusia."
Itu hanya tugas membongkar, dan itu jauh dari pintar. AI didorong oleh LLM Agen tidak dapat bekerja tanpa tiga komponen utama:
Dengan kerjasama ketiga komponen tersebut, AI Agent tidak hanya dapat berpikir seperti manusia, tetapi juga bertindak seperti manusia.
Sama seperti manusia, saat melakukan tugas yang rumit, sering kali ada proses penalaran di antara setiap langkah. Agen AI juga akan menggunakan komponen ReAct (perpustakaan Java untuk membangun antarmuka pengguna) untuk menggabungkan secara dekat kemampuan penalaran model besar dengan keputusan perilaku, sehingga model bahasa dapat direncanakan dan diatur secara logis berdasarkan pengetahuan.
Framework Reflexition memberi Agen AI memori dinamis dan kemampuan refleksi diri. Memperkuat Agen Bahasa melalui umpan balik bahasa daripada memperbarui bobot memungkinkannya memperbaiki keputusan tindakan di masa lalu dan memperbaiki kesalahan di masa lalu untuk terus meningkatkan kinerjanya.
Dalam proses perolehan, penyimpanan, retensi, dan pengambilan informasi, Agen AI juga mencoba meniru komposisi memori manusia dan membangun sistem memori yang efisien.
Mensimulasikan cara memori manusia, Agen AI akan mengekspresikan memori sensorik, memori jangka pendek, dan memori jangka panjang sebagai pembelajaran yang melekat pada input asli (seperti teks, gambar, dll.), pembelajaran konteks, dan penyimpanan vektor eksternal . Tugas dan hasil disimpan dalam modul memori, dan ketika informasi dipanggil kembali, informasi yang disimpan dalam memori dikembalikan ke dialog dengan pengguna, sehingga menciptakan konteks yang lebih erat.
Salah satu sifat manusia yang paling khas adalah penggunaan dan penciptaan alat. Dengan dilengkapi alat eksternal dan menggunakan API untuk memanggil berbagai antarmuka, Agen AI dapat mensimulasikan penggunaan alat oleh manusia untuk menyelesaikan tugas yang lebih kompleks.
Meskipun tingkat teknisnya belum sepenuhnya matang, masalah seperti pengelolaan data dan memori jangka panjang masih dapat diselesaikan. Namun, kemampuan Agen AI untuk mengeksekusi secara mandiri, mengoptimalkan secara iteratif, dan "tangan bebas" juga membuatnya menjadi populer.
2. Menggantikan LLM, Agen AI menjadi hotspot AI berikutnya
Kelahiran ChatGPT telah menyadari fungsi AI yang melakukan banyak percakapan dengan manusia dan memberikan informasi dan saran. Pengenalan Copilot telah memungkinkan AI melakukan kemampuan menyelesaikan draf pertama pekerjaan untuk manusia, seperti Github Copilot, Microsoft 365 Copilot, dan Midjourney, yang telah menjadi "smart copilot" orang-orang di bidang pemrograman, pekerjaan kantor, dan pembuatan gambar.
Beri tahu AI untuk melakukan tugas, dan itu akan melakukan tugas—menulis salinan, menjawab pertanyaan, atau membuat foto yang sulit dilihat oleh mata manusia asli atau palsu. Pada saat yang sama, orang seringkali perlu memberikan petunjuk yang spesifik dan jelas untuk setiap langkah AI.
AI saat ini seperti anak magang yang baru datang, belum punya pengalaman, dan perlu diajar secara manual. Namun, bagaimana jika Anda menginginkan karyawan yang baik yang mematuhi perintah, menyelesaikan sendiri kesulitan dalam eksekusi, dan berusaha untuk tidak menimbulkan masalah bagi orang lain?
Pada bulan Maret dan April, Camel, AutoGPT, BabyAGI, Westworld Township, dan Agen AI lainnya meledak bersamaan, yang sepertinya membuat orang melihat kemungkinan seperti itu.
Sejak AutoGPT sumber terbuka Significant Gravitas pada bulan Maret, dalam waktu dua bulan setelah dirilis, AutoGPT telah menerima 130.000 bintang di GitHub, menjadikannya proyek sumber terbuka dengan pertumbuhan tercepat dalam sejarah.
Sumber gambar: Makalah "Agen Generatif: Simulakra Interaktif Perilaku Manusia"
Andrej Karpathy pernah berkata di Twitter: "Perbatasan selanjutnya dari rekayasa cepat (teknik) adalah AutoGPT". Hingga saat ini, AutoGPT telah memperoleh lebih dari 140.000 bintang di platform hosting kode Github, peringkat ke-25 dalam sejarah.
Salah satu pendiri dan CEO OpenAI Sam Altman telah beberapa kali menyatakan bahwa era membangun model AI yang besar telah berakhir, dan tantangannya adalah tubuh yang cerdas.
Dalam sebuah artikel yang memperkenalkan agen otonom, penulis, Matt Schlicht, salah satu pendiri dan CEO Octane AI (penyedia platform pemasaran data), mengumpulkan pandangan dan pendapat lebih dari seratus orang dari kalangan industri, akademisi, dan investasi. Pakar dari perusahaan besar seperti Meta, Nvidia, Stability AI atau AI start-up, serta anggota fakultas Stanford CS dan investor AI termasuk Hugging Face, sebagian besar dari mereka mengungkapkan ekspektasi dan prospek mereka terhadap potensi Agen AI, bahkan disebut "AGI mentah".
Mengambil alih dari model besar, Agen AI tampaknya menjadi hal besar berikutnya dalam AI.
Tetapi pada saat yang sama, suara oposisi tidak ada habisnya.
Pemenang Penghargaan Turing Yoshua Bengio menyebutkan dalam posting blognya "How AI that Harms Humans Appears" yang diterbitkan pada Mei tahun ini bahwa manusia dapat mengontrol tugas dan tujuan umum Agen AI, tetapi itu tidak berarti bahwa manusia dapat mengontrol Agen AI berdasarkan Untuk subtugas dan subtujuan yang diuraikan oleh kecerdasannya sendiri, kecuali penelitian tentang penyelarasan AI membuat terobosan, manusia tidak akan memiliki jaminan keamanan yang kuat.
Kemunculan kolektif agen cerdas, pengejaran dan keraguan bos besar, gelombang Agen AI cepat dan panas.
Namun, Agen AI bukanlah istilah baru dalam lingkaran kecerdasan buatan.
Pada tahun 2014, Go AI AlphaGo yang diluncurkan oleh DeepMind sebenarnya adalah sejenis Agen AI. Mirip dengan ini adalah OpenAI Five yang diluncurkan oleh OpenAI pada 2017 untuk memainkan "Dota2", dan pada 2019 DeepMind mengumumkan AlphaStar untuk memainkan "StarCraft 2".
Tren industri saat itu adalah melatih dan meningkatkan Agen AI melalui pembelajaran penguatan, yang terutama digunakan dalam skenario game, terutama dalam beberapa game konfrontatif dengan pemenang dan pecundang yang jelas. Tapi itu pertanyaan terbuka jika seseorang ingin mencapai keumuman di dunia nyata.
Dalam beberapa tahun ke depan, OpenAI beralih ke model bahasa skala besar, dan seri GPT diluncurkan satu demi satu. Model skala besar menjadi jalur untuk berbagai produsen teknologi. Ini juga merupakan pengembangan model skala besar yang memungkinkan Agen AI menerobos kemacetan dan mengembangkan kembali peluang.
Dibandingkan dengan terbatas pada skenario game beberapa tahun yang lalu, apa yang bisa dicapai Agen AI berdasarkan model besar? Wen Yongteng, kepala jalur aplikasi AI BV Baidu Ventures dan wakil presiden investasi, berkata kepada "Jiazi Guangnian": "Apa yang kami lihat bukan hanya kemajuan teknologi yang telah sangat meningkatkan kemampuan AI untuk memahami maksud pengguna, mengumpulkan informasi, dan melakukan tugas. Lebih penting lagi, Agen AI sepenuhnya mampu merekonstruksi ekosistem aplikasi masa depan."
Tak lama setelah peluncuran AutoGPT, banyak netizen yang menggunakan AutoGPT untuk membuat asisten pribadi otomatis. Misalnya, Udit Goenka, pendiri dan CEO FirstSales.io, memposting bahwa dia menggunakan AutoGPT untuk membuat mesin calon pelanggan yang dapat mencari perusahaan yang menerima investasi awal tahun lalu dan menjelaskan detail pembuatan daftar.
Yew Jin Lim, seorang insinyur perangkat lunak di Google, mengatakan dia menggunakan AutoGPT untuk membuat asisten email yang mengirimkan detail tugas ke Agen AI melalui email.
Dai Yusen, mitra pengelola ZhenFund, mengatakan kepada "Jiazi Guangnian": "Agen adalah arah yang benar-benar dapat meningkatkan produktivitas, karena jika orang masih melakukan sesuatu, orang selalu terbatas."
"Agen AI akan menjadi alat produktivitas dalam kehidupan dan pekerjaan sehari-hari." Matt Schlicht menulis, "Dari mengelola akun media sosial, berinvestasi di pasar, hingga menerbitkan buku anak-anak terbaik, Agen AI akan ada di setiap industri dan setiap industri. tugas yang bisa dibayangkan." Misalnya, aomni adalah agen AI yang dapat mencari informasi tentang topik apa pun di Internet, dan akan menyelesaikan tujuan pengguna satu per satu dengan membuat daftar.
Selain kebutuhan produktivitas, AI Agent Pi pribadi Inflection AI memberikan kemungkinan arah aplikasi lainnya.
Berbeda dari pemosisian ChatGPT dan kecerdasan buatan umum Claude, Pi berfokus pada EQ tinggi, persahabatan emosional, dan memberikan nilai emosional. Pi juga akan mengingat percakapan historis dengan pengguna. Selain berpartisipasi dan membantu pekerjaan dan kehidupan orang lain, Pi juga akan mempelajari cara menghubungi teman dan keluarga untuk menjalin hubungan dengan pengguna. Saat ini, Infleksi AI telah menerima investasi lebih dari 1,5 miliar dolar AS, melampaui Antropik dan nomor dua setelah OpenAI.
**3. Apakah Agen AI akan menjadi tren selanjutnya? **
"Membangun semacam JARVIS (bangunan mirip JARVIS)", ini adalah update terbaru dari profil Andrej Karpathy di Twitter, JARVIS adalah asisten kecerdasan buatan dari superhero Marvel Iron Man, yang memiliki kemampuan berpikir mandiri dan dapat membantu pemilik Menangani berbagai urusan dan menghitung berbagai informasi.
Pengenalan Karpathy juga berarti senjata awal dari jalur Agen AI telah ditembakkan.
Media asing "The Information" menunjukkan bahwa Sam Altman secara pribadi telah memberi tahu beberapa pengembang pada bulan Mei bahwa OpenAI berharap menjadikan ChatGPT sebagai asisten kerja pribadi, dan seseorang yang mengetahui masalah tersebut menunjukkan bahwa OpenAI telah memperhatikan cara menggunakan chatbots untuk membuat AI otonom **Agen, fungsi terkait kemungkinan akan diterapkan di asisten ChatGPT. **
Secara kebetulan, Meta juga melihat peluang untuk Agen AI.
Kembali pada bulan April, Zuckerberg memberi tahu investor bahwa Meta melihat "peluang untuk memperkenalkan agen AI kepada miliaran orang dengan cara yang berguna dan bermakna," tetapi dia tidak menentukan aplikasi spesifik saat ini.
Dan pada pertemuan dengan karyawan pada bulan Juni, Zuckerberg mengumumkan serangkaian teknologi dalam berbagai tahap pengembangan, salah satunya akan menghadirkan Agen AI dengan kepribadian dan kemampuan berbeda untuk membantu atau menghibur, awalnya terutama untuk Messenger dan WhatsApp.
Di China, AI **Produk terkait agen juga telah lahir satu demi satu. **
Di situs WAIC pada awal Juli, Alibaba Cloud merilis badan cerdas pertamanya, ModelScopeGPT, untuk komunitas pengembang, dan akan meluncurkan serangkaian badan cerdas di masa mendatang untuk menangani berbagai skenario aplikasi. **
**Huawei juga terlibat dalam bidang ini, tetapi lebih berfokus pada AI yang Diwujudkan (Embodied AI), yaitu kombinasi antara model besar dan robot. **
Selain pabrikan besar, AI Agents juga menjadi peluang bagi pengusaha. Salah satu pendiri OpenAI, Karpathy, secara khusus menyebutkan dalam pidatonya sebelumnya: "Orang biasa, pengusaha, dan geek memiliki lebih banyak keuntungan dalam membangun Agen AI daripada perusahaan seperti OpenAI."
Wen Yongteng, kepala jalur aplikasi AI BV Baidu Venture Capital dan wakil presiden investasi, mengatakan bahwa tim BV saat ini juga optimis dengan peluang start-up di bidang Agen AI.
“Ekosistem aplikasi masa depan akan terdiversifikasi, bukan didominasi oleh satu raksasa. Munculnya Agen AI telah membawa peluang untuk perubahan paradigma, dan banyak aplikasi tradisional menghadapi kemungkinan terganggu. Dalam proses ini, startup Ada banyak peluang untuk membuka bidang baru. Untuk setiap tugas tertentu, Agen AI memiliki banyak ruang untuk pengoptimalan, termasuk pembuatan algoritme dan layanan tertentu, data pengguna, dan desain produk. Startup dapat membangun keunggulan diferensiasi."
“Selain itu, ekologi Agen AI saat ini tidak cukup jelas, yang memberikan peluang pengembangan yang menguntungkan bagi para pemula, karena mereka tidak perlu bersaing di bawah aturan yang ditetapkan. Dari perspektif ini, para pemula dan perusahaan besar berdiri di atas garis awal yang sama, start-up lebih fleksibel dan dapat dengan cepat menyesuaikan produk mereka.”
Mengandalkan akumulasi pengetahuan selama bertahun-tahun di bidang kecerdasan buatan, BV Baidu Ventures tidak percaya bahwa perusahaan model akan memonopoli peluang di lapisan aplikasi. Karena untuk perusahaan model yang mendasarinya, pentingnya membangun ekologi jauh lebih besar daripada memonopoli aplikasi.Jika perusahaan model yang mendasari mengadopsi strategi eksklusif untuk mendapatkan keunggulan kompetitif di lapisan aplikasi, hal itu dapat membahayakan ekologi mereka sendiri. Perusahaan model yang mendasari dapat membangun Agen AI yang kuat di satu atau dua area yang mereka fokuskan, tetapi mereka tidak harus bersaing dengan startup di semua area.
**Ekologi yang belum ditentukan, arena yang belum dirumuskan, dan semua orang kembali ke garis awal yang sama. **
Namun tidak dapat dipungkiri bahwa selama ini selain banyak demonstrasi, AI Agents belum muncul sebagai produk nyata.
Dai Yusen, mitra pengelola ZhenFund, membandingkan tingkat kerja sama antara AI dan manusia dengan berbagai tahap mengemudi otonom, dan Agen AI seperti tahap L4 mengemudi otonom. Namun seperti halnya L4, Agen AI mudah untuk dibayangkan dan didemonstrasikan, tetapi sulit untuk diwujudkan.Aplikasi nyata dari Agen AI masih dalam masa depan yang tidak pasti.
Dai Yusen menekankan bahwa untuk mewujudkan Agen AI yang dapat digunakan, kemampuan model besar perlu ditingkatkan secara signifikan.Bahkan untuk OpenAI tingkat atas, masih banyak ruang untuk peningkatan dalam hal penundaan dan kinerja.
“Kalau dianalogikan mesin uap, uap hanya bisa dihasilkan saat air dipanaskan sampai 100 derajat. Kalau kecerdasan AI Agents belum mencapai level tertentu, air hanya dipanaskan sampai 50 derajat. Kalaupun banyak energi telah dihabiskan, uap tetap tidak dapat diproduksi. Ini 0."
Senjata awal untuk jalur Agen AI telah dimulai, tetapi ini jelas bukan sprint hanya dalam beberapa bulan, tetapi maraton jarak jauh yang ditakdirkan untuk berlangsung selama beberapa tahun, atau bahkan sepuluh tahun.