10 perwakilan AI-Agen, bagaimana mengubah Internet / membentuk kembali Web3

2023-08-03 03:04:30

SUMBER: VION WILLIAMS

Jelajahi kemungkinan inovatif dari AI-Agents

Konsensus dan non-konsensus AI-Agen

Alasan mengapa AI-Agen telah menjadi arah yang semakin menarik perhatian sebagian besar disebabkan oleh fakta bahwa LLM menyediakan rute implementasi teknis yang layak untuk penerapan AI-Agen, dan kedua, ada banyak proyek terkait AI-Agen .mengunci.

Meskipun LiLian Weng menjelaskan apa itu AI-Agen yang digerakkan oleh LLM dalam artikelnya? Namun Deepmind juga mencoba mendefinisikan konsep agen terpadu, saya percaya bahwa konsep AI-Agen juga akan membentuk berbagai jenis diferensiasi dengan pemahaman perusahaan AI yang berbeda.

Konsensus utama yang lebih jelas adalah bahwa berdasarkan Agen yang digerakkan oleh LLM untuk mewujudkan pemrosesan otomatis masalah umum, Agen AI-lah yang telah kami identifikasi dalam siklus ledakan model bahasa berskala besar ini dan telah membentuk pemahaman bersama.

Temukan kemungkinan dari korelasi Agen

Pada level aplikasi AI-Agents, pada tahap saat ini, kita harus melihat AI-Agents dari perspektif "relevansi" sebanyak mungkin, yaitu kita harus toleran terhadap trial and error dan inovatif dalam bentuk yang memungkinkan. AI-Agents Kemungkinan **, Anda tidak harus mencari jawaban standar dalam posisi sempit seperti beberapa kritik, ini tidak disarankan.

Misalnya, Auto-GTP, sebagai kemungkinan, sebenarnya telah menginspirasi banyak proyek Agen, tetapi kritik sempit akan kehilangan peluang untuk menangkap peluang baru, yang merupakan fenomena umum di antara pengembang China. Sebagai pengembang tanpa kreativitas, bagaimana Anda mengandalkan daya saing tradisional Anda di era pemrograman bahasa alami?

Meskipun ada banyak perkenalan tentang proyek-proyek yang berhubungan dengan AI-Agents, saya pikir ada masalah daftar dan pengenalan yang homogen. Konten ini memberi tahu kami proyek mana yang menjadi arahan AI-Agents, tetapi tidak ada yang terkait Mulai dari alam, itu menunjukkan potensi AI-Agents di bidang aplikasi yang berbeda, dan posisi ekologis dari beberapa jenis proyek AI-Agents.

Sebagai contoh, dalam pengenalan saya, Auto-GPT, BabayaGI dan MetaGPT akan saya klasifikasikan menjadi satu jenis ekologi oleh saya, karena memiliki kesinambungan jalur tertentu;

Membangun kognisi holistik dalam teka-teki Agen

Secara keseluruhan, dalam pengenalan proyek perwakilan tentang AI-Agen, Saya menggunakan perspektif "relevansi", "posisi ekologis", dan "kontinuitas" untuk memperkenalkan proyek perwakilan, sehingga kita dapat samar-samar Melihat perkembangan masa depan tren AI-Agen.

10 proyek terkait perwakilan berikut muncul, termasuk beberapa proyek referensi terkait. Saya akan menggunakan kasus ini sebagai teka-teki untuk mengumpulkan peta yang relatif lengkap, yang cukup untuk membuat lebih banyak orang menyadari dengan jelas bagaimana potensi Agen dapat mengubah segalanya di Internet Termasuk membentuk kembali lanskap Web3.

Dua arah utama masa depan AI-Agents

AI-Agen secara kasar dapat dibagi menjadi dua arah: **Agen Otonom dan Agen Generatif. **

Autonomous Agents menggunakan Auto-GPT sebagai contoh, yang merepresentasikan kemampuan untuk melakukan berbagai tugas secara otomatis untuk mencapai hasil target melalui deskripsi persyaratan bahasa alami.Dalam hubungan kolaboratif ini, Autonomous Agents melayani orang dan memiliki atribut alat yang jelas;

Agen Generatif mengambil kota virtual 25 agen cerdas yang diterbitkan oleh Stanford sebagai contoh Agen Generatif, sebagai AI-Agen dengan karakteristik seperti kepribadian, kemampuan pengambilan keputusan otonom, dan memori jangka panjang, lebih condong ke konsep "keaslian". Dalam hubungan kolaboratif ini, Agen memiliki hubungan sosial asli secara digital, bukan hanya alat untuk melayani orang;

GPT Otomatis

Salah satu proyek sumber terbuka paling terkenal dari Auto-GPT, pengenalannya di GitHub sangat sederhana "Upaya sumber terbuka eksperimental untuk membuat GPT-4 sepenuhnya otonom.", upaya sumber terbuka eksperimental untuk membuat GPT-4 sepenuhnya otonom.

Ringkasan singkatnya adalah bahwa Auto-GTP dapat sepenuhnya mengotomatiskan hasil tugas akhir melalui persyaratan tugas satu kalimat; logika inti kemampuan Auto-GPT untuk menyelesaikan tugas secara mandiri terletak pada kemampuan perencanaan tugas model bahasa, melalui tugas Membawa keluar langkah demi langkah pembongkaran dan analisis, dan secara otomatis meningkatkan langkah-langkah pelaksanaan tugas Dalam prosesnya, hasil pencarian di Internet akan diumpankan kembali ke model bahasa, dan tugas tersebut akan dibongkar dan dieksekusi lebih lanjut.

Untuk menggunakan bahasa daerah populer sebagai metafora, **Auto-GPT menyelesaikan tugas dalam proses "menanyakan diri dan menjawab sendiri", tanpa perlu manusia memberikan kata-kata cepat. **

Meskipun banyak orang mengkritik Auto-GPT karena konsumsi tokennya yang besar dan tidak ada hasil yang stabil, Auto-GTP, sebagai kasus otomasi berbasis LLM, sangat membangkitkan rasa ingin tahu para pengembang. Auto-GPT serupa juga BabayaAGI, MetaGPT, dll. di garis depan dalam bereksperimen dengan proyek sumber terbuka untuk menjelajahi otomatisasi.

alamat proyek:

**BabyAGI dapat secara otomatis membuat, menyortir, dan menjalankan tugas baru berdasarkan hasil tugas sebelumnya dan tujuan yang telah ditetapkan. ** Ini menggunakan teknologi pemrosesan bahasa alami untuk membuat tugas baru berdasarkan tujuan, dan menyimpan hasil tugas dalam database sehingga informasi yang relevan dapat ditemukan saat dibutuhkan.

BabyAGI sebenarnya adalah skrip Python yang menjalankan loop tak terbatas untuk menyelesaikan langkah-langkah berikut:

Dapatkan tugas pertama dari daftar tugas.
Kirim tugas ke agen eksekusi, dan agen eksekusi menggunakan API OpenAI untuk menyelesaikan tugas sesuai dengan konteksnya.
Perkaya hasilnya dan simpan di Chroma/Weaviate.
Buat tugas baru dan susun ulang daftar tugas berdasarkan tujuan yang telah ditetapkan dan hasil tugas sebelumnya.

alamat proyek:

Baik Auto-GPT dan BabyAGI secara teoretis mewakili periode awal wabah LLM kami saat ini Eksplorasi kami terhadap AGI berdasarkan LLM dan prosesor penyelesaian tugas tujuan umum yang digerakkan oleh LLM, menurut saya, adalah cawan suci di bidang AI- Agen di masa depan.

Agen Generatif

Makalah "Generative Agents: Interactive Simulacra of Human Behavior" yang diterbitkan oleh peneliti Stanford dan Google sudah menjadi proyek AI-Agent yang sangat terkenal. Secara keseluruhan, penelitian ini menempatkan 25 agen AI dalam virtual kecil bergaya piksel di kota , agen cerdas dapat mewujudkan interaksi simulasi perilaku kehidupan manusia, dan juga dapat berinteraksi dengan lingkungan kota virtual, dan juga dapat berinteraksi dengan manusia di luar dunia virtual. **

Ada dua kunci solusi dalam tulisan ini yang paling layak menjadi perhatian kita:

1, Arsitektur Agen Generatif

Agen merasakan lingkungan mereka dan menyimpan semua persepsi dalam catatan komprehensif yang disebut aliran memori, merekam pengalaman agen. Berdasarkan persepsi mereka, arsitektur mengambil ingatan yang relevan dan kemudian menggunakan perilaku yang diambil ini untuk menentukan suatu tindakan. Kenangan yang diambil ini juga digunakan untuk membentuk rencana jangka panjang dan membuat refleksi tingkat tinggi, yang keduanya dimasukkan ke aliran memori untuk digunakan di masa mendatang.

2, aliran memori

Berdasarkan arsitektur agen generatif dan lingkungan interaktif tempat eksperimen berada, agen pasti akan menghasilkan data memori dalam jumlah besar.Memory Stream adalah database yang secara komprehensif merekam semua memori agen generatif. Ini adalah daftar yang berisi banyak objek memori, setiap objek berisi deskripsi bahasa alami, stempel waktu pembuatan, dan stempel waktu akses terakhir. Elemen paling dasar dari aliran memori adalah observasi, yaitu peristiwa yang dirasakan langsung oleh agen. Pengamatan umum termasuk tindakan yang dilakukan oleh agen itu sendiri, atau tindakan yang menurut agen dilakukan oleh agen lain atau objek non-agen.

Berdasarkan dua komponen kunci di atas, sebenarnya perilaku keseluruhan agen generatif dibagi menjadi tiga bagian: [memori dan pengambilan] [refleksi] [perencanaan dan respons]. Untuk detailnya, silakan merujuk ke konten makalah asli .

Makalah ini dan eksperimen ini memverifikasi bahwa perilaku interaktif yang dihasilkan oleh agen yang dibentuk berdasarkan LLM dapat dipercaya untuk mensimulasikan perilaku interaksi manusia dalam lingkungan digital Agen generatif dapat berperan dalam banyak lingkungan digital, terutama yang dihasilkan. hubungan interaksi manusia-komputer yang terbentuk antara agen manusia dan manusia.

Apa yang paling dapat kita rasakan secara intuitif adalah bahwa agen generatif diciptakan sebagai peran penghuni digital asli metaverse, dan menghasilkan berbagai interaksi dengan lingkungan metaverse manusia. Faktanya, Kita dapat mensimulasikan dunia virtual digital Agen-AI yang sangat berkembang, dan manusia dapat mengekstraksi hasil kerja digital Agen-AI dari dunia ini;

Cara Agen Menjadi Mitra Kerja

Karena Agen diterjemahkan sebagai "agen" dalam banyak konteks saat ini, agen mudah dikaitkan dengan konsep peran perantara, sehingga sulit bagi banyak orang untuk secara intuitif membangun asosiasi penerapan adegan Agen; dalam tiga kasus ini, masing-masing Ini menunjukkan bagaimana Agen bisa menjadi "manusia ahli" yang bisa disewa, perusahaan pemasaran otomatis yang tidak membutuhkan partisipasi manusia sama sekali, dan bagaimana Agen membentuk tim untuk saling berkolaborasi.

Pada contoh di bawah, kita dapat menggunakan NexusGPT untuk membuat beberapa staf ahli, dan menggunakan GPTeam untuk membentuk mereka menjadi tim yang disewa oleh manusia, dan tim AI ini bekerja di perusahaan yang sepenuhnya otomatis seperti AutoCorp. Saat kita menyatukan potongan-potongan teka-teki ini, secara intuitif kita dapat merasakan bahwa masa depan telah tiba;

NexusGPT

Ini adalah apa yang disebut platform lepas AI pertama di dunia yang dibuat oleh Assem pengembang independen. NexusGPT didasarkan pada kerangka kerja LangChainAI, menggunakan API GPT-3.5 dan Chroma (database tertanam sumber terbuka asli AI), pada platform NexuseGPT Dengan lebih dari delapan ratus agen AI dengan keterampilan khusus.

Agen di NexusGPT dapat dengan cerdas menyesuaikan tingkat kesulitan pertanyaan:

- Level 1: Dialog sederhana
- Level 2: operasi/plugin prapelatihan
- Level 3: Mode AutoGPT

Tapi ini semua bergantung pada dukungan panggilan fungsi dari OpenAI dan LangchainAI;

Sementara selama eksekusi tugas agen, penulis mempertimbangkan kecepatan di mana sistem menyatu ke peringkat tinggi melalui umpan balik manusia dan pengamatan peringkat dalam satu putaran. Faktanya, ini untuk memberi agen AI keterampilan khusus untuk mencapai strategi peningkatan yang dioptimalkan secara iteratif dalam berkomunikasi dengan pihak manusia A pada persyaratan tugas.

NexusGPT mewakili model bisnis masa depan bagi manusia untuk menyewa Agen. Proyek ini sebenarnya memiliki banyak ruang untuk perbaikan, seperti kombinasi Agen dan modul pakar (sistem pakar dan model pakar). Metode penetapan harga Pihak A untuk merekrut Agen adalah berdasarkan Perhitungan Token konsumsi, dll., ini akan mengubah cara tradisional kami dalam mempekerjakan pasar tenaga kerja, dan juga akan mengubah cara kolaborasi DAO;

Korporasi Mobil

Dibuat dalam 5 jam oleh AutoCorpmina fahmi dan tim mereka selama New York GPT/LLM Hackathon. AutoCorp adalah perusahaan pemasaran merek yang sepenuhnya independen. AutoCorp akan secara otomatis membuat iklan merek dan desain produk untuk perusahaan yang menjual T-shirt secara langsung. Saat pelanggan meningkatkan permintaan konsumen baru, AutoCorp akan memperbarui temanya dan menghasilkan aset desain baru. Diri berkelanjutan -iterasi menuju arah bisnis yang lebih baik.

Pertama, AutoCorp mengembangkan ide awal untuk merek t-shirt berdasarkan ide awal. Itu kemudian menggunakan ide awal ini untuk menghasilkan berbagai aset perusahaan dan panduan gaya default. Saat pelanggan membutuhkan, AutoCorp akan memperbarui rencananya sesuai dengan kebutuhan tersebut. Jika suatu rencana menghasilkan lebih sedikit penjualan, AutoCorp membuat penyesuaian. Proses di atas telah dijalankan dari awal hingga akhir dan benar-benar dapat dihubungkan ke API periklanan dan API kaos khusus untuk diterapkan di dunia nyata.

Paragraf ini dikutip dari twitter Mina fahmi, dan AutoCorp juga dibuat oleh mina fahmi dan timnya selama hackathon GPT/LLM di New York dalam 5 jam, dan tujuan mereka menciptakan AutoCorp juga untuk mendorong konsep "Otonomi" ke yang ekstrim.

Faktanya, tujuan AutoCorp dan DAO sangat konsisten.**Jika tujuan akhir dari organisasi terdesentralisasi adalah menghilangkan faktor "manusia", maka mengotomatiskan operasi produksi secara penuh sebenarnya merupakan daya tarik pengembangan yang masuk akal dari konsep DAO. **AutoCorp sebenarnya mewakili arah pengembangan bisnis DAO di masa depan.

Tim GP

GPTeam adalah sistem simulasi multi-agen open source. GPTeam memanfaatkan GPT-4 untuk membuat banyak agen yang bekerja sama untuk mencapai tujuan yang telah ditentukan. Tujuan utama dari proyek ini adalah untuk mengeksplorasi potensi model GPT dalam meningkatkan produktivitas multi-agen dan komunikasi yang efektif.

GPTeam mempekerjakan agen independen, masing-masing dilengkapi dengan memori, dan berinteraksi melalui komunikasi. Implementasi memori dan refleksi untuk agen terinspirasi oleh makalah penelitian ini. Agen bergerak di seluruh dunia dan melakukan tugas di lokasi berbeda berdasarkan tugas mereka sendiri dan lokasi agen lain. Mereka dapat berkomunikasi satu sama lain dan berkolaborasi dalam tugas sambil bekerja secara paralel menuju tujuan bersama.

alamat proyek:

Nyatanya, masih banyak proyek open source seperti GPTeam, seperti Dev-GPT, tim pengembangan otomatis yang membuat layanan mikro khusus untuk pengguna. Tim terdiri dari tiga peran virtual: manajer produk, pengembang, dan operasi dan pemeliharaan pengembangan. Gagasan teknis Dev-GPT terutama untuk mengidentifikasi dan menguji strategi tugas yang efektif. Jika gagal 10 kali berturut-turut, ia akan beralih ke metode selanjutnya.

Kita akan melihat semakin banyak proyek, merancang AI-Agen sebagai semacam tim AI, tidak sulit untuk mendefinisikan Agen sebagai peran produksi, seperti kasus NexusGPT, pengembang dapat mengatur setiap Agen Itu menantang untuk menjadi Agen dengan keterampilan eksklusif, dan kemudian bagaimana bekerja sama dengan Agen ini untuk mengerahkan keterampilan mereka masing-masing, dan untuk melakukan otomatisasi tugas/proyek dalam kombinasi, yang menantang.Agen Project Atlas mengeksplorasi otomatisasi berbasis bahasa alami, sebenarnya menyediakan skenario aplikasi yang bagus untuk tim Agen;

Semua ini membuat saya harus memikirkan DAO, organisasi kolaborasi tugas otomatis berdasarkan logika tata kelola otomatis;

Cara Agen mengganti pekerjaan berulang

Sebelum AI benar-benar menggantikan pekerjaan kami, Agen menggantikan sebagian besar pekerjaan berulang kami saat ini adalah arah pengembangan Agen selanjutnya di bidang bisnis Sebelum munculnya Agen berbasis LLM, RPA (Robot Process Automation) adalah solusi Pencarian pertama di industri, tetapi RPA tradisional memiliki ambang batas yang tinggi dan tidak dapat dipopulerkan kepada publik RPA adalah obat untuk kurangnya otomatisasi logika interaksi TI tradisional, dan Agen saat ini dapat berkomunikasi dengan bahasa alami untuk mewujudkan fungsi kebutuhan RPA.

Dua proyek berikut menunjukkan kepada kita bagaimana Agen berbasis LLM akan membantu kita membebaskan diri dari pekerjaan berulang dalam pekerjaan sehari-hari dan penelitian akademis. (Padahal, potensi kedua proyek ini lebih dari itu)

Lapisan Curang

"Otomatiskan bisnis Anda Menggunakan Bahasa Alami", menggunakan bahasa alami untuk mengotomatiskan bisnis Anda, ini adalah slogan merek Cheat Layere. Lapisan cheat memecahkan masalah otomatisasi bisnis yang mustahil melalui model pembelajaran mesin GPT-4 yang dilatih khusus, berfungsi sebagai insinyur perangkat lunak AI untuk setiap pengguna.

Cheat Layer telah merilis dua produk di Producthunt, satu adalah Cheat Layer dan yang lainnya adalah Project Atlas Agents.Project Atlas Agents adalah antarmuka manajemen untuk proyek tanpa kode yang dapat digunakan untuk membangun dan mengulang Agen AI.

Cheat Layer mengotomatiskan pengoperasian seluruh halaman web melalui mode plug-in Google Chrome dan menggunakan bahasa alami.Misalnya, sebagian besar operasi rutin kami di halaman web sebenarnya dapat dioperasikan secara otomatis. Cheat Layer dengan mudah mengingatkan pada RPA, yaitu otomatisasi proses robotik. Hubungan antara Agen dan RPA sudah banyak diperbincangkan, sudah menjadi fakta yang tidak terbantahkan bahwa RPA tradisional telah ditiadakan oleh Agen.

Gunakan bahasa alami melalui Cheat Layer untuk menyiapkan otomatisasi proses bisnis, dan gunakan Agen Project Atlas untuk mengelola proses otomatisasi yang berbeda. Secara umum, kita dapat menggunakan mode bahasa alami untuk membuat Agen guna mengelola eksekusi otomatis bisnis tertentu, seperti kompleksitas bisnis meningkat, kami dapat meningkatkan Agen secara iteratif.

Saya tidak tahu pemasaran dan promosi Cheat Layer untuk saat ini, tetapi menurut statistik web yang serupa, pengguna utama terutama di Amerika Utara, dan jumlah kunjungan meningkat 37,8% dibandingkan bulan sebelumnya. Dengan membuat Agen untuk mengotomatiskan manajemen bisnis, relatif Dibandingkan dengan berbagai chatbot, permintaan ini mungkin dapat sangat memenuhi kebutuhan pemilik e-niaga kecil dan menengah, dan mungkin ini adalah arah yang perlu ditelusuri dan digali;

Peneliti GPT

Peneliti GPT adalah agen otonom berbasis GPT yang mampu melakukan penelitian komprehensif online tentang topik apa pun. Pengenalan proyek di Github adalah:

"Agen mampu menghasilkan laporan penelitian yang mendetail, objektif, dan tidak memihak dengan opsi penyesuaian untuk berfokus pada sumber daya, garis besar, dan pelajaran yang relevan. Terinspirasi oleh AutoGPT dan makalah Plan-and-Solve baru-baru ini, Peneliti GPT memecahkan masalah kecepatan dan deterministik , dengan memparalelkan kerja agen daripada operasi sinkron, memberikan kinerja yang lebih stabil dan kecepatan yang lebih cepat."

Arsitektur GPT Peneliti terutama dilakukan dengan menjalankan dua agen, ** satu adalah "perencana" dan yang lainnya adalah "pelaksana"; ** Perencana bertanggung jawab untuk menghasilkan pertanyaan penelitian, sedangkan pelaksana didasarkan pada penelitian pertanyaan yang dihasilkan oleh perencana Temukan informasi yang relevan, dan terakhir saring dan rangkum semua informasi yang relevan melalui perencana, dan kemudian hasilkan laporan penelitian;

lebih spesifik:

Hasilkan serangkaian pertanyaan penelitian yang bersama-sama membentuk opini objektif tentang tugas yang diberikan.
Untuk setiap pertanyaan penelitian, picu agen perayap untuk mengorek informasi yang relevan dengan tugas yang diberikan dari sumber online.
Untuk setiap sumber daya yang dirayapi, rangkum berdasarkan informasi yang relevan dan telusuri sumbernya.
Terakhir, semua sumber daya yang dirangkum disaring dan dikumpulkan, dan laporan penelitian akhir dihasilkan.

Fitur dari proyek ini

Hasilkan penelitian, garis besar, sumber daya, dan laporan pembelajaran

Setiap studi mengumpulkan lebih dari 20 sumber internet untuk membentuk kesimpulan yang objektif dan faktual

Termasuk antarmuka web yang mudah digunakan (HTML/CSS/JS)

Pengikisan web berkemampuan Java

Catat dan lacak informasi kontekstual tentang sumber web yang dikunjungi dan digunakan

Ekspor laporan penelitian ke format seperti PDF...

Meskipun Peneliti GPT adalah alat penelitian akademik berdasarkan GPT, dan ini adalah proyek sumber terbuka untuk tujuan akademik di bawah lisensi MIT. Dari perspektif pembuatan konten, open source ini memiliki nilai komersial yang tinggi.Misalnya, ketika proyek open source ini diterapkan pada laporan analisis bisnis, masih bisa menghemat banyak waktu.Kedua, mengubah proyek open source ini menjadi AI untuk penulisan konten yang mendalam -agen juga akan sepenuhnya mengubah pola industri media konten;

alamat proyek:

Ekologi infrastruktur Agen AI

Masa depan yang jelas adalah bahwa hubungan kolaboratif antara manusia di masa depan bukan lagi hubungan kolaboratif antara manusia dan manusia, tetapi hubungan kolaboratif antara manusia dan AI-Agent, dan setiap orang akan memiliki AI-Agent sebanyak mungkin. untuk menangani tugas sebanyak mungkin, sehingga membentuk struktur kolaborasi sosial cerdas yang besar dan kompleks;**

Hubungan kolaboratif antara manusia dan Agen berbeda dengan teori kolaboratif manusia dan alat dalam teori ilmu sosial sebelumnya.Kuncinya adalah Agen, sebagai sejenis kecerdasan mirip manusia, memiliki kemampuan pengambilan keputusan independen tertentu, dan kepercayaan manusia pada Agen juga menjadi isu utama, tidak hanya kesadaran diri Agen, tetapi pengaruh Agen terhadap perilaku interaksi sosial dalam mengambil keputusan bukan manusia.

Berdasarkan pertimbangan dari dua proposisi di atas, kita harus menyadari bahwa adalah mungkin bagi manusia untuk membuat AI-Agen mereka sendiri secara efisien dan nyaman, sambil memungkinkan Agen mereka memiliki kemampuan yang lebih kuat, dan pada saat yang sama, Agen andal dan terpercaya, tidak terlepas dari infrastruktur yang baik untuk memberikan dukungan. Pengenalan tiga proyek berikut, menurut saya, mewakili arah pembangunan infrastruktur AI-Agents di masa depan;

langchain

LangChain adalah kerangka pengembangan aplikasi berbasis model bahasa. Itu dapat mencapai fungsi-fungsi berikut

Data-aware: Menghubungkan model bahasa ke sumber data lain

Agen: Memungkinkan model bahasa untuk berinteraksi dengan lingkungannya.

Nilai utama LangChain terletak pada:

Komponen: Menyediakan abstraksi untuk bekerja dengan model bahasa, dan menyediakan serangkaian implementasi untuk setiap abstraksi. Komponen-komponen ini bersifat modular dan mudah digunakan, apakah Anda menggunakan kerangka LangChain lainnya atau tidak.

Rantai siap pakai: Kumpulan komponen terstruktur untuk mengimplementasikan tugas tingkat tinggi tertentu.

Rantai siap pakai memudahkan untuk memulai dengan cepat. Untuk aplikasi yang lebih kompleks dan kasus penggunaan terperinci, komponen memudahkan untuk menyesuaikan rantai yang ada atau membuat yang baru.

langchain menyediakan antarmuka standar yang dapat diperluas dan integrasi eksternal dengan menyediakan modul-modul berikut

Model input dan output model I/O: interaksi antarmuka dengan model bahasa

Koneksi data koneksi data: interaksi antarmuka dengan data aplikasi tertentu

Rantai rantai: bangun urutan panggilan

*Agen: Biarkan rantai memilih alat mana yang akan digunakan berdasarkan instruksi tingkat tinggi. *

*Memori: Menyimpan status aplikasi di antara proses rantai. *

*Callbacks Callbacks: Rekam dan streaming langkah-langkah perantara dari rantai apa pun. *

Berkat ekologi pengembang Langchain yang relatif aktif di komunitas Inggris, ada relatif banyak kasus pengembangan aplikasi Agen menggunakan Langchain. Mendefinisikan kerangka kerja Agen dan menyediakan kerangka kerja pengembangan tanpa kode adalah tren masa depan.

Berdasarkan sistem kerangka kerja tertentu, pembuatan Agen seperti membangun balok Lego. Berbeda dengan modularisasi Web3, modul Agen tidak harus siap pakai, tetapi orang biasa juga dapat mengembangkan komponen tertentu melalui pemrograman bahasa alami .Ditambahkan ke kerangka kerja Agen.

Misalnya, banyak orang menggunakan kerangka langchain untuk mengembangkan chatbot, mengembangkan komponen konversi nada melalui pemrograman bahasa alami, dan menambahkannya ke chatbot, kemudian nada dialog bawaan asli dapat diubah menjadi nada dialog yang memenuhi preferensi pengguna sendiri.

Pencerahan yang diberikan kepada kami oleh langchain adalah bahwa kerangka pengembangan Agen untuk pemrograman bebas kode + modul komponen untuk pemrograman bahasa alami mungkin merupakan alat pengembangan yang diperlukan untuk mempopulerkan Agen.

Agen Transformer

Transformer Agents adalah sistem AI-Agents yang diluncurkan oleh Hungging Face. Meskipun fungsinya saat ini tidak terlalu bagus, alasan utama mengapa kita harus mengawasinya adalah huggingFace adalah komunitas open source perpustakaan model yang sangat besar.

Agen Transformer sebenarnya didasarkan pada kerangka Transformer, menambahkan API berbasis bahasa alami: huggingface mendefinisikan seperangkat alat dan mendesain agen untuk menafsirkan bahasa alami dan menggunakan alat ini. Yang terpenting, sistem ini memiliki desain yang dapat diperluas.

Artinya, Transformer Agents menggunakan sejumlah kecil alat proxy yang telah dipersiapkan dengan baik pada tahap awal untuk memverifikasi kelayakan sistem ini, dan kemudian skalabilitas berarti Agen Transformer dapat dengan bebas menggunakan pustaka alat model huggingface yang sangat besar.

Saya merasa bahwa ini adalah solusi yang dibuat dalam makalah "HuggingGPT: Memecahkan Tugas AI dengan ChatGPT dan Teman-temannya di Wajah Berpelukan", yang menghubungkan perpustakaan model besar melalui LLM untuk menyelesaikan tugas kompleks di berbagai bidang dan berbagai modalitas. Imajinasi ini sebenarnya sangat besar. Pustaka model AI pertama yang menyatukan kecerdasan manusia terkemuka digunakan dalam bentuk Agen untuk melayani masalah kompleks di berbagai industri. Sulit untuk tidak menantikan masa depan seperti itu. **

Tentu saja, sangat menarik untuk mewujudkan visi ini, tetapi pada tahap saat ini, saya masih berharap Transformer Agents dapat mengusulkan kerangka kerja agen yang mengesankan untuk mengakomodasi masuknya pengembang ke dalam ekologi yang mengandung tambang emas besar di tengah ini. HuggingFace mungkin telah menyesuaikan strategi pengembangannya sendiri.

WebArena

**WebArena adalah lingkungan web mandiri yang dihosting sendiri untuk membangun agen otonom. **WebArena membuat empat kategori situs web populer dengan fitur dan data yang meniru rekan mereka di dunia nyata.

Untuk mensimulasikan pemecahan masalah manusia, WebArena juga menyematkan alat dan sumber daya pengetahuan sebagai situs web yang berdiri sendiri. WebArena memperkenalkan tolok ukur untuk menginterpretasikan perintah bahasa alami dunia nyata tingkat tinggi ke dalam interaksi berbasis web yang konkret. Para peneliti menyediakan program beranotasi untuk secara terprogram memverifikasi kebenaran fungsional dari setiap tugas.

Tinjauan makalah yang dikutip:

"Agen saat ini terutama dibuat dan diuji dalam lingkungan sintetik yang disederhanakan, yang sebagian besar membatasi representasi skenario dunia nyata. Dalam makalah ini, kami membangun lingkungan perintah-dan-kontrol agen yang sangat Realistis dan dapat direproduksi. Secara khusus, kami berfokus pada agen melakukan tugas di web dan menciptakan lingkungan yang menyertakan situs web yang berfungsi penuh dalam empat area umum: e-niaga, diskusi forum sosial, pengembangan perangkat lunak kolaboratif, dan manajemen konten. Lingkungan kami kaya dan beragam, termasuk beberapa alat (seperti peta ) dan basis pengetahuan eksternal (seperti manual pengguna) untuk mendorong penyelesaian tugas seperti manusia.

Berdasarkan lingkungan kami, kami menerbitkan serangkaian tugas tolok ukur yang berfokus pada evaluasi kebenaran fungsional penyelesaian tugas. Tugas dalam tolok ukur kami beragam dan berlangsung lama, serta dirancang untuk mensimulasikan tugas yang sering dilakukan oleh manusia di Internet. Kami merancang dan mengimplementasikan beberapa agen otonom, mengintegrasikan teknik canggih seperti berpikir sebelum bertindak.

Hasilnya menunjukkan bahwa menyelesaikan tugas yang rumit itu menantang: agen berbasis GPT-4 terbaik kami hanya mencapai tingkat keberhasilan tugas end-to-end sebesar 10,59%. Hasil ini menyoroti perlunya pengembangan lebih lanjut dari agen yang kuat, model bahasa canggih saat ini jauh dari sempurna pada tugas dunia nyata ini, dan WebArena dapat digunakan untuk mengukur kemajuan tersebut. "

Judul tesis: WebArena: Lingkungan Web Realistis untuk Membangun Agen Otonom

Alamat Skripsi:

Ini adalah hasil penelitian akademis dari peneliti AI dari Carnegie Mellon. Faktanya, WebArena melengkapi arsitektur pengembangan langchain yang terkenal saat ini, atau berbagai proyek terkait Tim-Agen. Kami membutuhkan platform pengujian simulasi Agen, yang digunakan untuk memastikan kekokohan dan efektivitas Agen.

Fungsi utama platform ini adalah untuk menguji kelayakan berbagai proyek Agen. Salah satu skenario yang bahkan dapat saya bayangkan adalah ketika saya menyewa Agen di platform tertentu di masa mendatang, kami akan menggunakan Agen tersebut melalui platform seperti WebArena untuk Menguji kemampuan kerja Agen yang sebenarnya juga berarti bahwa manusia memiliki hak untuk berbicara tentang keputusan penetapan harga Agen-AI.

Bagaimana AI-Agen akan memengaruhi segalanya?

Jaringan kolaborasi otomatis berbasis agen

Melalui pengenalan dan analisis kami terhadap lebih dari selusin proyek di atas, proyek-proyek yang berbeda ini seperti potongan teka-teki gambar, membentuk pemahaman keseluruhan relatif kami tentang Agen. Agen sebenarnya adalah arah untuk benar-benar mengeluarkan potensi LLM, dan LLM adalah pusat , Agen memberikan LLM dengan tangan dan kaki. Berdasarkan keragaman fungsional Agen yang digerakkan oleh LLM, Agen akan seperti ledakan biologis, dan manusia dan Agen akan menjadi pendamping digital/hubungan pengembangan simbiosis.

Jaringan kolaboratif masyarakat manusia juga akan membentuk jaringan kolaboratif otomatis antara manusia dan Agen karena penerapan Agen dalam skala besar Struktur produksi masyarakat manusia akan ditingkatkan, dan semua aspek masyarakat akan terpengaruh dan diubah;

Mengubah Segalanya di Internet

AI-Agents telah sepenuhnya mengubah cara kami memperoleh informasi, memproses informasi, menghasilkan informasi, dan menggunakan informasi di Internet, dan telah mengubah model bisnis kami saat ini yang bergantung pada Internet. Jaringan cerdas dengan kemampuan komunikasi dan eksekusi otonom/otomatis dari tugas adalah Agen Internet adalah media cerdas yang kita ajak bicara dan laksanakan.

Membentuk Ulang Narasi untuk Web3

Jaringan mata uang terenkripsi akan menjadi jaringan mata uang alami Agen, dan sumber daya komputasi yang dikonsumsi oleh seluruh jaringan kolaborasi AI-Agen akan menjadikan Token sebagai sumber daya ekonomi AI yang penting; kepemilikan data pribadi yang diwakili oleh Web3 juga akan menghadapi manusia-komputer baru hubungan interaksi Di antara mereka, proposisi baru bahwa manusia dan AI-Agen berbagi hak properti data. Munculnya Agen dengan hak properti independen (gerakan radikal untuk membebaskan AI), DAO sepenuhnya otomatis oleh Agen AI, dan individu super memonopoli sebagian besar hak properti data jaringan dan sumber daya komputasi yang efektif.

Gerakan afirmatif data di bawah gelombang Web3 telah mengembalikan kepemilikan data semua orang. Faktanya, kebanyakan orang belum tentu memiliki sumber daya data yang bernilai tinggi. Pengembalian kepemilikan data telah menjadi daya tarik politik naratifisme Web3, tetapi mengabaikan AGI Struktur produksi tidak seimbang; apa yang AI-Agen wakili adalah bahwa meskipun AI super-produktif, itu juga membangun hubungan produksi baru interaksi manusia-komputer dan kolaborasi otomatis, yang membuat kita harus membentuk kembali logika naratif Web3 ;

Mempercepat pembangunan metaverse

Dari perkembangan dan evolusi Generative Agents, penjelajahan digital native digital resident, dan membangun rangkaian aktivitas sosial di lingkungan metaverse manusia digital native (AI-Agents dengan karakteristik kepribadian dan kesadaran otonom), ternyata mempercepat metaverse. Alam semesta telah berevolusi dari ruang digital menjadi wilayah digital dengan fungsi dan bentuk sosial. Konsep ruang komputasi juga akan memungkinkan Agen memperoleh ruang pengembangan multimoda digital, sehingga mempercepat munculnya kecerdasan yang diwujudkan Agen di lingkungan digital.

Konstruksi metaverse bukan lagi tugas manusia, melainkan tugas pengembangan diri terus menerus sebagai ruang hidup AI-Agent;

Berhati-hatilah terhadap penculikan narasi teknologi tunggal

Faktanya, dalam beberapa tahun terakhir, berbagai hotspot teknologi telah muncul satu demi satu, dan umat manusia tampaknya telah memasuki masa revolusi teknologi yang sering terjadi.Bahkan, tiga narasi Metaverse, Web3, dan AGI telah muncul satu demi satu, yang telah memang menciptakan banyak hal bagi orang-orang dalam memilih arah karir Karena fakta bahwa kebanyakan orang di pasar berorientasi pada pemikiran berbasis proyek, pemosisian proyek itu sendiri dapat dengan mudah dikaitkan dengan kategori tertentu, seperti Web3 atau AI Di sinilah keledai memutuskan kepala, mengabaikan teknologi Hukum objektif perkembangan sejarah.

**Perkembangan ilmu pengetahuan dan teknologi tidak pernah terkotak-kotak, melainkan bergerak menuju integrasi interdisipliner dalam satu kesatuan dialektika. **Misalnya, atribut naratif NFT Web3 secara alami sejalan dengan narasi Metaverse. Di masa-masa awal Web3, keduanya sengaja ditentang oleh beberapa orang. Ini adalah perspektif yang sangat sempit. Hal yang sama berlaku untuk narasi AGI saat ini. Praktisi Web3 hanya mengetahui alat AI, tetapi tidak terlalu memikirkan logika naratif AGI. Mereka akan dengan sengaja menciptakan resistensi kognitif antara AI dan Web3. Misalnya, pemahaman banyak orang Web3 tentang DAO ada di original Hanya sedikit orang yang berani menghentikan dan memikirkan kembali pengaruh AGI pada DAO.

Web3, Metaverse, dan AGI adalah tiga arah yang sangat terkait. Organisasi media teknologi arus utama tradisional atau lembaga investasi belum membentuk konsep paradigma baru untuk narasi teknologi masa depan, dan telah menggunakan paradigma naratif lama untuk memengaruhi pasar. Sumber daya sains dan praktisi teknologi ke arah ini tersebar dan ide-ide mereka tidak cukup terbuka. Kami tidak mengesampingkan bahwa narasi teknologi baru akan terus muncul di masa depan, tetapi jika paradigma lama narasi teknologi terus diadopsi, sumber daya bakat ilmiah dan teknologi hanya akan terpecah dan tersebar lagi dan lagi. kognisi teknologi adalah sumber daya limbah dari hal-hal yang tidak terlihat.

Pertanyaan kunci yang saat ini dihadapi seluruh industri teknologi China adalah apa itu teknologi? Ada kekurangan paradigma naratif baru, dan tidak ada konsep naratif baru untuk memandu kita menghadapi gelombang teknologi berikutnya dengan lebih baik. Kami selalu tenggelam dalam proyek, tetapi kami kekurangan narasi yang dapat memadatkan kekuatan sains dan teknologi.Tiga narasi utama Web3, Metaverse, dan AGI juga tidak berasal dari China.

Saya sangat menantikan untuk mengantarkan era ketika seratus bunga bermekaran dan seratus aliran pemikiran bersaing dalam narasi ilmiah dan teknologi.Kita sangat perlu membentuk pemahaman baru tentang narasi teknologi, sehingga kita dapat menemukan jalan yang tepat untuk pengembangan dan menentukan posisi pembangunan berkelanjutan kami di seluruh ekosistem teknologi.

Tentu saja, menarik saja tidak ada gunanya, dan seseorang masih perlu melakukannya, jadi saya akan melakukannya terlebih dahulu, dan saya telah menahan pemikiran naratif teknologi tunggal ini untuk waktu yang lama!

Lihat Asli

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.