📢 Gate廣場 #创作者活动第一期# 火熱開啓,助力 PUMP 公募上線!
Solana 爆火項目 Pump.Fun($PUMP)現已登入 Gate 平台開啓公開發售!
參與 Gate廣場創作者活動,釋放內容力量,贏取獎勵!
📅 活動時間:7月11日 18:00 - 7月15日 22:00(UTC+8)
🎁 活動總獎池:$500 USDT 等值代幣獎勵
✅ 活動一:創作廣場貼文,贏取優質內容獎勵
📅 活動時間:2025年7月12日 22:00 - 7月15日 22:00(UTC+8)
📌 參與方式:在 Gate 廣場發布與 PUMP 項目相關的原創貼文
內容不少於 100 字
必須帶上話題標籤: #创作者活动第一期# #PumpFun#
🏆 獎勵設置:
一等獎(1名):$100
二等獎(2名):$50
三等獎(10名):$10
📋 評選維度:Gate平台相關性、內容質量、互動量(點讚+評論)等綜合指標;參與認購的截圖的截圖、經驗分享優先;
✅ 活動二:發推同步傳播,贏傳播力獎勵
📌 參與方式:在 X(推特)上發布與 PUMP 項目相關內容
內容不少於 100 字
使用標籤: #PumpFun # Gate
發布後填寫登記表登記回鏈 👉 https://www.gate.com/questionnaire/6874
🏆 獎勵設置:傳播影響力前 10 名用戶,瓜分 $2
10個具有代表性的AI-Agents,將如何改變互聯網/重塑Web3
來源:VION WILLIAMS
探討AI-Agents的創新可能性
AI-Agents的共識與非共識
AI-Agents之所以能夠成為一個越來越備受關注的方向,很多程度上是因為LLM為AI-Agents的落地應用提供了可行的技術實現路線,其次是有很多AI-Agents相關的項目火爆出圈。
儘管LiLian Weng在其文章中,定義了LLM驅動的AI-Agents是什麼?但是Deepmind也在試圖定義一個統一智能體的概念,我相信AI-Agents這個概念也會隨著不同的AI公司的理解,而形成不同類型的差異化。
而比較明確的關鍵共識是,基於LLM驅動的Agents實現對通用問題的自動化處理,是此次大型語言模型爆發週期中,我們所指認的,且形成共有認識的AI-Agents。
從Agents的相關性中找可能性
在AI-Agents的應用相關層面,在當前階段我們應該盡可能用“相關性”的視角來看待AI-Agents,即對AI-Agents的可能形態抱以試錯的包容性以及對創新的可能性,切不可像某些評論家一樣,以一種狹隘的立場尋找一種標準化的答案,這些都是不可取的。
例如Auto-GTP作為一種可能性,事實上啟發了很多Agents項目,但狹隘的批判會失去捕獲新機遇的機會,這是華人開發者中普遍存在的一些現象。沒有創造力的開發者,你又將如何在自然語言編程的時代,依賴自己的傳統競爭力呢?
儘管現在也有不少關於AI-Agents相關項目的介紹,但是我認為存在同質化羅列介紹的問題,這些內容解決了讓我們初步知道有哪些項目是屬於AI-Agents這一方向,但是沒有從相關性出發,展示AI-Agents在不同應用領域的潛在可能性,以及某類AI-Agents項目的生態位置。
例如在我的介紹中,Auto-GPT、BabayAGI和MetaGPT會被我歸在一類生態中,因為他們具有某一路徑的延續性;
在Agents的拼圖中構建全貌認知
總而言之,關於AI-Agents的代表性項目介紹中,我使用了“相關性”、“生態位置”以及“延續性”的視角,進行了代表性項目的介紹,使得我們可以從中隱約看到AI-Agents未來的發展趨勢。
以下的10個代表性的相關項目出現,包括一些相關引用項目,我將以案例為拼圖,拼湊出一個相對完整的圖譜,足以讓更多人清晰意識到,Agents的潛力如何改變互聯網的一切,包括重塑Web3格局。
AI-Agents的兩大未來方向
AI-Agents大致上會分為兩大方向:**Autonomous Agents和Generative Agents。 **
Autonomous Agents以Auto-GPT為例,代表了通過自然語言的需求描述,能夠自動化執行各項任務達成目標結果,在這個協作關係中,Autonomous Agents是服務於人,具有明確的工具屬性;
Generative Agents以斯坦福發表的25個智能體的虛擬小鎮為例,Generative Agents作為一個具有類人格特徵、自主決策能力以及長期記憶等特徵,更偏向“原生性”概念的AI-Agents,在這個協作關係中,Agents具有數字原生意義的社會關係,不僅僅是服務於人的工具;
自動 GPT
Auto-GPT知名度最高的一個開源項目,其在GitHub的介紹很簡單“An experimental open-source attempt to make GPT-4 fully autonomous.”,一個實驗性的開源嘗試,旨在使GPT-4完全自主化。
簡單概括,就是Auto-GTP能夠通過一句話的任務需求,能夠完全自動化的實現最終的任務結果;Auto-GPT能夠實現自主完成任務的核心邏輯,在於借助了語言模型的任務規劃能力,通過對任務進行一步步拆解分析,以及自動完善任務的執行步驟,在這過程中具有在網絡上搜索結果後反饋給語言模型,並進一步進行任務拆解與執行。
用通俗大白話來比喻,**Auto-GPT在“自問自答”的過程中把任務給完成了,不需要人類再提供提示詞。 **
項目地址:
**BabyAGI可以根據之前任務的結果和我們預設的目標,自動創建、排序和執行新的任務。 **它利用自然語言處理技術,根據目標創建新的任務,並把任務結果存儲在數據庫裡,以便在需要時找到相關信息。
BabyAGI其實是一個Python腳本,這個腳本通過運行一個無限循環來完成以下步驟:
Auto-GPT和BabyAGI理論上都代表著我們當前LLM爆發的初始時期,我們基於LLM實踐AGI的探索,基於LLM驅動的通用任務解決處理器,我認為是未來AI-Agents領域的聖杯。
生成代理
斯坦福和谷歌研究員發布的《Generative Agents: Interactive Simulacra of Human Behavior》這篇論文,已經是非常知名的一個AI- Agent項目,總而言之,這項研究將25個AI智能體放在一個像素風格的虛擬小鎮上,**智能體之間可以實現人類生活行為的模擬交互,也可以與虛擬小鎮的所在環境發生交互,並且還可以與虛擬世界之外的人類產生交互。 **
這篇論文有兩個關鍵的解決方案是最值得我們去關注的:
1,生成式代理的架構
2,記憶流
基於以上兩個關鍵構成,事實上,生成式代理的整體行為分為【記憶與檢索】【反思】【規劃與反應】三大部分構成,具體可以參考原論文內容。
這篇論文以及這個實驗驗證了基於LLM形成的代理所產生的交互行為,得以在一個數字環境中行為可信的模擬人類交互的行為,生成式代理可以在很多數字化環境中發揮作用,尤其是生成式代理與人類所形成的一種人機交互關係。
我們最能直觀感受到的,就是生成式代理作為一種元宇宙原生數字居民的角色被創造,並與人類元宇宙的環境中產生各種交互動作。事實上,我們完全可以模擬一個AI-Agents高度發達的數字虛擬世界,人類從該世界中摘取AI-Agents的數字勞動成果;
Agents如何成為工作夥伴
由於Agents這一次在很多語境中,都被翻譯成為“代理”,代理很容易聯想到中介的角色概念,使得很多人無法直觀建立對Agents的場景應用的聯想;在這三個案例中,分別展示了Agents如何成為可被雇傭的“人類專家”,完全不需要人類參與的自動化營銷公司,以及Agents之間如何組建成為團隊互相協作。
在下文的案例中,我們可以使用NexusGPT創建多個專家職員,並且通過GPTeam將其組建成為一支受僱傭於人類的團隊,而這個AI團隊就職於AutoCorp這樣的完全自動化公司。當我們將這些拼圖拼湊起來的時候,我們才得以直觀的感受到未來已來;
NexusGPT
這是一個由獨立開發者Assem做的號稱世界第一個AI自由職業者平台,NexusGPT基於LangChainAI的框架,使用GPT-3.5的API和Chroma(一個AI-native的開源嵌入式數據庫),NexuseGPT平台上擁有八百多個具有特定技能的AI代理人。
但這些都依賴於OpenAI和LangchainAI的函數調用的支持;
NexusGPT代表了人類僱傭Agents的一種未來商業模式,這個項目其實有很多值得改進的地方,例如Agents與專家模塊(專家系統與專家模型)的結合,甲方僱傭Agents的計價方式以Token的消耗量計算等,這些都會改變我們傳統的人力僱傭勞動市場的方式,也將會改變DAO的協作方式;
汽車公司
AutoCorpmina fahmi和他們團隊在紐約GPT/LLM黑客馬拉松期間用時5小時創建的。 AutoCorp是一個完全自主的品牌營銷公司,AutoCorp會自動為一家直銷T恤的公司創建品牌廣告和產品設計,當有顧客提出新的消費需求時,AutoCorp將會更新其主題並生成新的設計資產,朝著更好地業務方向而不停的自我迭代。
本段內容引用自Mina fahmi的推特,而AutoCorp也是mina fahmi和他們團隊在紐約GPT/LLM黑客馬拉松期間用時5小時創建的,而他們創建AutoCorp的目的也是為了將“Autonomy”的概念推向極致。
AutoCorp其實與DAO的目的是高度一致的,**如果說去中心化組織的極致是把“人”的因素也去除掉,那麼將生產業務完全自動化實現其實是DAO這一概念的合理髮展訴求。 **AutoCorp其實代表了DAO未來的業務發展方向。
GP團隊
GPTeam是一個開源的多代理仿真係統。 GPTeam利用GPT-4創建多個代理,它們協作以實現預定義的目標。該項目的主要目標是探索GPT模型在提高多代理生產力和有效溝通方面的潛力。
項目地址:
事實上,類似GPTeam的開源項目依舊有很多,例如Dev-GPT,為用戶創建定制化微服務的自動化開發團隊。團隊由虛擬的產品經理、開發人員和開發運維三個角色構成,Dev-GPT的技術思路主要以識別並測試有效的任務策略,如果連續10次失敗,它會切換到下一個方法。
這一切又讓我不得不聯想到DAO,基於自動化治理邏輯的自動化任務協作組織;
Agents如何替代重複工作
在AI完全替代掉我們的工作之前,Agents替代掉我們當前的大多數重複勞動是接下來Agents在商業領域的發展方向,在基於LLM的Agents出現之前,RPA(機器人流程自動化操作)是產業界所尋求的解決方案,但傳統RPA門檻較高且無法普及給大眾,RPA是一種對傳統IT交互邏輯不夠自動化的一種補救,而當前的Agents能夠以自然語言的交流方式,實現了RPA的功能需求。
以下兩個項目為我們展示了,基於LLM的Agents將如何幫助我們從日常工作與學術研究中,幫助我們從重複勞動中解放出來。 (事實上這兩個項目的潛力不止於此)
作弊層
“Automatee your business Using Natural Languae”,使用自然語言將你的業務自動化,這是Cheat Layere的品牌口號。 Cheat layer通過定制訓練的GPT-4機器學習模型解決不可能的業務自動化問題,作為每個使用者的AI軟件工程師。
Cheat Layer通過谷歌瀏覽器的插件模式,使用自然語言的方式,對整個網頁的操作實現自動化,例如我們在網頁端的大部分常規操作事實上都可以使用自動化的進行操作。 Cheat Layer很容易令人聯想到RPA,即機器人流程自動化操作。關於Agents與RPA的之間的關係事實已經有諸多討論,傳統RPA被Agents淘汰肯定是不爭的事實。
通過Cheat Layer使用自然語言,進行業務流程的自動化操作設置,而使用Project Atlas Agents管理不同的自動化流程,通俗來說,我們可以使用自然語言的模式,創建一個Agents用於管理某個業務的自動化執行,隨著業務的複雜度增高,我們還可以對該Agents進行迭代完善。
GPT 研究員
GPT Researcher是一個基於GPT的自主代理,能夠對任意給定的主題進行在線綜合研究。該項目在Github的介紹是:
“該代理能夠生成詳細、客觀、不帶偏見的研究報告,並提供定制選項,以便集中關注相關資源、提綱和教訓。受到AutoGPT和最近的Plan-and-Solve論文的啟發,GPT Researcher解決了速度和確定性的問題,通過並行化代理工作而不是同步操作,提供更穩定的性能和更快的速度。”
GPT Researcher的架構主要通過運行兩個代理來進行,**一個是“規劃者”,一個是“執行者”;**規劃者負責生成研究問題,而執行者則是根據規劃者生成的研究問題尋找相關的信息,最後再通過規劃者對所有相關信息進行過濾與匯總,然後生成研究報告;
生成一組研究問題,這些問題共同形成關於任何給定任務的客觀意見。
對於每個研究問題,觸發一個爬蟲代理,從在線資源中抓取與給定任務相關的信息。
對於每個抓取的資源,基於相關信息進行總結,並跟踪其來源。
最後,對所有總結的資源進行篩选和匯總,並生成最終的研究報告。
該項目的特點
生成研究、提綱、資源和教訓報告
每項研究匯總了20多個網絡來源,形成客觀和事實的結論
包含易於使用的Web界面(HTML/CSS/JS)
支持Java的網頁抓取
記錄和跟踪已訪問和使用的網絡來源的上下文信息
導出研究報告為PDF等格式...
儘管GPT Researcher是一個基於GPT的學術研究工具,並且這是一個在麻省理工學院的許可下出於學術目的而開源的項目。從內容創造的角度上來說,這一開源具有較高的商業價值,例如這一開源項目應用於商業分析報告時,還是能夠節省大量的時間,其次將這一開源項目改造成為深度內容撰寫的AI -agents時,也將徹底改變內容媒體行業的格局;
項目地址:
AI-Agents的基礎設施生態
顯而易見的未來是,未來人類之間的協作關係不再是人類與人類之間的協作關係,而是人類與AI-Agents之間的協作關係,每個人都將擁有盡可能多的AI- Agents幫助自己的處理盡可能多的任務,由此形成一個龐大且複雜的智能社會協作結構;
人類與Agents之間的協作關係不同於過往社會科學理論中的人類與工具的協同理論,關鍵在於Agents作為一種類人類智能,擁有一定的自主決策能力,人類對Agents的信任能力也同樣成為一個關鍵議題,且不談Agents具有自我意識,而是在於Agents代替人類進行決策判斷對社會交往行為的影響力。
基於對以上兩個命題的思考,我們不得不意識到,能夠讓人類高效便捷的創造自己的AI-Agents,讓自己的Agents擁有更多強大能力的同時,Agents是可靠且值得信任的,這些都離不開一個良好的基礎設施提供支持。以下三個項目的介紹,我認為分別代表著未來AI-Agents的基礎設施的建設方向;
語言鏈
LangChain是一個基於語言模型的應用程序開發框架。它能夠實現以下功能
**數據感知:**將語言模型連接到其他數據來源
**代理:**允許語言模型與其環境進行交互。
LangChain的主要價值在於:
**組件:**提供處理語言模型的抽象,並為每個抽象提供一系列實現。這些組件是模塊化且易於使用,無論您是否使用LangChain框架的其餘部分。
現成鏈:一組結構化的組件,用於實現特定的高級任務。
現成鏈使得快速入門變得簡單。對於更複雜的應用程序和細緻的用例,組件使得定制現有鍊或構建新鏈變得容易。
langchain通過提供以下幾個模塊提供標準的、可擴展的接口和外部集成
Model I/O 模型輸入與輸出:與語言模型進行接口交互
Data connection 數據連接:與特定應用程序的數據進行接口交互
Chains 鏈:構建調用序列
*Agents 代理:讓鏈根據高級指令選擇使用哪些工具。 *
*Memory 存儲器:在鏈的運行之間保存應用程序狀態。 *
*Callbacks 回調:記錄和流式傳輸任何鏈的中間步驟。 *
得益於langchain在英文社區有著較為活躍的開發者生態,因此使用Langchain進行Agents應用開發的案例也相對較多,定義Agents的框架並提供零代碼的開發框架,這是未來的趨勢。
基於特定的框架系統,Agents的製造就像搭樂高積木一樣,不同於Web3的模塊化在於,Agents的模塊不必是現成的,而是普通人也可以通過自然語言編程的模式開發出特定的組件,添加到Agents的框架之中。
例如很多人使用langchain的框架來開發聊天機器人,通過自然語言編程開發一個語氣轉化組件,添加到聊天機器人中,那麼就可以將原本默認的對話語氣,變成符合用戶自己的偏好的對話語氣。
langchain給到我們的啟示是,無代碼編程的Agents開發框架+自然語言編程的組件模塊,可能是Agents普及的必要開發工具。
變形金剛特工
Transformer Agents是hungging Face推出的一個AI-Agents系統,儘管當前功能還不咋滴,但是必須保持關注的關鍵原因在於,huggingFace是一個龐大的模型庫開源社區。
Transformer Agents其實就是在Transformer框架的基礎之上,新增了基於自然語言的API:huggingface定義了一組工具並設計了一個代理來解釋自然語言並使用這些工具,最重要的是,這個系統具有可擴展性的設計。
也就是說,Transformer Agents早期使用了少量被精心準備的代理工具,以驗證這套系統的可行性,隨後擴展性意味著Transformer Agents可以自由使用huggingface龐大的模型工具庫。
當然,為了實現這一願景是令人期待的,但在當前階段,還是很期待Transformer Agents能夠提出一個令人眼前一亮的agents框架,以適應開發者們湧入這個蘊含巨大金礦的生態之中。 HuggingFace或者應該調整了自己的發展策略。
網絡競技場
**WebArena是一個獨立的、可自主託管的用於構建自主代理的網絡環境。 **WebArena創建包含四個熱門類別的網站,這些網站具有功能和數據,模仿其真實世界的對應物。
為了模擬人類問題解決,WebArena還嵌入了工具和知識資源,作為獨立的網站。 WebArena引入了一個基準測試,用於解釋高水平的現實自然語言命令,並轉化為具體的基於網絡的交互。研究員們提供了註釋過的程序,用於編程驗證每個任務的功能正確性。
引用論文概述:
“當前的代理主要是在簡化的合成環境中創建和測試的,這在很大程度上限制了對真實世界情景的表示。在本文中,我們建立了一個代理命令與控制的環境,這個環境高度逼真且可複現。具體而言,我們專注於在網絡上執行任務的代理,並創建了一個包含四個常見領域的功能完整網站的環境:電子商務、社交論壇討論、協作軟件開發和內容管理。我們的環境豐富多樣,包括了一些工具(例如地圖)和外部知識庫(例如用戶手冊),以鼓勵類似人類的任務解決方法。
基於我們的環境,我們發布了一組基準任務,重點評估任務完成的功能正確性。我們基準中的任務種類多樣,時間跨度長,並旨在模擬人類在互聯網上經常執行的任務。我們設計和實現了幾個自主代理,整合了最新的技術,如先思考後行動。
結果表明,解決複雜任務具有挑戰性:我們最好的基於GPT-4的代理僅實現了10.59%的端到端任務成功率。這些結果凸顯了對強大代理進一步發展的需求,當前的最先進的語言模型在這些真實任務中表現還遠未達到完美,而WebArena可以用來衡量這樣的進步。 ”
論文地址:
這是一篇來自卡內基梅隆的AI研究員的學術研究成果,事實上WebArena補充當前普遍知道的langchain的開發架構,又或者各種Agents-Team的相關項目,我們需要一個Agents的模擬測試平台,用於確保Agents的穩健性和有效性。
这一平台的主要功能还是提供检验各种Agents项目的可行性,我甚至可以设想的一个场景是,当我未来在某平台雇用了一个Agents时,我们将Agents通过类似WebArena这样的平台,来测试Agents的真正工作能力,这也意味人类掌握对AI-Agents的定价决定的话语权。
**AI-Agents將如何影響一切? **
基於Agents的自動化協作網絡
通過我們以上十幾個項目的介紹與分析,這些不同的項目就像拼圖碎片一般,湊成了我們對Agents的相對整體認知,Agents事實上是將LLM潛力真正發揮出來的方向,LLM作為中樞,Agents賦予了LLM施展的手腳,基於LLM驅動的Agents所具有的功能多樣性,將使得Agents如生物大爆發一樣,人類與Agents成為一種數字伴生/共生的發展關係。
人類社會的協作網絡也將因為Agents的大規模應用,構成了一個人類與Agents的自動化協作網絡,人類社會的生產結構將由此得以升級,由此社會的方方面面又將受到影響而改變;
改變互聯網的一切
AI-Agents完全改變了我們在互聯網獲取信息、加工信息、生產信息以及使用信息的方式,改變了我們當前在依賴於互聯網的商業模式,一個具備溝通能力與自主/自動執行任務的智能網絡是互聯網的未來形態,Agents就是那個我們與之對話與執行的智能媒介。
重塑Web3的敘事
加密貨幣網絡將成為Agents天然的貨幣網絡,整個AI-Agents協作網絡所消耗的計算資源將使得Token成為重要的AI經濟資源;Web3所代表的個人數據所有權,也將面臨著新的人機交互關係中,人類與AI-Agents共享數據產權的全新命題。擁有自主產權的Agents出現(解放AI的激進運動),完全由AI-Agents自動化執行的DAO,以及超級個體壟斷了大部分的網絡數據產權與有效計算資源。
Web3浪潮下的數據平權運動,讓每個人的數據所有權回歸,讓事實上大部分人不一定具備高價值的數據資源,數據所有權回歸成為一種Web3敘事主義的政治訴求,卻忽視了AGI社會的生產結構不平等;AI-Agents所代表的是AI作為超級生產力的同時也在構建新的人機交互與自動協作的生產關係,這使得我們不得不重塑Web3的敘事邏輯;
加速元宇宙的建設
從Generative Agents的發展演化,探索數字原生的數字居民,構建原生性的數字人(具有人格特徵與自主意識的AI-Agents)在元宇宙的環境中形成的一些列社會活動,事實上正在加速元宇宙從一個數字空間演化成為一個具有社會功能與社會形態的數字疆域。計算空間的概念,也將讓Agents的獲得一個數字多模態的發展空間,進而加速Agents在數字環境中的具身智能的出現。
元宇宙的建設不再是人類的任務,而是成為AI-Agent的生存空間,而進行持續的自我擴建的任務;
警惕單一科技敘事的綁架
事實上,近幾年來各種科技熱點接連湧現,人類似乎進入了一個科技革命多發期,而事實上,Metaverse、Web3、AGI三個敘事接連湧現,給人們在選擇事業方向上確實製造了不少的難度,由於市場上大部分人都是項目制的思維導向,項目本身的定位很容易被歸屬在特定的某個範疇,例如要么是Web3,要么是AI,這都是屁股決定腦袋,忽略科技史的客觀發展規律。
**科學技術的發展從來不是割裂的,而是在辯證統一中走向跨學科的融通。 **例如Web3的NFT敘事屬性,天然就與元宇宙的敘事是符合的,而在Web3剛冒頭的早期,這兩者被某些人刻意對立,這些都是很狹隘的視角。而在今天的AGI敘事也一樣,Web3從業者只知道AI工具,但卻不深入思考AGI的敘事邏輯,會刻意製造了一個AI與Web3的認知阻力,例如很多Web3人對DAO的理解都在原地踏步,鮮有人勇敢停下來重新思考AGI對DAO的影響力。
Web3、Metaverse、AGI是三個高度關聯的方向,傳統主流科技媒體機構,或者投資機構等尚未建立對未來科技敘事的新範式理念,一直在用舊的敘事範式影響市場,這也導致了這幾個方向的科技從業者的資源分散、思路不夠打開。我們不排除未來將繼續出現新的科技敘事,但如果繼續採用對科技敘事的舊範式,那麼科技人才的資源只會被一次又一次的分裂且分散,對科技認知的舊範式是一個損耗資源的無形之物。
整個中國科技行業當前面臨的一個關鍵問題,就是對於科技是什麼?缺乏新的敘事範式,沒有新的敘事理念來指引我們更好地應對接下來的科技浪潮。我們總是埋頭乾項目,卻缺乏能夠凝聚科技力量的敘事,無論是Web3、Metaverse、AGI這三大敘事都不是起源於中國。
我倒是很嚮往迎來一個科技敘事百花齊放、百家爭鳴的時代,我們急需形成對科技敘事的全新認知,進而才能找到正確的發展之路,確定自己在整個科技生態圈中的可持續發展位置。
當然,僅靠呼籲是沒用的,還是得有人來做,那我就先乾了,早就忍這些單一科技敘事思維不爽很久了!