📢 Gate廣場 #NERO发帖挑战# 秀觀點贏大獎活動火熱開啓!
Gate NERO生態周來襲!發帖秀出NERO項目洞察和活動實用攻略,瓜分30,000NERO!
💰️ 15位優質發帖用戶 * 2,000枚NERO每人
如何參與:
1️⃣ 調研NERO項目
對NERO的基本面、社區治理、發展目標、代幣經濟模型等方面進行研究,分享你對項目的深度研究。
2️⃣ 參與並分享真實體驗
參與NERO生態周相關活動,並曬出你的參與截圖、收益圖或實用教程。可以是收益展示、簡明易懂的新手攻略、小竅門,也可以是行情點位分析,內容詳實優先。
3️⃣ 鼓勵帶新互動
如果你的帖子吸引到他人參與活動,或者有好友評論“已參與/已交易”,將大幅提升你的獲獎概率!
NERO熱門活動(帖文需附以下活動連結):
NERO Chain (NERO) 生態周:Gate 已上線 NERO 現貨交易,爲回饋平台用戶,HODLer Airdrop、Launchpool、CandyDrop、餘幣寶已上線 NERO,邀您體驗。參與攻略見公告:https://www.gate.com/announcements/article/46284
高質量帖子Tips:
教程越詳細、圖片越直觀、互動量越高,獲獎幾率越大!
市場見解獨到、真實參與經歷、有帶新互動者,評選將優先考慮。
帖子需原創,字數不少於250字,且需獲得至少3條有效互動
強化學習之父入局AGI創業!聯手傳奇程式設計師卡馬克,放話不依賴大模型
原文來源:量子位元
傳奇程式設計師卡馬克 (John Carmack),與強化學習之父薩頓 (Richard Sutton)強強聯手了,All in AGI。
且與主流方法不同,不依賴大模型範式,更追求即時的線上學習。
薩頓會加入卡馬克的AI新創公司Keen Technologies,同時維持在阿爾伯塔的教職。
兩人在活動中都承認,與擁有數百上千員工的大公司相比,Keen Technologies的團隊規模很小。
目前還在剛起步階段,公司整個技術團隊都到了現場——
只有站著的這4個人。
但他們相信,最終AGI的原始碼是一個人就能寫的量級,可能只有幾萬行。
而目前AI領域正處於槓桿效應最大的特殊時刻,小團隊也有機會做出大貢獻。
傳奇程式設計師與強化學習之父
卡馬克的傳奇經歷,從開發世界第一款3D遊戲,到轉型造火箭,再到加入Oculus成為後來Meta VR關鍵人物的故事都已被人熟知。
後來他與AI結緣,也和OpenAI有關。
他曾在另一場訪談中透露,Sam Altman曾邀請他加入OpenAI,認為他能在系統優化上扮演重要角色。
但卡馬克當時認為自己對機器學習典範的現代AI沒有任何了解,也就沒有答應。
這卻成了他開始了解AI的一個契機。
等有了空閒,打算繼續涉足深度學習的時候,他來了個一周編程挑戰:
列印幾篇LeCun的經典論文,在斷網情況下動手實踐,從推反向傳播公式開始。
一週過去後,他帶著用C++手搓的捲積神經網路結束閉關,沒有借助Python上的現代深度學習框架。
只能說佩服大神了。
不過這個過程中,他與公司管理階層之間也逐漸產生矛盾與分歧,認為公司內部效率低下,也曾公開發表不滿。
2022年8月,他宣布新AI新創公司Keen Technologies宣布融資2,000萬美元,投資人包括紅杉資本,GitHub前CEO Nat Friedman等。
後續他也透露,其實區區2000萬美元,自己就拿得出手。
但是從別人那裡拿錢能給他一種危機和緊迫感,有更強烈的決心把事情做好。
當年他的3D遊戲激發了對圖形運算的需求,GPU也是從遊戲領域開始發展壯大。
到如今正是GPU的算力支持了AI的爆發,他談到這些時仍為自己的貢獻感到自豪。
……
今天的另一位主角薩頓也同樣是位傳奇人物。
他被譽為強化學習之父,為強化時間差異學習和策略梯度等方法做出重要貢獻,也是強化學習標準教科書的合著者。
2017年他以傑出科學家身分加入DeepMind,參與了AlphaGo系列研究,他的學生David Silver則是AlphaGo主要負責人之一。
在兩人正式交流之前,卡馬克就曾表達過對這篇文章的關注與認同。
幾個月前,卡馬克宣布AGI新創公司融資後,收到了薩頓的電子郵件。
薩頓想問他在研究的道路上應該走純學術、商業化還是非營利組織路線的問題。
但在後續郵件交流中,兩人發現在AI研究方向和理念上有驚人的一致性,漸漸確立了合作關係。
具體來說,兩人達成了4個共識:
不只依賴大模型,小團隊也有機會
很大膽的目標,現場觀眾也是這麼認為的。
面對「小團隊如何搞定這麼宏大的目標」的提問,卡馬克認為實現AGI所需的數據量和算力需求可能沒有想像中那麼大。
對於算力需求,他也是用這種直覺式的思考去考慮:人腦的運算能力也有限,遠遠達不到一個大型算力集群的程度。
而且隨著時間推移,演算法會更有效率,所需的算力還會持續下降。
這也是當初Sam Altman邀請他加入OpenAI時看中的地方。
他設想中的AGI架構應該是模組化和分散式的,而不是一個巨大的集中模型。
學習也應該是持續的線上學習,而不是現在的預訓練之後大部分參數就不再更新。
他進一步表示,身為一個能自己寫原始Cuda程式碼和能自行管理網路通訊的底層系統程式設計師,可能會去做一些其他人根本不會考慮的工作。
甚至不僅限於現有的深度學習框架,會嘗試更有效率的網路架構和運算方法。
總體目標是模擬一個具有內在動機和持續學習能力的虛擬智能體,在虛擬環境中持續學習。
不要機器人,因為製造火箭的經驗讓他認為打交道的實體物件越少越好。
雖然這次活動上沒有說太多,但主體部分已經以**「阿爾伯塔計畫」**的形式寫在一篇arXiv論文裡。
也提出了一個分為12步的路線圖。
前6步專注於設計model-free的持續學習方法,後6步引入環境模型和規劃。
薩頓認為這種增強是充分發揮人工智慧潛力的重要組成部分。
在這個過程中,確定評估AI進步的指標非常重要但也十分困難,團隊正在探索不同的發展。
另外,卡馬克一直是開源的倡導者,但在AGI的問題上他表示會保持一定開放性,但不會全部公開演算法細節。
作為一個小團隊,卡馬克認為需要保持開拓精神,專注於長遠發展而不是短期利益,
不會過早考慮商業化,沒有像ChatGPT這樣可以公開發布的中間形態。
對於2030年能做到什麼地步,卡馬克認為**「有可以向公眾展示的AGI」,薩頓的表述是「AI原型可以顯示出生命跡象(signs of life)」**。
2030成關鍵節點
2030與AGI,並不是第一次同時出現。
頂尖AI團隊不約而同都把2030年前後當作實現AGI的關鍵節點。
例如OpenAI,在拿出20%總算力成立超級智慧對齊部門的公告裡寫著,我們相信超級智慧在這個十年段到來。
OpenAI最大的競爭對手,剛剛拿40億美元融資的Anthropic,其CEO Dario Amodei在最近一次訪談中提到,兩三年內AI能表現得像一個受過良好教育的人類。
不過目前兩人今年初突然離開這家公司,共同創辦人只留下一位David Luan(最右)。
國內方面明確喊出AGI目標的同樣也不多,主要有MiniMax和楊植麟新創辦的月之暗面。
參考連結: [1] [2] [3]