📢 Gate廣場 #NERO发帖挑战# 秀觀點贏大獎活動火熱開啓!
Gate NERO生態周來襲!發帖秀出NERO項目洞察和活動實用攻略,瓜分30,000NERO!
💰️ 15位優質發帖用戶 * 2,000枚NERO每人
如何參與:
1️⃣ 調研NERO項目
對NERO的基本面、社區治理、發展目標、代幣經濟模型等方面進行研究,分享你對項目的深度研究。
2️⃣ 參與並分享真實體驗
參與NERO生態周相關活動,並曬出你的參與截圖、收益圖或實用教程。可以是收益展示、簡明易懂的新手攻略、小竅門,也可以是行情點位分析,內容詳實優先。
3️⃣ 鼓勵帶新互動
如果你的帖子吸引到他人參與活動,或者有好友評論“已參與/已交易”,將大幅提升你的獲獎概率!
NERO熱門活動(帖文需附以下活動連結):
NERO Chain (NERO) 生態周:Gate 已上線 NERO 現貨交易,爲回饋平台用戶,HODLer Airdrop、Launchpool、CandyDrop、餘幣寶已上線 NERO,邀您體驗。參與攻略見公告:https://www.gate.com/announcements/article/46284
高質量帖子Tips:
教程越詳細、圖片越直觀、互動量越高,獲獎幾率越大!
市場見解獨到、真實參與經歷、有帶新互動者,評選將優先考慮。
帖子需原創,字數不少於250字,且需獲得至少3條有效互動
生成式AI,能否生成百度的未來?
原文來源:光錐智慧
作者:劉雨琦
大風始於青萍之末,命運的偶然和必然經常會縱橫交織在一起。
2019年,是整個人工智慧歷史上,最為晦暗的一年。 繼2016年AlphaGo打敗李世石,2017年Tansformer架構橫空出世使得技術大規模爆發,2018年的創業熱潮之後。 2019年,資本退潮、技術瓶頸期、場景難落地,開啟了人工智慧史上的“亂紀元”。
**沒有人知道通用人工智慧何時到來,就像三體人不知道太陽會在何時升起。 **
那一年,大批AI公司陷入裁員風波、資金鏈斷裂、產品難產,能堅持至今的,所剩寥寥。
但也正是在2019年,AI新的希望開始孕育:OpenAI在7月接受了微軟的投資並與其深度合作,如今讓世人震驚的GPT-3正是從那一年開始研發; 國內最早樹立AI戰略的百度,從年初就開始進行了一次長達半年的人事調整,如今看來,重新排兵布陣,似乎是開啟了長達4年的堅守期。
2019年,王海峰晉陞為集團CTO,繼續擔任AI技術平台體系(AIG)和基礎技術體系(TG)總負責人,兩者是百度最重要的技術底座; 沈抖晉陞為高級副總裁,全面負責移動生態事業群,隨後在2022年又調任至百度智慧雲,成為百度第二增長曲線的開拓者; 而在2019年引進的一批新生力量中,何俊傑是唯一一名80后百度副總裁,先是負責投資併購和戰略投資,后又被重用,負責沈抖空缺出來的移動生態事業群,實權更加在握。
時間來到了2023年,Transformer的能力在這一年終於由OpenAI打破了天花板,進階到一個新的層次,技術的突破讓OpenAI一舉成為全世界最受矚目的公司。 微軟蓋過了谷歌的科技光輝。
**在過去四年裡,百度的核心業務形成了由沈抖領軍智慧雲,何俊傑負責移動生態,王海峰壓陣技術的三角結構,百度也終於結束了靜默期,開始轉守為攻,動作不斷。 **
“重新把每個應用都做一遍”,是經歷了半年蓄力后的第一次亮劍,如今的百度像一顆行星,即將遇到巨大的“技術引力場”,而徹底改變軌道。
大模型湧現前夜
2017年,谷歌在一篇名為《Attention Is All You Need》的論文中,提出了Transformer架構,以替代傳統的RNN和CNN迴圈模型,論文中展示了Transformer的訓練準確性高於之前所有模型,訓練時間明顯低於之前的模型,在訓練集內容較少時訓練效果也很好。
這之後,Transformer架構迅速被接受並應用在了NLP和CV領域,尤其在NLP領域,注意力機制讓機器能夠更準確地理解語義並生成,以及減少信息重複。
作為最早一批發現並跟進Transformer技術路線的公司,百度已經在NLP領域研究超過十年之久,並已經組成了一支由王海峰、吳甜、吳華等頂尖專家組建起來的精悍的NLP隊伍。
彼時,NLP團隊成立的第一個重要任務,是打造百度翻譯。 王海峰將深度學習和神經網路大膽應用在翻譯中,加強機器對上下文的理解,形成更流暢的譯文。 這一勇敢嘗試也讓百度翻譯成為第一個支援200多種語種的翻譯系統,甚至比Google還早了一年零3個月。
**這也是大模型四大核心能力“理解、生成、邏輯、記憶”中,理解能力的雛形。 **
但王海峰覺得,NLP還不夠。 他專門跑到李彥宏辦公室去做彙報,提出了下個「登陸的諾曼第」——語音識別。 他的理由是,語音辨識技術馬上要到產業化的臨界點,一旦突破很快就會大規模商用。
李彥宏憑藉著自己對技術的判斷,決定再次支援王海峰,陸續建立了與NLP部門平行的「語音辨識部門」、「圖像識別部門」和「知識圖譜部門」。。
王海峰的一通操作讓很多百度的同學不解,「這些技術和百度現在的產品也沒關係啊,一股腦創建這麼多部門,是攢著過年嗎? ”
彼時的王海峰,正是看到了搜索數據對於大模型形成邏輯有著非常強大的支撐。 **“百度有世界上最大的搜尋引擎,搜尋引擎不僅資訊時效性很強,也有很高的準確率,可以構建最全的知識圖譜”,王海峰曾在公開採訪中解釋道。 **
在打造文心一言之前,百度沉澱了擁有超過50億實體、550億事實的多元異構超大規模的知識圖譜,能夠通過語言、聽覺、視覺等獲得對世界的統一認知。 其在2021年發佈的知識增強大模型——ERNIE(文心)3.0,正是文心一言的前身,該專案由吳甜主要負責。
又是2019年,百度文心1.0發佈,在4年時間里反覆運算了3個版本。 2022年11月,吳甜在公開峰會中同時公佈了文心已經累計的11個行業大模型,涵蓋電力、燃氣、金融、航天等領域,產業生態初步形成。
**這些,都為百度搶先發佈文心一言做了伏筆和鋪墊。 3月16日,文心一言發佈之後,百度再次回到鎂光燈下,但比肯定更多的,是質疑。 **
“市場需求這麼旺盛情況下,誰先做出來還是意義非常大的”,李彥宏曾在採訪里講到,即便產品並未完全成熟,但仍然要發佈的原因:“文心一言發佈之後,無數的人,過去不怎麼聯繫或者行業跟我隔得很遠的人都在問,我們怎麼能跟百度合作,怎麼儘早試用”。
**從技術的角度,大模型更是“越用越靈”的高速迭代。 **“內測的時候,員工問,文心一言怎麼藏頭詩寫不好? 我說等等吧,明後天估計就能學會了,結果第二天果然就能用了,大模型的進步也是一個不斷學習的過程“,王海峰笑道。
在半年時間里,文心一言從3.0到3.5,再到4.0版本進行了三次反覆運算,據王海峰在會上介紹,文心一言使用者規模已經達到4500萬,開發者5.4萬、場景4300個、應用825個、外掛程式超過500個。
在NLP澆的水,施的肥,終於在2023年迎來了豐收,也正如李彥宏所講,技術發展的路徑,是“一生二、二生三、三生萬物”的過程。
大模型背後的內功
通用人工智慧爆發之後,雲計算的關注度和企業重視程度到了頂峰,也隨即來到了“iPhone時刻”。
大模型的出現,產生了巨大的算力缺口,雲計算既為大模型提供雲算力支撐,又是大模型落地企業的最佳著落點,無論是百度還是任何一家擁有大模型的企業,當大模型面世,下一步的重點便是推向市場,讓企業用起來。
**對於百度而言,這樣的重擔,落在了沈抖肩上。 **
在百度的六大事業群負責人中,除了CTO王海峰,沈抖是唯一一個高級副總裁。 雖然同為技術出身,但和王海峰的“工程師”角色不同,沈抖從加入百度開始,就一直在負責關鍵業務的增長。
加入百度的10年裡,沈抖先後整合了廣告投放系統,提高了系統變現能力; 將搜索和feed資訊流進行結合; 整合了由搜索升級后的移動生態事業群,補齊了百度移動生態的版圖。
**如果說,王海峰打造了一把尖刀,那沈抖則是能利用這把尖刀,開拓疆土的先鋒官,用李彥宏的話說是“敢打硬仗、能打勝仗”。 **
2022年5月,沈抖輪崗為百度智慧雲(ACG)事業群總裁。 於百度而言,最開始並沒有全力押注雲計算,但也正是隨著人工智慧技術的不斷發展,讓百度意識到了雲計算短板后,開始暗自發力,默默培養第二增長曲線。
**由於沒有先發優勢,百度雲過去10年的目標都十分明確,不和“老炮”們比拼IaaS層的規模化,而是通過PaaS+SaaS與智慧化能力的結合,打出差異化,並以小搏大地切入企業數位化。 **
2023百度世界大會上中,沈抖再次提出“雲智一體”戰略:“人工智慧與雲計算的深度結合是企業快速落地AI原生應用的關鍵。 目前,百度集團所有應用和服務全部基於『雲智一體』技術架構運行在百度智慧雲上」。
在接手ACG后的5個月里,沈抖針對企業在大模型時代的核心需求,迅速整合出了“大模型服務超級工廠”——文心千帆,並按需求將用戶分為五大類使用者。
**首先,針對算力資源所產生的需求缺口,**千帆平臺提供各類異構算力。 比如在耗費最多訓練環節,通過分散式並行訓練和微秒級互聯能力,千帆平臺可以實現萬卡集群訓練加速比達到95%,有效訓練時間佔比達到96%,大幅降低客戶算力和時間成本。
**其次在模型層面,**對於希望直接調用已有大模型的客戶,企業可快速調用包括文心一言在內的多個大模型,同時千帆平臺提供中文增強、性能增強、上下文增強等工具。 據沈抖透露,目前千帆平台已經服務超過1萬7千家客戶。
**針對有二次開發需求的客戶,**千帆平臺為大模型提供再訓練、微調、評估和部署等全生命週期工具鏈,業界最多的41個高品質行業數據集,並針對自身業務場景快速優化。
大會現場還進行了如何基於檢索增強生成(RAG,Retri Augmented Generation)框架,為三一重工快速開發知識問答應用的實操演示:只需在千帆AI原生應用工作台中選擇預置的RAG框架,進行相應的參數配置等工作,就可以快速實現三一重工官網智慧客服應用的開發與上線。
**沈抖表示,搭建這樣一個「小助手」,即使需要處理幾千篇萬字長文檔,成本也只需幾百塊錢; 而之後使用者每次諮詢,成本僅需幾分錢。 **
一直以來,大型工業、製造業、農業都是數位化的深水區,核心原因就在於產業的複雜性導致了數位化的門檻高,難以落地。
但通過大模型,既降低了使用門檻,也降低了使用成本。 不需要打造任何新系統,也不需要人工參與,是技術元件的一個更高級的應用方式,**二者結合,也轉起了雲智一體的飛輪,逐步蓄力。 **
大模型的創新挑戰
過去已成定局,未來卻可以改變。
所有擁有了大模型的廠商,都發現了應用層的機會。 微軟在3月份就開始動刀包括Bing、Office、Windows系統在內的全線產品,阿裡張勇講道:“要用大模型把所有產品重做一遍”,然而這句話,說起來簡單,做起來卻是大模型時代最大的創新挑戰。
**AI如何重構應用? 這不僅要業務能力,更需要想像力,面對一個新的AI時代,百度也將指揮棒交到了年輕人手裡。 **
2022年5月之後,接替沈抖作為MEG事業群負責人的,是百度人才梯隊建設計劃中引入的80后副總裁——何俊傑。 如果說沈抖是“硬戰派”,那何俊傑就是名副其實的“少壯派”。 正如任正非所說,要“讓聽到炮聲的人指揮戰鬥”。
**重構應用,是不破不立,對比來看,百度對自己,確實“下手特別狠”。 **
百度世界大會,圍繞“生態”,何俊傑交出了“移動生態”、“內容生態”和“商業生態”的答卷。
其中,移動生態涵蓋了「新搜索」、「新文庫」、文心一言APP、百度電商「慧播星」等AI原生應用; 內容生態層面,通過百度APP「AI編輯器」等一系列應用為創作者生態賦能; 商業生態層面,推出AI Native行銷平臺「輕舸」。。 此外,何俊傑還公佈了文心一言外掛程式生態——“靈境矩陣”,現已全面開放。
**百度所定義的新搜索,正是延續了2010年李彥宏提出的框計算的邏輯。 **具備極致滿足、推薦激發和多輪交互三個特點。 即使用者搜索問題時,「不再給你一堆連結」,而是通過對內容的理解,生成文字、圖片、動態圖表等多模態答案; 推薦激發則可以即時推薦用戶關心的問題; 在針對複雜需求時,多輪交互可以通過提示、調整等方式,滿足用戶個人化的搜索需求。
AIGC的能力讓一部分百度老應用有了新的活力,比如百度文檔從內容檢索工具升級為了內容生產工具、百度編輯器成為了內容生成工具; 另一部分也探索了新的場景,比如百度輕舸通過AIGC一站式生成營銷內容並智慧投放,結合數位人生成平臺“慧播星”説明商家擴大行銷範圍和場景。
**同時,隨著大模型應用的逐步落地,百度也意識到憑藉一己之力終究有限,無限的是合縱而連橫。 **
這正是靈境矩陣的價值所在,這一平臺大大降低了大模型外掛程式開發的成本,讓有創意、有想法的普通人,也能成為外掛程式開發者。 李彥宏表示,外掛程式是一種特殊的AI原生應用,也是門檻最低,最容易上手的AI原生應用。
外掛程式的特點在於“萬能介面”,既可以連接搜索、小程式、內容平臺也可以連接任何入口,這樣“即插即用”的使用方式,能讓開發者、創作者快速加入到生態中。
何俊傑透露,上線一個月,靈境矩陣已經收到2.7萬個開發者註冊申請,覆蓋了20多個垂直領域,其中包括企業、機構和個人開發者。
一位百度內部人士告訴光錐智慧:「應用層的大模型外掛程式以靈境為主要平臺,會放在文心一言和百度App中。 千帆更偏底層調用,靈境更偏上層,甚至未來有可能在應用外掛程式層面會替代千帆“。
結語
2016年,李彥宏曾說,百度離破產只有30天。 “恐龍腳上踩到一個瓢,幾個小時以後他的腦子才能反應過來。 所以不管恐龍長到多大,都會滅絕」。
百度不想做恐龍,在意識層面,總是想著十步以外。
幸運的是,百度等到了新時代,度過了最艱難的時刻; 不幸的是,在這個新時代的開端,任何費勁心力的搶跑,都會在漫長的競爭下顯得微不足道。
但拿到了新的船票,至少是一個新的開始。
資料參考:
人工智慧各領域跨界能手——Transformer》
此行向遠:他們為人工智慧雕刻靈魂》