生成式AI，能否生成百度的未來？

Question

原文來源：光錐智慧作者：劉雨琦![](https://appserversrc.8btc.cn/DBADA82E83F535A509DA39CCFDC9590F/1698037706/FvNewvr1b4JOXPK2pTiF7Hs-OSwt.png) 圖片來源：由無界AI生成大風始於青萍之末，命運的偶然和必然經常會縱橫交織在一起。2019年，是整個人工智慧歷史上，最為晦暗的一年。 繼2016年AlphaGo打敗李世石，2017年Tansformer架構橫空出世使得技術大規模爆發，2018年的創業熱潮之後。 2019年，資本退潮、技術瓶頸期、場景難落地，開啟了人工智慧史上的“亂紀元”。**沒有人知道通用人工智慧何時到來，就像三體人不知道太陽會在何時升起。 **那一年，大批AI公司陷入裁員風波、資金鏈斷裂、產品難產，能堅持至今的，所剩寥寥。但也正是在2019年，AI新的希望開始孕育：OpenAI在7月接受了微軟的投資並與其深度合作，如今讓世人震驚的GPT-3正是從那一年開始研發; 國內最早樹立AI戰略的百度，從年初就開始進行了一次長達半年的人事調整，如今看來，重新排兵布陣，似乎是開啟了長達4年的堅守期。2019年，王海峰晉陞為集團CTO，繼續擔任AI技術平台體系（AIG）和基礎技術體系（TG）總負責人，兩者是百度最重要的技術底座; 沈抖晉陞為高級副總裁，全面負責移動生態事業群，隨後在2022年又調任至百度智慧雲，成為百度第二增長曲線的開拓者; 而在2019年引進的一批新生力量中，何俊傑是唯一一名80后百度副總裁，先是負責投資併購和戰略投資，后又被重用，負責沈抖空缺出來的移動生態事業群，實權更加在握。時間來到了2023年，Transformer的能力在這一年終於由OpenAI打破了天花板，進階到一個新的層次，技術的突破讓OpenAI一舉成為全世界最受矚目的公司。 微軟蓋過了谷歌的科技光輝。**在過去四年裡，百度的核心業務形成了由沈抖領軍智慧雲，何俊傑負責移動生態，王海峰壓陣技術的三角結構，百度也終於結束了靜默期，開始轉守為攻，動作不斷。 **“重新把每個應用都做一遍”，是經歷了半年蓄力后的第一次亮劍，如今的百度像一顆行星，即將遇到巨大的“技術引力場”，而徹底改變軌道。  ## **大模型湧現前夜**  2017年，谷歌在一篇名為《Attention Is All You Need》的論文中，提出了Transformer架構，以替代傳統的RNN和CNN迴圈模型，論文中展示了Transformer的訓練準確性高於之前所有模型，訓練時間明顯低於之前的模型，在訓練集內容較少時訓練效果也很好。這之後，Transformer架構迅速被接受並應用在了NLP和CV領域，尤其在NLP領域，注意力機制讓機器能夠更準確地理解語義並生成，以及減少信息重複。作為最早一批發現並跟進Transformer技術路線的公司，百度已經在NLP領域研究超過十年之久，並已經組成了一支由王海峰、吳甜、吳華等頂尖專家組建起來的精悍的NLP隊伍。  ![](https://appserversrc.8btc.cn/FhTRwYIHYgPnpuLO5sCvdnaZDsed) 王海峰彼時，NLP團隊成立的第一個重要任務，是打造百度翻譯。 王海峰將深度學習和神經網路大膽應用在翻譯中，加強機器對上下文的理解，形成更流暢的譯文。 這一勇敢嘗試也讓百度翻譯成為第一個支援200多種語種的翻譯系統，甚至比Google還早了一年零3個月。**這也是大模型四大核心能力“理解、生成、邏輯、記憶”中，理解能力的雛形。 **但王海峰覺得，NLP還不夠。 他專門跑到李彥宏辦公室去做彙報，提出了下個「登陸的諾曼第」——語音識別。 他的理由是，語音辨識技術馬上要到產業化的臨界點，一旦突破很快就會大規模商用。李彥宏憑藉著自己對技術的判斷，決定再次支援王海峰，陸續建立了與NLP部門平行的「語音辨識部門」、「圖像識別部門」和「知識圖譜部門」。。王海峰的一通操作讓很多百度的同學不解，「這些技術和百度現在的產品也沒關係啊，一股腦創建這麼多部門，是攢著過年嗎？ ”彼時的王海峰，正是看到了搜索數據對於大模型形成邏輯有著非常強大的支撐。 **“百度有世界上最大的搜尋引擎，搜尋引擎不僅資訊時效性很強，也有很高的準確率，可以構建最全的知識圖譜”，王海峰曾在公開採訪中解釋道。 **在打造文心一言之前，百度沉澱了擁有超過50億實體、550億事實的多元異構超大規模的知識圖譜，能夠通過語言、聽覺、視覺等獲得對世界的統一認知。 其在2021年發佈的知識增強大模型——ERNIE（文心）3.0，正是文心一言的前身，該專案由吳甜主要負責。![](https://appserversrc.8btc.cn/FgWtREPG9ssBAAk4ja11U0LPsi1q) 吳甜又是2019年，百度文心1.0發佈，在4年時間里反覆運算了3個版本。 2022年11月，吳甜在公開峰會中同時公佈了文心已經累計的11個行業大模型，涵蓋電力、燃氣、金融、航天等領域，產業生態初步形成。**這些，都為百度搶先發佈文心一言做了伏筆和鋪墊。 3月16日，文心一言發佈之後，百度再次回到鎂光燈下，但比肯定更多的，是質疑。 **“市場需求這麼旺盛情況下，誰先做出來還是意義非常大的”，李彥宏曾在採訪里講到，即便產品並未完全成熟，但仍然要發佈的原因：“文心一言發佈之後，無數的人，過去不怎麼聯繫或者行業跟我隔得很遠的人都在問，我們怎麼能跟百度合作，怎麼儘早試用”。**從技術的角度，大模型更是“越用越靈”的高速迭代。 **“內測的時候，員工問，文心一言怎麼藏頭詩寫不好？ 我說等等吧，明後天估計就能學會了，結果第二天果然就能用了，大模型的進步也是一個不斷學習的過程“，王海峰笑道。在半年時間里，文心一言從3.0到3.5，再到4.0版本進行了三次反覆運算，據王海峰在會上介紹，文心一言使用者規模已經達到4500萬，開發者5.4萬、場景4300個、應用825個、外掛程式超過500個。在NLP澆的水，施的肥，終於在2023年迎來了豐收，也正如李彥宏所講，技術發展的路徑，是“一生二、二生三、三生萬物”的過程。  ## **大模型背後的內功**通用人工智慧爆發之後，雲計算的關注度和企業重視程度到了頂峰，也隨即來到了“iPhone時刻”。大模型的出現，產生了巨大的算力缺口，雲計算既為大模型提供雲算力支撐，又是大模型落地企業的最佳著落點，無論是百度還是任何一家擁有大模型的企業，當大模型面世，下一步的重點便是推向市場，讓企業用起來。**對於百度而言，這樣的重擔，落在了沈抖肩上。 **![](https://appserversrc.8btc.cn/FjCmvqTOibmKGDR-sfOKJ2EDyWPj) 沈抖在百度的六大事業群負責人中，除了CTO王海峰，沈抖是唯一一個高級副總裁。 雖然同為技術出身，但和王海峰的“工程師”角色不同，沈抖從加入百度開始，就一直在負責關鍵業務的增長。加入百度的10年裡，沈抖先後整合了廣告投放系統，提高了系統變現能力; 將搜索和feed資訊流進行結合; 整合了由搜索升級后的移動生態事業群，補齊了百度移動生態的版圖。**如果說，王海峰打造了一把尖刀，那沈抖則是能利用這把尖刀，開拓疆土的先鋒官，用李彥宏的話說是“敢打硬仗、能打勝仗”。 **2022年5月，沈抖輪崗為百度智慧雲（ACG）事業群總裁。 於百度而言，最開始並沒有全力押注雲計算，但也正是隨著人工智慧技術的不斷發展，讓百度意識到了雲計算短板后，開始暗自發力，默默培養第二增長曲線。**由於沒有先發優勢，百度雲過去10年的目標都十分明確，不和“老炮”們比拼IaaS層的規模化，而是通過PaaS+SaaS與智慧化能力的結合，打出差異化，並以小搏大地切入企業數位化。 **2023百度世界大會上中，沈抖再次提出“雲智一體”戰略：“人工智慧與雲計算的深度結合是企業快速落地AI原生應用的關鍵。 目前，百度集團所有應用和服務全部基於『雲智一體』技術架構運行在百度智慧雲上」。  ![](https://appserversrc.8btc.cn/Fu5bDbrS2klVTaxWZlwMjIBZJdkP) **據光錐智能觀察，雲智一體戰略的核心在於，一方面，以百度智慧雲為依託，可以快速為企業提供整套的大模型服務; 另一方面，大模型也推動著企業數位化的門檻變得更低。 **在接手ACG后的5個月里，沈抖針對企業在大模型時代的核心需求，迅速整合出了“大模型服務超級工廠”——文心千帆，並按需求將用戶分為五大類使用者。**首先，針對算力資源所產生的需求缺口，**千帆平臺提供各類異構算力。 比如在耗費最多訓練環節，通過分散式並行訓練和微秒級互聯能力，千帆平臺可以實現萬卡集群訓練加速比達到95%，有效訓練時間佔比達到96%，大幅降低客戶算力和時間成本。**其次在模型層面，**對於希望直接調用已有大模型的客戶，企業可快速調用包括文心一言在內的多個大模型，同時千帆平臺提供中文增強、性能增強、上下文增強等工具。 據沈抖透露，目前千帆平台已經服務超過1萬7千家客戶。**針對有二次開發需求的客戶，**千帆平臺為大模型提供再訓練、微調、評估和部署等全生命週期工具鏈，業界最多的41個高品質行業數據集，並針對自身業務場景快速優化。大會現場還進行了如何基於檢索增強生成（RAG，Retri Augmented Generation）框架，為三一重工快速開發知識問答應用的實操演示：只需在千帆AI原生應用工作台中選擇預置的RAG框架，進行相應的參數配置等工作，就可以快速實現三一重工官網智慧客服應用的開發與上線。**沈抖表示，搭建這樣一個「小助手」，即使需要處理幾千篇萬字長文檔，成本也只需幾百塊錢; 而之後使用者每次諮詢，成本僅需幾分錢。 **一直以來，大型工業、製造業、農業都是數位化的深水區，核心原因就在於產業的複雜性導致了數位化的門檻高，難以落地。但通過大模型，既降低了使用門檻，也降低了使用成本。 不需要打造任何新系統，也不需要人工參與，是技術元件的一個更高級的應用方式，**二者結合，也轉起了雲智一體的飛輪，逐步蓄力。 **  ## **大模型的創新挑戰** 過去已成定局，未來卻可以改變。所有擁有了大模型的廠商，都發現了應用層的機會。 微軟在3月份就開始動刀包括Bing、Office、Windows系統在內的全線產品，阿裡張勇講道：“要用大模型把所有產品重做一遍”，然而這句話，說起來簡單，做起來卻是大模型時代最大的創新挑戰。**AI如何重構應用？ 這不僅要業務能力，更需要想像力，面對一個新的AI時代，百度也將指揮棒交到了年輕人手裡。 **2022年5月之後，接替沈抖作為MEG事業群負責人的，是百度人才梯隊建設計劃中引入的80后副總裁——何俊傑。 如果說沈抖是“硬戰派”，那何俊傑就是名副其實的“少壯派”。 正如任正非所說，要“讓聽到炮聲的人指揮戰鬥”。**重構應用，是不破不立，對比來看，百度對自己，確實“下手特別狠”。 **百度世界大會，圍繞“生態”，何俊傑交出了“移動生態”、“內容生態”和“商業生態”的答卷。其中，移動生態涵蓋了「新搜索」、「新文庫」、文心一言APP、百度電商「慧播星」等AI原生應用; 內容生態層面，通過百度APP「AI編輯器」等一系列應用為創作者生態賦能; 商業生態層面，推出AI Native行銷平臺「輕舸」。。 此外，何俊傑還公佈了文心一言外掛程式生態——“靈境矩陣”，現已全面開放。**百度所定義的新搜索，正是延續了2010年李彥宏提出的框計算的邏輯。 **具備極致滿足、推薦激發和多輪交互三個特點。 即使用者搜索問題時，「不再給你一堆連結」，而是通過對內容的理解，生成文字、圖片、動態圖表等多模態答案; 推薦激發則可以即時推薦用戶關心的問題; 在針對複雜需求時，多輪交互可以通過提示、調整等方式，滿足用戶個人化的搜索需求。![](https://appserversrc.8btc.cn/Fkw8TzLMuSm4gG8zfj_Y8aZ4PCHw) 需求到匹配的過程，也稱之為「端到端」搜索，但這會打破百度曾經賴以生存的競價排名模式，廣告收入也是一直以來百度最大的現金牛，自己革自己的命並不簡單，百度後面還有一場硬仗要打。AIGC的能力讓一部分百度老應用有了新的活力，比如百度文檔從內容檢索工具升級為了內容生產工具、百度編輯器成為了內容生成工具; 另一部分也探索了新的場景，比如百度輕舸通過AIGC一站式生成營銷內容並智慧投放，結合數位人生成平臺“慧播星”説明商家擴大行銷範圍和場景。**同時，隨著大模型應用的逐步落地，百度也意識到憑藉一己之力終究有限，無限的是合縱而連橫。 **這正是靈境矩陣的價值所在，這一平臺大大降低了大模型外掛程式開發的成本，讓有創意、有想法的普通人，也能成為外掛程式開發者。 李彥宏表示，外掛程式是一種特殊的AI原生應用，也是門檻最低，最容易上手的AI原生應用。外掛程式的特點在於“萬能介面”，既可以連接搜索、小程式、內容平臺也可以連接任何入口，這樣“即插即用”的使用方式，能讓開發者、創作者快速加入到生態中。何俊傑透露，上線一個月，靈境矩陣已經收到2.7萬個開發者註冊申請，覆蓋了20多個垂直領域，其中包括企業、機構和個人開發者。一位百度內部人士告訴光錐智慧：「應用層的大模型外掛程式以靈境為主要平臺，會放在文心一言和百度App中。 千帆更偏底層調用，靈境更偏上層，甚至未來有可能在應用外掛程式層面會替代千帆“。  ## **結語**2016年，李彥宏曾說，百度離破產只有30天。 “恐龍腳上踩到一個瓢，幾個小時以後他的腦子才能反應過來。 所以不管恐龍長到多大，都會滅絕」。百度不想做恐龍，在意識層面，總是想著十步以外。幸運的是，百度等到了新時代，度過了最艱難的時刻; 不幸的是，在這個新時代的開端，任何費勁心力的搶跑，都會在漫長的競爭下顯得微不足道。但拿到了新的船票，至少是一個新的開始。**資料參考：**人工智慧各領域跨界能手——Transformer》此行向遠：他們為人工智慧雕刻靈魂》