大模型不是巨頭的寵物

文章來源:虎嗅

作者:小溪

圖片來源:由無界 AI生成

百模大戰愈演愈烈,但很多從業者對大模型的疑問卻越來越多。

在基礎大模型領域,騰訊、阿裡、百度等多個互聯網巨頭湧入,且阿裡、百度、科大訊飛等大廠在最近一個月相繼發佈了最新版本的大模型產品,技術能力也有了較大提升; 創業公司在反覆運算新版本的同時,還在「瘋狂」融資,智譜AI於近日宣佈今年已累計獲得25億元融資,成立近半年的百川智慧已獲3.5億美元融資,這些創業公司的投資方中,也不乏騰訊、阿裡、美團等互聯網巨頭。

中國真的需要這麼多基礎大模型嗎? 各家基礎大模型公司都在瘋狂「卷」技術參數,但市場到底需要什麼樣的大模型? 在熱鬧且混亂的戰局下,這些問題被越來越多的人提出來。

回答這個問題,得先搞清楚基礎大模型在中國市場如何賺錢。 雖然絕大部分人對大模型的感知是聊天機器人,也有不少使用者在搜索資訊、整理文檔時開始使用這些產品,但相關企業難以從這些C端產品中賺到錢,甚至用戶規模越大企業虧損越多。 **當下,基礎大模型商業化最務實的方向還是在B端,服務於零售、金融、製造等領域企業降本提效,才能獲得穩定的商業收益。 **

企業對基礎大模型的需求無非3種:**直接調取大模型API,獲取相關大模型能力; 基於大模型,貼合實際業務進行二次開發; 基於大模型開發AI應用。 **這些需求考驗基礎大模型平臺的技術能力,更考驗其企業服務能力。

從服務能力上看,大模型初創公司和互聯網巨頭公司都要從零起步,沒有人擁有先天優勢。 能更快洞察到客戶需求,並提供穩定靠譜服務的平臺才能脫穎而出。

大模型不是“吹”出來的

以ChatGPT走紅為分界點,國內大模型的發展經歷了冰火兩重天。

在ChatGPT走紅之前,國內只有少量的公司在從事基礎大模型研發工作,因為大模型的技術以及服務能力還未被市場廣泛接受,這些公司主要專注於技術研發和服務能力積累上。 當ChatGPT走紅之後,大量投資者和從業者湧入,大模型成了新風口。

市場火爆就容易催生投機者,他們不是深入鑽研技術,而是講故事、炒作概念,不管技術和服務能力如何,先把故事講得天花亂墜,並以此獲得資本市場和客戶的認可。 一位大模型從業者層打趣地對虎嗅表示,國內很多大模型公司都稱自己和GPT-4的差距只有幾個月,這是因為他們都在已經開源GPT-2基礎之上做了一些訓練就出來講故事。

實際上,大模型的技術能力的進化並不是隨便訓練幾個月就能實現的,因為這是一個複雜的系統,規模大非常重要,規模不達到一定程度無法產生更智慧的進化。 而提升大模型的訓練規模,需要花費大量時間反覆調試。 調試過大模型訓練參數的技術人員都理解這種困難:沒有人告訴你應該怎麼做,只能自己摸索,這個過程中會出現各種各樣意想不到的狀況,都需要花時間解決。

在國內,真正在技術能力上有底氣的基礎大模型,都是在ChatGPT走紅之前就開始訓練了,那時候大模型還沒有被大家熟知,很多人看不懂也不看好大模型,而堅持投入大模型的公司都對新技術非常篤定。

比如,智源研究院在2020年發起首個超大規模預訓練模型研究專案“悟道”,其2.0版本一度成為全球最大的萬億級模型。 今年升級之後,「悟道」 涵蓋語言、視覺、多模態等基礎大模型,並已進入全面開源的階段。

智譜AI同樣在2020年就研發起了GLM預訓練架構,還訓練出了一個百億規模參數的模型GLM-10B。 10月27日,智譜AI發佈了自研第三代對話大模型 ChatGLM3,其性能、推理能力、上下文容量等都相較於上一代有較大提升。 與 ChatGLM2 相比,ChatGLM3在44個中英文公開數據集測試中,均排在國內同尺寸模型首位。 其中,MMLU提升36%、C提升33%、GSM8K提升179% 、BBH提升126%。

另外,在功能上,智譜AI發佈的多個國產自研大模型(ChatGLM、CodeGeeX、WebGLM、CogVLM等) 也是目前國內對標 OpenAI 系列大模型最完善的,且在生成式AI助手“智譜清言”上都是適用的。

這些最早一批做大模型的公司和炒概念、追風口的公司有本質區別。 在大模型技術還沒有爆火、市場還沒有那麼卷的時候,他們就投身其中,是因為把基礎大模型技術價值和生意邏輯都想明白了。 這種差別在大模型走紅之後也非常明顯,很多公司為了流量和話題度去涉足C端產品,而像智譜AI等最早一批涉足大模型的公司更聚焦在企業服務領域,所有的研發能力和服務能力也都圍繞這個思路去佈局,踏踏實實做積累,朝著為客戶創造價值的方向去發展。

**大模型的複雜性決定了技術和服務能力上積累時間更長的企業具備更強的優勢。 **當市場上越來越多人意識到大模型大模型的複雜性,以及大模型進化所需要的時間,那些靠講故事炒概念的大模型公司,生存空間將會越來越小,而認真積累技術和服務能力的公司才能經受住第一波競爭的考驗。

沒有繁榮生態的大模型,沒有未來

**在大模型商業化的過程中,誰能在具備社會剛需的應用場景落地,誰就能最先形成自我造血的良性迴圈。 **

通用大模型具有更廣泛的的應用範圍,但在解決垂直領域特定問題時並不夠專業。 垂直大模型解特定領域問題的能力更強,但服務範圍非常受限,這導致很多垂直大模型很難實現成本和商業收益的平衡,發展空間有限。

大模型應用的最終落點是要為生活和生產所用,能解決工作、生活中的實際問題,提升工作效率和生產力。 綜合目前通用大模型和垂直大模型的優劣勢,當下大模型商業化過程中一個更為合適的思路是,**通用大模型作為基座,把技術和服務能力開源給零售、金融、製造等領域,通用大模型和相關領域企業一起合作,共建應用場景。 **

受制於數據、算力、場景等限制,真正能跑通開源的大模型並不會太多。 同時,作為基礎技術底座,大模型的角色和PC、手機操作系統非常相似,將呈現“大樹底下,寸草不生”的競爭格局,即一兩個技術底座佔據行業統治地位,所有的應用開發者都要基於這一兩個技術底座開發。 如果基座大模型不能形成繁榮的生態,就沒有可持續發展的能力。

從PC、手機操作系統的發展歷史來看,先發優勢非常重要。 當Windows統治PC市場,iOS和Android在手機領域二分天下之後,其他操作系統很難再有翻盤的空間。

大模型領域同樣呈現一樣的趨勢。 大模型將開啟一個繁榮的AI應用生態,個人及企業的數據、能力或應用,都能快速變成AI外掛程式,增強大模型的能力,也將讓大模型更實用易用。

目前,百度、科大訊飛等巨頭公司已經致力於生態建設,百度智慧雲千帆大模型平臺2.0月活企業數近萬家,覆蓋了金融、教育、製造、能源、政務、交通等多個行業的400多個場景,科大訊飛的星火大模型平臺開發者規模已超70萬個。

一些在大模型領域積累較長時間的創業公司,也最早吃到了螃蟹。 智譜AI目前客戶數量超過1000家,共建生態的合作夥伴超100家,覆蓋傳媒、SaaS、教育、辦公等多個場景。 比如,WPS智慧文檔生成演示文稿內容、撰寫新聞稿等能力背後,就有智譜AI的技術能力作為支撐。

在各個大模型平臺的生態競爭中,最考驗平臺的就是其帶給合作夥伴的價值以及和合作夥伴共同成長的能力。 就以辦公場景來說,演示文稿內容生成、文章內容撰寫、風格改寫對大模型平臺的精度、推理等能力要求非常高,只有達到一定技術水準的大模型才有能力支撐這些應用,同時大模型平臺還需要根據使用者在實際應用中的反饋糾錯反覆運算。

**無論是巨頭公司還是創業公司,哪怕資金和資源實力再強,都要從零開始一步一個腳印的積累反覆運算。 **所以,大模型平臺在構建生態過程中,時間優勢顯得非常重要。 這也是具有先發優勢的創業公司和資金資源能力更強的互聯網大廠能夠旗鼓相當的原因。

**百模大戰,誰更適合中國市場? **

雖然百模大戰的戰局熱鬧且混亂,但背後的競爭方向已非常清晰,技術和服務能力以及大模型平臺構建生態的能力直接決定競爭的走向。

這些能力的構建需要時間積累,很難一蹴而就,但僅僅有時間的積累也是不夠的。 先發優勢,除了早行動帶來的時間差之外,還有精準洞察到市場需求的能力,即沿著一條正確的戰略堅定而快速地行動,戰略搖擺以及走彎路很容易把早行動積累的時間優勢全部損耗掉。

當越來越多大模型平臺都把重心轉移到生態建設上之後,平臺的戰略定力和執行力在生態的競爭將變得越來越重要,**誰能更高效地完成各個領域和場景從0到1的積累,誰的優勢就更加明顯。 **而當少數幾家平臺完成向超級平臺的質變之後,競爭格局也就基本確定下來。

在大而複雜的國內市場,B端服務企業很容易出現戰略搖擺以及走彎路的情況。 一方面,國內市場企業所處的區域、經營規模不同,對大模型給企業智慧化價值的認知有較大差異,願意投入的資源和付出的成本也各不相同,較難找到一個標準化的解決方案; 另一方面,不同領域企業對大模型能力的需求不同,甚至同一領域的不同企業對大模型的需求也不盡相同,在不同需求的撕扯下,大模型公司很容易從基礎技術底座變成專案外包公司,而很難成為真正的超級平臺。

在這樣的環境下,相比於OpenAI的商業化方案,國內大模型平臺的商業化落地需要更加註重細節。 在一些平臺的商業化思路上,我們看到了這樣的趨勢。

比如,除了常見的開放平臺API服務以外,智譜AI除了還提供了雲端私有化和本地私有化兩種方案。 **雲端私有化可協助企業基於私有數據打造專屬大模型,擁有更強的安全性,而本地私有化是中國市場獨有的方案,除了提供更加強大的模型,還提供完整的模型矩陣,以滿足各種場景和需求。 **

針對本文生成、智慧客服、數據標註等不同的客戶需求以及大中小型企業的需求規模,智譜AI都提供了不同的解決方案,客戶可根據自己的需求自由組合。 這種更細節更靈活的服務模式,也是基於長期對中國市場的精準洞察而來的。

面對外部環境的不確定性,智譜AI還啟動了國產晶片適配計劃,和國內硬體廠商、晶元廠商合作,面對不同類型的使用者不同類型的晶元提供不同等級的認證和測試,讓大模型服務更安全可靠。 當前,ChatGLM系列已支援10餘種國產硬體生態,包括昇騰、神威超算、海光DCU、海飛科、沐曦曦雲、算能科技、天數智芯、寒武紀、摩爾線程、百度崑崙芯、靈汐科技、長城超雲,同步發佈的可手機部署的端測模型ChatGLM3-1.5B和3B支援小米、vivo、三星等多種手機以及車載平臺。

在百模大戰的戰局越是激烈,這些看似不起眼的細節就越重要,因為這些細節決定了外部合作夥伴的認可程度,也關係著大模型在不同場景下的落地速度。 **單純發佈一個大模型的門檻,沒有市場想像那麼高,但能夠擁有高質量數據場景,才能持續反覆運算,形成競爭壁壘,**而高品質數據場景的關鍵就在於外部合作夥伴——讓更多合作夥伴願意選擇的平臺,更容易跑通這個商業迴圈。

在這場競爭中,很多從業者認為贏家一定是資源和資金能力更強的巨頭公司,其實不然。 創業公司和巨頭公司都需要身體力行,深耕細節,沒有任何捷徑。 至於資金,並不是決定戰局的根本,因為有核心競爭力的創業公司也並不會缺錢——即使智譜AI目前已獲得大模型創業公司最高額的融資,還有更多新的投資者想入局。

如果換一個角度思考,其實對於誰是更適合中國企業的基座大模型,資本市場已經在用腳投票了。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)