別光盯著大模型，此刻AI的前途前所未有依賴於雲

巴比特_

2023-11-01 07:07:33

原文來源：矽星人

圖片來源：由無界 AI生成

**雲！ **

如果每天看媒體上關於大模型的報導，你會被各式各樣的模型和曇花一現的嚇人應用迷亂了眼睛，以為模型的未來就在下一個一統全域的全能模型身上。所以AI這事似乎就是OpenAI或者Anthropic 們中的一個最終勝出的故事。

那些以驚人速度和額度完成的融資也似乎證明著這樣的觀感。

被視為OpenAI最大對手之一的Anthropic，在以20億為單位，月為週期的一輪輪融資——10月27日，谷歌表示已經向其再次投資20億美元，此前的一個月不到亞馬遜剛向其投資了40億美元，它的以上下文長度等特性為競爭點的模型Claude被認為是ChatGPT最有力的競爭者之一。而與此同時，OpenAI也在集結各種資源，它的一舉一動背後，軟銀，微軟，蘋果都以各種方式與它傳著緋聞。

然而事實上這並不是事情的全部。

對於從業者來說，故事的另一面，其實體悟更加深刻：

當紅炸子雞們面對的有錢有意願者眾多，看似充滿自由選擇，顯然拿那些錢多事少的投資者的美金是更好的選擇，然而，他們最終卻都紛紛選擇了大廠，甚至是對他們虎視眈眈的大廠，只因一件事——他們有雲計算能力。 OpenAI成功路上微軟Azure的貢獻被說過太多次，Anthropic現在更是同時給自己保證了谷歌和亞馬遜的雲算力支援，它表示，融資很重要的目的之一是要為自己構建算力保障來訓練下一代的模型。

這是大模型對雲的需求的絕佳證明。

在10月31日的雲棲大會上，阿裡雲的一系列數據也在講著同樣的事情。

阿裡雲公佈了跑在它的服務之上的部分模型，從自己的通義大模型，到百川智慧、智譜AI、零一萬物、崑崙萬維、vivo、復旦大學等，中國一半大模型公司和機構在此訓練。

而這些中國頭部主流大模型，也都在通過阿裡雲對外提供API服務，包括通義系列、Baichuan系列、智譜AI ChatGLM系列、姜子牙通用大模型等。

這些模型追趕著頂尖水準同時，也開始長出自己各自的特點，其中中國最頭部的大模型公司之一百川智慧，曾創下平均28天反覆運算一版大模型的紀錄，它10月30日最新發佈的Baichuan2-192K更是成為全球支援最長上下文視窗的大模型，一次可輸入35萬字，全面領先Claude2-100K。

這些優勢都指向更接地氣的應用。百川智慧CEO王小川把此形容為“理想慢一步，落地快三步”。而雲的基礎設施則提供了快的可能。

王小川介紹，百川大模型實現月度反覆運算的一個重要原因是雲計算的支撐。模型的快速反覆運算和部署離不開雲計算，百川智慧和阿裡雲進行了深入合作。在雙方的共同努力下，百川很好地完成了千卡大模型訓練任務，有效降低了模型推理成本，提升了模型部署效率。 ”

雲計算的重要性有些被人們忽視的另一個原因，則是AI領域被“全民缺卡”分散走了大量注意力。

“人們太過關注GPU了。” 不少大模型從業者對我表示，作為一個計算單元它的確在不停增強，但要解決ai的問題最終需要的是系統化的最優的算力方案。甚至雲從誕生起就是解決單一單元能力不夠強的問題的一個東西。

“只有卡，只有在論文裡驚豔的模型，都不夠，最終靠雲來落地然後實現理想。” 他說。如果你仔細豎起耳朵聽聽這些真正的模型生態一線的參與者的“呐喊”，那麼可能就會聽到一個字：

雲！

AI的未來如何發展，在今天比任何時候都更取決於雲。

一朵新的雲

但這絕對並不意味著已經建立起優勢的雲廠商就能躺贏。

看一看最近谷歌與微軟同日發佈財報後發生的事情就會知道。

10月25日谷歌發佈了營收超預期的財報，同比增長11%，核心廣告業務也增長了9%。但之後股價卻應聲下跌了。原因只有一個，雲計算增長了22%，但市場認為還不夠。尤其是微軟在同日發佈的財報顯示，其智慧雲部門成為最大收入來源。

巨頭們發現，自己曾經被津津樂道的廣告等業務被放在一邊，市場第一次對雲計算的情況如此在意，因為與尚且虛無縹緲的模型直接帶來的收入相比，雲計算被認為是可以觀測的指標。這個指標背後指向雲廠商面對AI帶來的挑戰時自身的應變能力。

就連份額第一的AWS也感受到了壓力，亞馬遜對於Anthropic的投資也發生在這幾份財報期間。有報導稱，微軟Azure的收入已經有3%來自AI，它的客戶包括OpenAI的大量使用者，AWS則開始強調它對各類模型的服務。給Anthropic砸了20億后，立刻宣佈這家模型公司之後的LLM將用AWS的訓練加速晶元Trainium和推理晶元Inferentia來打造。此外，像微軟財報中強調的新的集群方案，AWS全託管的基礎模型服務Bedrock等，也都在強調著自己為新的AI需求而做的改造。

“面向智慧時代，阿裡雲將通過從底層算力到AI平臺再到模型服務的全棧技術創新，升級雲計算體系。” 決定著阿裡雲技術路線的周靖人在雲棲大會上也給出了他的答案。阿裡雲此次體現出的改變果斷而透徹，從肌理到內核面向AI全部改造。

根據周靖人的介紹，阿裡雲首先用大模型對自己進行了改造，有超過30款雲產品接入了大模型能力。

例如，阿裡雲大數據治理平臺DataWorks新增了全新的交互形態——Copilot，使用者只需用自然語言輸入即可生成SQL，並自動執行相應的數據ETL操作，整體開發與分析可提效30%以上。

周靖人形容這是雲計算的自動駕駛模式，將大幅提升開發者用雲的效率和體驗。

同時，阿裡雲還升級了人工智慧平臺PAI。 PAI底層採用HPN 7.0新一代AI集群網路架構，支持高達10萬卡量級的集群可擴展規模，超大規模分散式訓練加速比高達96%，遠超業界水準; 在大模型訓練任務中，可節省超過50%算力資源，性能全球領先。

這些專業術語略顯複雜，用直白的客戶案例來解釋，當天周靖人也分享了一些案例：「通過我們的PAI平臺，能夠説明推理的優化，能夠説明小紅書節約成本30%，能夠真正意義上推動小紅書快速的業務增長，以及各種各樣的業務需求。 ”

包括阿裡雲在內的雲廠商們本質上在做的是摸索新的基礎設施。大模型等AI技術帶來的改變是全棧的，從模型底層到訓練思路，從數據需求到交互介面，都在變化，甚至需要“重做”，此前有從業者就表示，某種意義上，哪怕是GitHub等現在依然發揮重要作用的平臺等，也是上一個時代的產物，新的時代需要的新的基礎設施也要完成全棧改造。

阿裡雲一切改造的出發點，就是周靖人早早提出的MaaS（model as a Service ）。

模型本身就是數據和計算高級的抽象。” 周靖人在當天和我們的小範圍交流里說。

“舉個例子，以前我們用的更多是日誌或者資料庫的數據。模型是什麼？模型是加工過後的數據集合，這是一個高度知識的抽象。所以從這個角度來講，大家可以想原始的數據是更原始的生產材料，依賴於原始的算力。而今天模型是一個加工層，是基於數據原材料產生的更加抽象的生產元素，大家可以利用這樣的生產元素去做更高維的業務系統開發。以前我們有Infrastructure，這是一個生產元素，今天模型也是一個生產元素。 ”

這種圍繞模型的新的基礎設施，需要比過去更複雜的系統能力。

在AI應用上的門檻越來越低的同時，提供符合新AI時代需求的雲計算的門檻只會越來越高。要探索這個新的東西顯然需要對雲計算的核心技術的掌握，需要對大模型的技術有真正上手過的理解——知道自己有什麼，也知道客戶需要什麼。

“基於我們在雲計算的積累，我們已經搭建了完善的AI基礎設施。通過今天我們對網路、存儲、調度、編譯、容錯等等方面一系列的優化。我們建立了完善的AI大模型的訓練平臺。 “周靖人表示。” 同時，通過我們一系列優化再結合雲本身的高彈性，能夠為大家提供一個非常完善的模型訓練及推理的服務。 ”

而在當天，阿裡雲還發佈了自研的千億級參數大模型通義千問2.0。

通義千問2.0在性能上取得巨大進步，在複雜指令理解、文學創作能力、通用數學能力、知識記憶、幻覺抵禦等能力維度上顯著提升，綜合性能已經超過GPT-3.5，加速追趕GPT-4。

阿裡雲還發佈了通義千問APP，使用者可直接體驗通義千問2.0;同時，通義大模型官網全面更新，新增多模態交互和外掛程式功能，使用者除了可通過圖片與通義千問2.0交互外，還能調用更多豐富的外掛程式新能力。

周靖人表示，「通義千問2.0更成熟了，也更好用了」。。

開放，開放，還是開放

改造如此全面，自然也就帶來一個疑問：既做模型也做基礎設施最終會不會變成既做裁判又做運動員的局面。

阿裡雲給出的答案是最大程度的開放。

阿裡雲是國內最早開源自研大模型的科技公司，目前，阿裡雲已開源通義千問7B、14B版本，下載量突破百萬。在現場，周靖人宣佈通義千問72B模型即將開源，將成為中國參數最大的開源模型。

其實這種開放也不是ChatGPT之後的事情。在一年前的雲棲大會上，阿裡雲開始建設模型社區魔搭，其實當時最早一批開源的正是阿裡雲自己的核心模型。當時魔搭的計劃就是通過阿裡雲自己交出壓箱底的東西來帶動大家改變AI過去封閉的狀態，用開放來真正讓它走向大眾。

周靖人透露，魔搭社區今天現已聚集2300多款AI模型，吸引280萬名AI開發者，AI模型下載量突破1億，成為中國規模最大、開發者最活躍的AI社區。這個成績是外界對它開放這件事最直接的認可。

今天在魔搭社區上，百川智慧、智譜AI、上海人工智慧實驗室、IDEA研究院等已經開源首發他們的核心大模型，阿裡雲則為開發者們“嘗鮮”大模型提供免費GPU算力，截至目前已超3000萬小時。

“我們今天的定位就是服務好各種不同需求的客戶。” 周靖人表示。

在阿裡雲的生態里，有與復旦大學共同打造的超級計算機，它支援千億參數的大模型訓練，總體算力規模躋身全球前15名。其背後的計算集群由復旦校內的「近思一號」和1500公裡外阿裡雲烏蘭察布數據中心的「切問一號」相連組成。

有自研大模型的vivo，從算力和平臺功能、訓練性能等，到阿裡雲人工智慧平臺PAI在大模型SFT監督微調和強化學習方面的訓練優化框架，vivo通過和阿裡雲的合作來更高效反覆運算大模型。

也有火遍全網的「妙鴨相機」，其相片生成在高峰期量級至少需要幾千台GPU伺服器，線下部署不切實際，雲上部署能為創業公司節省大量成本和時間。而且，妙鴨這樣的應用更是代表著一個趨勢，就是未來推理的需求會大過訓練的需求，這隻會讓雲計算對AI服務的可持續變得更加關鍵。

這樣的一個定位之下，阿裡雲的大模型更像是阿裡過往總在使用的一個思路的延續——最佳實踐。它的思考是，只有自己做過最複雜的任務，用它考驗了自己的基礎設施，才能向外提供更靠譜的服務和技術。而這些努力背後所有的一切最終都為了一個目標——推動AI產業化。

在這樣的目標下，阿裡雲還發佈了阿裡雲百煉，這是一個一站式大模型應用開發平臺。阿裡雲體系化的開放的集大成者。

阿裡雲稱，基於它開發者可在5分鐘內開發一款大模型應用，幾小時即可“煉”出一個企業專屬模型。這裡集成了包括阿裡雲通義大模型系列及國內外諸多三方主流大模型，在幫助開發者選擇最合適自己的模型后，它還提供SFT、LoRA等多種微調方式，讓你能微調自己的模型。訓練完成還可以通過阿裡雲一鍵部署。開發應用也大大簡化，甚至最新的agent和其他外掛程式等供用戶選擇。

“每一個環節、每一個人群都是今天整個開發者生態的重要的組成部分。” 周靖人表示。

“我們的目標是把阿裡雲做成一個最開放的雲，我們希望今天阿裡雲不能只服務一類客戶，我們今天所有的客戶、各個提到各種各樣的客戶，都能夠有效的為他們提供人工智慧時代的支援，能夠幫助到他們去在自己擅長的領域去做創新、去突破。這是我們的目標，也是今天我們產品設計背後的一個思考。 ”

在“理想落後一步”的今天，熱鬧的模型生態不僅在實際的發展里需要雲，而且雲計算對中國科技公司們的啟發也對今天的AI和模型從業者無比重要。

中國的雲計算發展歷程一直有一種象徵意義，就是當我們有強大的技術開發人才和最廣泛的產業應用需求時，如何自發的向下掌握底層技術。而當你處於一定技術后發劣勢時，這樣的機會只會出現在大的技術體系全面變革時。

而當新的技術革命再次到來，底層技術再次需要重構時，雲計算成了中國的模型繼續和先進同行掰手腕的底氣和本錢，也是啟發和警示。在今天AI產業和應用加速的同時，有一個我們自己的最前沿水平的技術底座，並基於它形成一種開放和某種意義上互助的關係，對於整個生態一起進步將變得都很重要，對於時刻提醒我們如何把握這一次技術革新也很重要，它甚至有希望在不斷努力下變成這場競爭里的優勢。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。