英偉達提前斷供高端晶元,中國企業算力大突圍

原文來源:矽基研究室

圖片來源:由無界AI生成

10月17日,美國商務部工業和安全域(BIS)發佈了針對晶元的出口禁令新規,更加嚴格的限制了中國購買重要的高端晶元。

限制中國進口高端晶元,無疑是為了鉗制中國科技產業的發展。 此前有研究表明,計算力指數平均每提高1點,數字經濟和GDP將分別增長3.5‰和1.8‰。

**然而外部限制的收緊,並沒有造成中國算力產業的停滯,當前,中國算力產業邁過了萬億規模的大關。 **據中國資訊通信研究院測算,2021年底,中國算力核心產業規模就已經超過了1.5萬億元,關聯產業規模超過8萬億元。

萬億市場背後,是企業和政府協力搶灘AI時代。

一方面,從ChatGPT面世以來,國內各企業和研究院在短短半年多的時間內先後推出了超過130款大模型,其中領跑玩家已經開始著手於將大模型應用於特定場景,打造爆款應用。

另一方面,為了構築算力底座,各地政府紛紛上馬智算中心建設,鋪設大數據時代的資訊高速,推動產業創新升級,降低企業調用以大模型為代表的科技成果的成本。

外部晶元貿易逐漸降溫,內部算力市場星火燎原,冰火兩重天之間,不禁令人好奇:

中國算力產業的突圍戰到底攻到哪一城了? 算力產業鏈如何破局? 這個過程中又是哪些企業承擔起了開路先鋒的責任?

**01 英偉達斷供,影響幾何? **

“若以大語言模型作為底座,同時處理我國14億人的推理請求,所需的計算量超過目前我國數據中心總算力的3個數量級。 ”

今年7月的上海2023年世界人工智慧大會(WAIC)上,清華大學電子工程系教授汪玉的言論,透露出了國內算力缺口的規模。

其實不光是大模型,5G、智慧城市、物聯網等領域多樣化應用的普及,同樣帶來了數據生成速度的不斷加快。

IDC預計,2026年中國智慧算力規模將達到1271EFLOPS,複合年均增長率為69.45%。 而截至2022年年底,新華三集團聯合中國資訊通信研究院編製的《2023智慧算力發展白皮書》顯示,國內的算力總規模僅180EFLOPS。 (注:FLOPS是指的是每秒浮點運算次數,1271EFLOPS意味著每秒進行1271百億億次運算。 )

**為了解決算力短缺的現狀,國家先後出臺了多部檔支持、引導各地加快建設算力基礎設施。 **

其中,於10月份發佈的《算力基礎設施高品質發展行動計劃》明確提出,算力規模將於2025年超過300EFLOPS,其中可用於大模型訓練的智慧算力佔比需達到35%。

目前,政府出資的智算中心約有31個,對應規劃中的總算力為10.13EFLOPS,總投資額近470億元,與規劃中的總智算算力規模105E、50個智算中心、單中心算力規模2.1EFLOPS仍有較大差距。

**其實不光是國內,全世界都算力短缺。 按照OpenAI數據估算,模型計算量增長速度與人工智慧硬體算力增長速度之間,存在萬倍差距。 **

算力短缺首先促成了GPU價格的飛漲。 從去年12月開始,英偉達A100的價格在5個月內上漲近4成。 今年新推出的H100更是有市無價。

由於大量訂單湧入,目前市佔率最高的GPU廠商英偉達的交貨週期已經從一個月被延長到了三個月以上,甚至部分訂單可能要到2024年才能交付。 究其原因,主要是因為晶元供應鏈長且分散,無法迅速擴大產能。

**由於美國禁令的限制,國內廠商擴大算力的計劃相比谷歌、Meta、OpenAI更難實現。 **

在公佈新一輪禁令之前,英偉達通過向中國市場供應降低了互聯速度的「閹割版」旗艦計算晶元A800和H800來適應性限制規則。

今年8月曾有媒體報導,百度、騰訊、阿裡巴巴和位元組跳動等企業向英偉達訂購了50億美元的晶元。 其中,已下單10億美元的A800,預計將於今年交付。 剩餘的40億美元訂單,將於2024年交付。

而本次禁令公佈后,由於把性能密度作為限制新標準的相關要求,A800和H800兩款晶元,因為超標也將被全面禁售。

在英偉達向美國證券交易委員會(SEC)更新的8-K檔中,提到了美國政府提前了對英偉達旗下A100、A800、H100、H800和L40S等五種GPU晶元的禁令生效時間,從原本的11月底更正為立即生效。

**上述變化意味著,BAT們已經下訂的約10萬個A800晶元,很可能無法順利交付。 **

不過,國內的算力基建似乎並不會受到太大的影響。 梳理目前已經正處於建設當中或建設完成的近30餘所智算中心,其中百分之五十以上的晶元供應商為華為昇騰。

此前,科大訊飛董事長劉慶峰曾在發佈會上表示,華為昇騰910B的性能已經可以對標A100。

**整體來說,雖然美國對華限制進一步收緊,拖累了部分互聯網大廠反覆運算大模型的進度,但國內的算力基建仍在穩步推進當中。 **

並且由於進口晶元的難度在可預期的未來里將不斷上升,出於供應鏈安全的考量,國產晶元廠商有望因此迎來了新一波發展機遇。

02 算力突圍:左手自研,右手生態

雖然目前國際市場上唯二得到普遍認可的GPU廠商只有英偉達和AMD,但這並不意味著除了他們之外就沒有別的選擇。

**相比於ASIC晶片,GPU的優勢在於較強的通用能力,適用於各個研究領域。 但細分到各個企業,其實普遍存在算力亢餘,**比如只需要使用GPU的大模型推理能力,不需要它的圖形計算能力。

**因此,許多廠商根據自身需求走上了自主研發的道路。 **

比如,阿裡巴巴於今年五月發佈了自研晶元含光800,據稱是當時AI晶元里性能最強的,計算能力相當於10個CPU; 百度自研的雲端全功能AI晶元崑崙也已經反覆運算至3.0,將於2024年實現量產。

自研晶元的企業中,聲量最大的無疑是前文提到過的華為。

近日,由華為和科大訊飛聯手打造的星火一體機再次被推上了風口浪尖。

據公開資訊,星火一體機基於鯤鵬CPU+昇騰GPU,採用華為存儲和網路提供整機櫃方案,FP16算力達2.5 PFLOPS。 對比來看,在大模型訓練中最為流行的英偉達DGX A100 8-GPU,可以輸出5PFLOPS的FP16算力。

《智東西》曾報導,在盤古、訊飛星火等特定大模型場景中,昇騰910已經略超A100 80GB PCIe版本,實現了國產替代。 但通用性尚且不足,其他模型如GPT-3,則需要深度優化后才能再華為平台上順暢運行。

除此之外,本輪制裁中新被列入實體清單的摩爾線程、壁仞科技分別也有相應的GPU單卡產品,部分指標接近英偉達。

**某種程度上,雲廠商自研晶元是必由之路,除了美國制裁的影響外,自研晶元還能削弱對英偉達的過度依賴,增強企業的戰略自主,同時領先競爭對手率先擴大算力規模。 **

一個證明是,即便是谷歌、OpenAI、蘋果這樣不受制裁限制的企業,也紛紛啟動了自研晶元的計劃。

國產晶元冒出星星之火,**為了不再受制於單一供應商,部分伺服器廠商也開始採取開放構架,相容國產自主創新晶片。 **

比如目前佔國內伺服器市場份額最高的浪潮資訊,就推出了開放計算構架,據稱具有大算力、高互聯和強擴展的特點。

基於此,浪潮資訊發佈了三代AI伺服器產品,和10餘家晶元夥伴實現多元AI計算產品落地,並推出AIStation平臺,可高效調度30餘款AI晶元。

**客觀來說,伺服器廠商是算力產業鏈中相對弱勢的一環,上游需要像英偉達這樣具有壟斷地位的國際巨頭採購晶片,下游是G端和雲廠商,對上對下都缺少議價能力。 **

所以我們能看到,雖然英偉達單季度的營收創下了歷史新高,達135.1億美元,同比增長101%,凈利潤更是同比暴漲843%,達61.88億美元,但浪潮資訊今年上半年的凈利潤仍處在虧損當中。

**為了保障自己能活到萬億市場兌現,伺服器廠商正在不遺餘力地證明自身價值。 **具體來說,就是提供AI伺服器集群的管理和部署方案,以確保伺服器的高可用性、高性能和高效率。

與此同時,廠商們還爭相推出行業報告、標準及指南,希望掌握話語權。

左手自研晶元,右手開放生態,國內算力產業鏈正處在前所未有的複雜局勢當中,彼此之間既有競爭,也有合作。

從長期來看,算力突圍中真正起決定性因素的仍是技術,其中涵蓋生態、軟硬體等內容,需要上下游玩家力出一孔,共克時艱。

**但在真正走通晶元的獨立自主之路前,更關鍵的是如何將每一分算力都用在刀刃上,某種程度上,這個問題的答案也提示了未來將在千億市場中拔得頭籌的玩家的輪廓。 **

03 用好算力,是當務之急

在回答如何用好算力之前,需要先思考另一個問題:怎麼用算力,才算把它用好了?

擺在國內算力產業面前的困境主要有三重:

**第一,算力缺。 **高品質算力資源不足且較為分散,GPU增量受限制,存量嚴重不足,進一步支撐大模型訓練存在一定難度,並且逐步成為新的「卡脖子」問題。

**第二,算力貴。 **算力基礎設施屬於重資產和資本密集型行業,具有前期投入大、技術反覆運算快、建設門檻高等特點,其建設運營需要消耗巨大的時間成本和資金成本,遠遠超出了中小微企業的承受範圍。

**第三,算力需求具有多樣化、碎片化的特點,算力資源供需錯配的情況時有發生。 **

第一重困境正在解決當中,但並非一日之功,所以在眼下這個階段,用好算力的實際意涵,應該是讓算力不再那麼貴,並且能夠處理多樣化需求。

那麼,哪些企業的動作最具有想像力呢?

**在為智算中心降耗增效方面,阿裡的「綠化算力全產業鏈」概念值得期待。 **

眾所周知,大模型訓練的能耗成本非常昂高。 但實際上,這些電能中僅20%被用於計算本身,剩餘的部分都被用於維持伺服器的正常運轉。 谷歌2023年環境報告從側面印證了這一點。 報告顯示,2022年谷歌消耗了近52億加侖的水用於給數據中心降溫,相當於全球每天飲用水的1/4,能裝滿一個半西湖。

為了實現更大程度的總體節能減排效果,螞蟻集團與中國信通院發佈了《面向算力應用環節的計算綠色化白皮書》,其中提出了「端到端的綠色計算」的概念。

具體來說,端到端綠色計算就是從電力生產、算力生產(包括智算中心建設商、硬體廠商、雲廠商),到算力應用全產業環節,均將運營期間的能耗成本在建設初期就納入考量。

某種程度上,以過去能源用途的比例來計算,綠化產業鏈帶來的成本降低,短期內可能比晶元技術突破的性價比更高,有利於中小企業數智化升級。

**在提升算力調度水準方面,華為、阿里、騰訊、百度等企業均貢獻了自己的力量,但其中企業基因最契合的,仍是華為。 **

眼下國內最核心的算力調度工程,是2021年《全國一體化大數據中心協同創新體系算力樞紐實施方案》中首次明確提出的「東數西算」工程,旨在構建國家算力網路體系的任務。

將東部的數據在西部進行存儲和處理,在算力供給側和配給側都存在不小的挑戰。

以常見的丟包問題為例。

當多台伺服器向一台伺服器同時發送大量報文時,會導致報文數量超過交換機的緩存承受能力而產生丟包,進而影響計算和存儲的效率。

為了解決這個問題,華為將智慧演算法引入了數據中心網路交換機,實時採集的網路狀態資訊,如佇列深度、帶寬吞吐、流量模型等維度,通過智慧無損演算法動態設置理想的佇列水線,最終在模擬訓練后,實現了無丟包、高性能、低時延的平衡。

除此之外,華為還創新了分散式自適應路由、智慧雲圖演算法等技術,參與國家樞紐節點的方案設計與建設。

隨著國產大模型在賦能千行百業的路上越走越實,「如何解決中國的算力困境」這一問題也將越來越重要。 我們能看到,中國算力產業鏈已經產生了許多變化,比如互聯網大廠加碼自研晶元、以國產晶片構築的算力底座、過去不被重視的軟體生態萌芽...... 這些變化背後,是中國企業攻破技術壁壘的毅力和決心。

**客觀來說,從技術實力上,國內玩家尚且與世界一流廠商存在一定的距離,但不容忽視的是,即便是如日中天的英偉達,在AI時代來臨之前,也曾常年在生死邊緣徘徊。 **

黎明前的夜最黑,但太陽的光已經漫上地平線了。

參考資料:

AI伺服器缺貨真相調查:兩天漲價30萬,連“味精大王”都入場了|智東西

智算算力新基建疊加海外多模態升級,算力應用再迎催化 | 浙商證券

科技鏈主,華為生態 | 天風證券

訓練需求井噴 “算力之渴”何解 | 網信吉林

美國晶片禁令變本加厲! 英偉達、英特爾或受限 | 21世紀經濟報

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)