別硬把大模型往手機里塞

原文來源:科技新知

作者:樟稻

圖片來源:由無界 AI生成

商業迷霧當中,那些看似金光閃閃的“機會”,往往是一把將人們困住的鐐銬。

CNBC最新消息稱,全球晶元巨頭高通打算在加州兩大據點砍掉約1258名員工。 事實上,高通早就向加州就業部門送交了這份“死亡名單”:聖迭戈1064名、聖克拉拉194名。 這場人事地震預計將在12月13日爆發。

高通上個季度的報告中,已經暗示了這次“血洗”。 從財務結構來看,手機晶元是高通的主要收入來源,佔比超過一半,但在三季度里收入同比下降了21.6%。 智慧手機市場的飽和,像一把無形的大手,正在悄悄扼殺上游供應鏈的巨頭。

手機市場的增長現在主要依賴於設備的升級週期。 自2019年以來,受5G驅動的手機更換熱潮已經持續了近四年。 但Counterpoint的資深分析師Peter Richardson卻揭示了一個冷酷的事實:到2022年時,全球手機更換週期已達到史上最長的43個月。

過去五年,手機界苦苦追尋創新之路,急於改變僵局。 但當連Apple這樣的市場領導者也難以拿出令人震撼的新功能時,其他廠商更是難以維持其市場地位。 越來越多的消費者開始質疑,換一部新手機的價值究竟在哪?

有行業專家指出,真正的破局點或許是軟體,尤其是AI領域像LLM、Transformer等大模型背後蘊藏著的力量。

儘管目前還不清楚,該如何最大化地利用這些潛力,但這並不妨礙國內手機巨頭試圖突圍。 華米OV等都把目光瞄準了AI大模型,迫切要開闢一個新戰場。

01 手機巨頭爭鬥大模型賽場

**一時之間,國內手機廠商好像都追起了大模型的風頭。 **

8月14日,小米年度發佈會上,小米AI大模型亮相,霎那之間成為焦點。 在C-、CMMLU兩大測試平臺上,它分別斬獲第十名和中文榜首的佳績。

雷軍信心滿滿地宣佈,小米的這個13億參數大模型已經在手機端完美運行,其實力在某些場景中甚至能與60億參數的雲端模型匹敵。 而家喻戶曉的小愛同學也將強化AI大模型的能力,邀請測試已在發佈會當天拉開序幕。

瞄準AI大模型的狼煙不只在小米一處升起。

早在8月4日的2023年華為開發者大會,余承東就大手一揮,宣佈HarmonyOS 4將受益於「盤古大模型」的加持。 與眾不同的是,華為決定將大模型深度整合進手機系統,實現更高層次的融合。

**繼華米之後,vivo和OPPO亦不斷展露其對大模型領域的雄心。 **

近期,OPPO宣佈對其全新「小布助手」進行首輪公開測試,引發業內關注。 此產品基於了AndesGPT大模型技術。

AndesGPT模型出自OPPO旗下安第斯智慧雲團隊之手,其核心是一個基於混合雲架構的高級生成式大語言模型。 用戶可以通過喚醒小布語音助手並說出「小布大模型」,參與小布1.0公測版報名。 更多資訊將在11月16日的ColorOS 14發佈會上公佈。

與同行的宣傳異曲同工,AndesGPT在其官方介紹中也榮獲了“行業翹楚”等封號,此模型在多個權威評測榜單上頻頻亮相。

另一個戰線上,vivo已鎖定11月1日,要召開年度開發者大會。 此番集結,vivo將揭曉其獨家研發的AI大模型與全新操作系統; 而廣受矚目的OriginOS 4也將初露鋒芒。

尤其引人關注的,vivo打造的AI大模型矩陣極為豐富,覆蓋了十億、百億及千億三大參數級別,共五款模型,旨在滿足多樣化的核心應用場景。

同樣,這批尚在神秘面紗后的產品,已在多個權威評測中嶄露頭角。 最新數據顯示,vivo自研AI大模型在C-和CMMLU兩大平臺上均雄踞榜首。

近期,手機行業已經見證了各大品牌逐個投身於AI大模型的深海。 **存量市場的激烈爭奪,使得各大廠商都希望藉助新技術鋒芒,為自身在高端市場塑造更具競爭力的形象。 **

多位行業內有深度洞察的人士認為,強調AI功能的優勢,顯然是各大廠商策略的重要一環。 不僅能刺激使用者對高端產品的慾望,更能帶動產品價格上漲,從而為品牌創造更為豐厚的利潤。

隨著時間的推移或能見到,首波真正的“AI手機”即將震撼登場,而未來兩年,更會是AI在手機上的創新大爆發時刻。

02 大模型角逐移動端,路徑逐漸統一

雖然手機廠商們在宣傳中表現得在手機上運行大型模型就如同喝水吃飯般輕鬆,**但實際操作中,背後隱藏的挑戰遠超預期。 **

根據小米技術委員會AI實驗室大模型團隊負責人欒劍的分享,要真正在手機上運行大模型,對手機硬體的要求絕不會低,特別是處理器和記憶體兩項。

大模型首先就是其“大”的特性,一旦佔據過多的手機工作記憶體,將導致其他應用受限,甚至可能造成手機無回應、整體性能銳減,或者最糟糕的情況是直接死機。

此外,計算能力也是評判的關鍵點。 若生成一個字元就需要花費好幾秒的時間,這對於用戶體驗無疑是災難性的。 考慮到人們的平均閱讀速度約為每秒十幾個漢字,故模型的“生成速度”必須遠超於此。

而功耗問題也不容忽視。 許多網上的模型Demo常常疏忽這一關鍵環節。 高負載下的計算晶片會導致手機急速發熱,若如此長時間運作,勢必會對電池的續航產生嚴重損害。

綜上,手機大模型真正的挑戰在於如何在處理速度、散熱和電池續航等之間找到一個精妙的平衡。 **因此,業界的重心還放在了端雲協同之上。 **

不久前,聯發科與OPPO達成協定,共同研發大模型在端側的輕量化部署方案,旨在讓大模型技術更為貼近消費者的實際使用。

10月18日,聯發科同樣宣佈與vivo在AI領域深度合作和聯調,實現了10億和70億AI大語言模型以及10億AI視覺大模型在手機端側的落地,共同為消費者帶來端側生成式AI應用創新體驗。

端側大模型的好處是,使用者可以享受更快的回應速度,同時數據也不需要上傳到雲端,更加安全。 目前許多主流廠商都在研發在行動終端部署 AI大模型的解決方案,以實現在端側運行大模型的目標。

**然而,不能假定僅憑手機端便能解決所有問題。 **正如小米透露的,他們將繼續遵循端雲結合的策略。 某些功能或能力,如果可以通過端側的模型來實現,就無需轉移到雲端處理。

觀察vivo的情況,雖然缺乏確切的數據,但可以合理推測,它也將採納雲端和本地結合的大模型策略。

從其大模型的參數量級可以分析,660億、1300億和1750億量級的雲端大模型目的在於確保處理能力,以應對更複雜的問題。 而10億和70億量級的本地大模型則是為了確保用戶隱私、能效和快速回應。

這意味著,vivo很可能會採取端雲協同工作的方式,即通過評估問題的複雜性來決定是否在本地處理或轉移到雲端。

結合雲端和本地的大模型不僅可以有效地節省成本,而且能夠滿足用戶在計算能力、性能、能耗和隱私保護等多個方面的需求,這無疑是目前整合手機和AI大模型的優選策略之一。

03 廠商跟風之下,一些潛在的挑戰

某些業內觀點,將目前嘗試在手機端運行大模型的技術視作一柄鋒利之劍。 **然而深入背後,也不免露出一種應景而非真正求變的短視之感。 **

首先,對於“大模型”的界定仍舊模糊不清。 以小米的端側模型為例,其參數量達到13億,與GPT2的1.5B參數相差無幾,但這真的足以賦予其「大模型」的頭銜嗎?

不乏有業界人士拋出質疑:手機端的大模型實踐,更多地是為了滿足市場短期熱潮,而非技術的真正躍進。 若手機真的能毫不費力地驅動大模型,那顯卡巨頭英偉達的存在意義又在哪裡?

再者,為了讓大模型適應手機,製造商不得不通過剪枝、蒸餾和量化等策略對其進行大幅壓縮。 以vivo為例,它可能通過連續的模型裁剪和蒸餾,將參數從1750億降低到僅10億,這種操作是否過於牽強,值得思考。

要認識到,大模型並不僅僅是參數數量的簡單疊加,它的真正價值在於深度學習中的“深度”。 大量的參數意味著更多的資訊、知識和上下文的捕捉。

因此,當把一款千億參數的模型剪裁到幾十億參數時,勢必要失去一些原有的學習深度。 對於AI的日常應用來說,可能影響不大,但對於那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。

**即便小米宣稱其端側模型能與雲端模型相提並論,但這其中的細節仍不容忽視。 **擁有13億參數的端側模型自然難以與擁有千億參數的雲端模型相比。 為了彌補這種差距,小米可以選擇讓其端側模型在特定場景下與雲端模型匹敵,但終歸不能全面比肩。

從這些層面出發,當前手機上的大模型實現方式似乎有點“矯枉過正”。 對於普通使用者而言,他們並不真正關心模型的參數數量,而更關心能為他們帶來什麼價值。 vivo和小米的這些嘗試固然值得鼓勵,但也應該反思其真正的目的和意義。

更重要的是,儘管眾多手機製造商都在積極探索AI大模型的應用,但未來的路徑仍然充滿未知。 **手機市場上,什麼才是下一個“殺手級”應用,還有待時日揭曉。 **

目前手機製造商對AI大模型的具體應用似乎過於偏重「語音助手」。 這種單一方向的追求,是否只是迎合了科技熱點趨勢,而非真正考慮用戶的實際需求?

以近期知名博主對vivo新款AI大模型的分享為例,儘管其在OriginOS 4上以煥然新姿亮相,但與現行的語音助手相比,核心並無太大顛覆。

簡而言之,AI大模型在手機領域的真正普及仍舊步履蹣跚。 如今的種種努力,只是冰山初露的探秘之旅。

參考資料:

騰訊科技-小米的大模型“野心”,始於端側

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)