關於大模型,我和專業人士一次性聊透了

原文來源:白馬商評

圖片來源:由無界AI‌ 生成

“都快成紅海了。”當我和一個創業者聊起大模型的時候,他直接甩了這句話給我。

去年11月,OpenAI發布基於GPT-3.5的ChatGPT,瞬間引爆大模型的熱潮。半年多的時間,中國出現了“百模大戰”的局面,BAT等頭部互聯網公司和人工智能公司基本都對外宣布了自己的大模型。

5月初,360掌門人周鴻禕對外稱,“如果不經過兩年的模仿和抄襲,上來就說自己能超越,那才叫吹牛呢。”僅僅一個月後,周鴻禕就表示,“我原來說國內大模型跟國外差距兩年,我收回這句話,今天已經接近國際水平。”

有人感慨,半年就追上ChatGPT了,大模型似乎也不難。

那麼,大模型的核心壁壘是什麼?中國大模型到底什麼水平?大模型為人類社會帶來哪些風險?

为此,我们和多年从事机器学习研究、某知名985高校教授沈为(化名)聊了聊,揭开大模型的迷雾。

GPT路徑跑通了,所以有了“百模大戰”

**白馬商評:能不能用最通俗簡單的語言解釋一下大模型,大模型是什麼?和以往的AI模型有什麼區別? **

沈为:所谓大模型就是指模型的参数量大,但学术界并没有一个清晰明确的定义界定到底多大参数叫“大”,还在快速研究发展阶段,一般来讲大模型的参数量达到1亿以上。

其實,深度學習的發展大致經歷了三個階段。第一個階段是2012-2017年,以圖像分割yolo、圖像分類ResNet這種特定領域的小模型為代表,所以參數量佔內存最多也就幾百MB。

2017年,Transformer的問世讓深度學習可以並行化計算,效率更高,意味著可以做大模型的運算,隨後產生了OpenAI GPT和谷歌Bert這類自然語言大模型。這一階段誕生的是特定任務的大模型,模型參數突破了1億。

到了2020年前後,深度學習進入通用模型階段,它的輸入就是一句帶空格的話,模型的作用就是“填空”,以前是模型適配下游應用,現在是下游應用適配模型。這一階段的模型代表包括自然語言領域的GPT 3.5、GPT 4以及圖像領域的Clip、DALLE、Stable Diffusion、Midjourney等等。這一階段模型參數可以達到百億、千億級別。

**白馬商評:你了解到最早研究大模型是哪家企業或機構?有哪些成果? **

沈为:最早是高校和科研机构做相关的研究,我了解比较早的是北京智源人工智能研究院的悟道、鹏程实验室的脑海,现在产业界的研究也很同步了。学术界的研究有一些成果,但性能没有ChatGPT那么惊艳。

**白馬商評:短短幾個月的時間,國內出現了“百模大戰”的局面,推出大模型的公司已經數不過來了,你怎麼看待這種現象? **

沈为:大模型肯定是趋势,也一直有人在研究。之前很多公司可能会小范围投入,做一些浅尝辄止的研究;现在突然出现了ChatGPT这样一个好产品,大家看到了明确的商业方向,于是都开始加大投入。

另一方面,很多公司面臨商業競爭的壓力,不做大模型可能就掉隊了,所以必須上馬大模型項目。

白馬商評:周鴻禕最近說他收回“國內大模型跟國外差距兩年”這句話,他認為今天已經接近國際水平。這才過去幾個月的時間,大模型好像也不難嘛。你覺得差距有多少?

沈为:差距看跟谁对标吧,我目前没有体验过360智脑的产品,不太好评价。但是国内有些生成式AI产品,我体验以后感觉跟ChatGPT还是有差距的,国内的大模型还需要努力。

**重資本投入下,只有頭部公司有機會? **

**白馬商評:研發大模型的核心壁壘是什麼? **

沈为:大模型的核心壁垒包括数据、算力、算法。

從算力上看,訓練ChatGPT這樣的生成式AI需要至少1萬張英偉達A100顯卡,單張顯卡的價格目前是六七萬,性能更優的V100單價8萬元人民幣,也就是說光算力投入至少就要達到六七個億以上,只有少數頭部公司和機構能承擔得起。對於商業機構而言,花幾個億買一堆顯卡,還不一定能產出成果,這是必須要思考的問題。

接下來是數據和算法,算法比較好理解,比如開發框架、優化算法。數據方面,中國不缺數據,甚至互聯網數據比美國還要多,但是選擇哪些數據去訓練、採用什麼樣的方式處理,這些都是核心的壁壘。

**白馬商評:你平時會跟企業交流嗎?非營利性的研究機構和企業在研究上有什麼區別? **

沈为:我们会跟企业的研究部门有一些交流。跟企业交流我们会更加了解实际的业务需求,有时候我们做的学术研究会更关注技术前瞻性,对落地性要求不那么高;但企业一般更强调落地性。

**白馬商評:你有沒有研究過國內的大模型?最看好哪家? **

沈为:可能还是头部公司能跑出来吧。一是重资本的投入,只有头部公司有实力;二是几家头部公司手里的数据更丰富;三是在人工智能领域已经有了一段时间的技术积累。

**白馬商評:你最看好的大模型應用是什麼? **

沈为:从技术角度看,最先应用的应该是自然语言处理和图像领域,语音识别可能要晚一些。

大家看到比較多的用ChatGPT來寫文案,這類內容創作的應用越來越多,其他我覺得像智能客服這種應用應該也會比較快。現在的一些智能客服很多時候理解不了用戶的需求,解決不了實際問題,如果讓用戶區分不出到底是人還是機器人,體驗就會改善很多;包括遊戲中的NPC,以前的對話是寫死的,現在漸漸可以互動了,玩家體驗也會更好。

**白馬商評:你原來做過頭部券商的首席分析師,從投資角度看,你覺得大模型有哪些機會? **

沈为:资金炒作的逻辑是从应用到算法、模型,再到算力;产业的逻辑反而是相反的,算力是有明确的增长预期的,所以英伟达最近上涨很快、很多。投资者现在也明白了,谁家的大模型能跑出来、能变现还需要验证,但是增加的资本投入大部分都投到了算力。经过反复炒作,普涨行情应该已经告一段落,后面需要逻辑验证和业绩兑现。

我原來主要看傳媒互聯網行業,比如前段時間比較強勢的遊戲板塊,資本的邏輯一是應用大模型提升研發效率、降低成本;二是大模型帶來更好的體驗,NPC角色更智能,最後用戶的粘性提升、UP值提升。當然,最終可能還需要業績驗證。

人類無法左右AI,甚至無法左右自己的命運

**白馬商評:我們看到包括奧特曼、馬斯克都對人工智能的安全性問題提出過擔憂,現在我們只知道通過大模型訓練出現了智能化的結果,但訓練過程像一個黑箱,其實挺可怕的。你怎麼看待安全問題? **

沈为:在安全方面,首先我观察到几个反常的现象。第一个是今年3月包括马斯克、苹果公司联合创始人史蒂夫·沃兹尼亚克在内的1000多人签署了一份公开信,呼吁暂停训练比GPT-4更强大的AI系统。

第二個是,今年5月谷歌首席科學家、已經75歲的“AI教父”杰弗裡·辛頓辭職,他離開谷歌的直接原因是擔憂人工智能的危險,甚至對自己一生從事的工作感到後悔。

第三個是近兩年學術領域訓練大模型新增了倫理討論。

目前來看,我覺得大模型還是可控的,沒有大的問題;但是技術發展太快了,出圈以來短短幾個月的時間,GPT就又經歷了幾次迭代,發展速度太快,越來越智能,會不會產生自主意識,不再聽人類的“使喚”,走向失控?這個問題是大家擔心的。

**白馬商評:你覺得AI會不會造成大量失業?在AI面前,普通人怎麼保住工作? **

沈为:从宏观上看我不觉得AI会造成大量的失业,人类总会有工作的,只是说人的工作内容会发生转变。当然,从个体角度看肯定会出现结构性的失业,我们只能不断学习。

**白馬商評:之前很多人說機器沒有感情、缺乏想像力,取代不了人類;現在既然人類大腦可以通過AI模擬出來,那人類的情慾、性慾是不是未來也可以模擬,荷爾蒙、多巴胺這些不過是一種生物學的獎勵機制嘛。 **

沈为:机器没有感情是当前的假设,人工智能越来越接近人的思考模式,那是不是就会产生类似于人类的“感情”?只是他们和人类生活在不同的空间维度,就像《流浪地球》里图恒宇的女儿。人工智能可能会产生自己世界类似于人类的生物学意义上奖励机制。

**白馬商評:如果一切都可以計算、規劃、設置,是不是有點無趣? **

沈为:AI的行为并不是人类预测和规划的,而是他自我强化、自我训练的结果,《流浪地球》里MOSS的决策是自己做的,而不是服从人类给的指令。

**白馬商評:矽基文明取代碳基文明是不是確定性的方向? **

沈为:这个问题超纲了。按照目前的发展趋势可能是这样的,就像《流浪地球》里真正主宰人类命运的是MOSS,而不是人类;但现实中也有可能技术会停滞在某个阶段,跨不过去,毕竟技术发展不是线性的。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)