關於大模型，我和專業人士一次性聊透了

巴比特_

2023-07-04 06:35:01

原文來源：白馬商評

圖片來源：由無界AI‌ 生成

“都快成紅海了。”當我和一個創業者聊起大模型的時候，他直接甩了這句話給我。

去年11月，OpenAI發布基於GPT-3.5的ChatGPT，瞬間引爆大模型的熱潮。半年多的時間，中國出現了“百模大戰”的局面，BAT等頭部互聯網公司和人工智能公司基本都對外宣布了自己的大模型。

5月初，360掌門人周鴻禕對外稱，“如果不經過兩年的模仿和抄襲，上來就說自己能超越，那才叫吹牛呢。”僅僅一個月後，周鴻禕就表示，“我原來說國內大模型跟國外差距兩年，我收回這句話，今天已經接近國際水平。”

有人感慨，半年就追上ChatGPT了，大模型似乎也不難。

那麼，大模型的核心壁壘是什麼？中國大模型到底什麼水平？大模型為人類社會帶來哪些風險？

为此，我们和多年从事机器学习研究、某知名985高校教授沈为（化名）聊了聊，揭开大模型的迷雾。

GPT路徑跑通了，所以有了“百模大戰”

**白馬商評：能不能用最通俗簡單的語言解釋一下大模型，大模型是什麼？和以往的AI模型有什麼區別？ **

沈为：所谓大模型就是指模型的参数量大，但学术界并没有一个清晰明确的定义界定到底多大参数叫“大”，还在快速研究发展阶段，一般来讲大模型的参数量达到1亿以上。

其實，深度學習的發展大致經歷了三個階段。第一個階段是2012-2017年，以圖像分割yolo、圖像分類ResNet這種特定領域的小模型為代表，所以參數量佔內存最多也就幾百MB。

2017年，Transformer的問世讓深度學習可以並行化計算，效率更高，意味著可以做大模型的運算，隨後產生了OpenAI GPT和谷歌Bert這類自然語言大模型。這一階段誕生的是特定任務的大模型，模型參數突破了1億。

到了2020年前後，深度學習進入通用模型階段，它的輸入就是一句帶空格的話，模型的作用就是“填空”，以前是模型適配下游應用，現在是下游應用適配模型。這一階段的模型代表包括自然語言領域的GPT 3.5、GPT 4以及圖像領域的Clip、DALLE、Stable Diffusion、Midjourney等等。這一階段模型參數可以達到百億、千億級別。

**白馬商評：你了解到最早研究大模型是哪家企業或機構？有哪些成果？ **

沈为：最早是高校和科研机构做相关的研究，我了解比较早的是北京智源人工智能研究院的悟道、鹏程实验室的脑海，现在产业界的研究也很同步了。学术界的研究有一些成果，但性能没有ChatGPT那么惊艳。

**白馬商評：短短幾個月的時間，國內出現了“百模大戰”的局面，推出大模型的公司已經數不過來了，你怎麼看待這種現象？ **

沈为：大模型肯定是趋势，也一直有人在研究。之前很多公司可能会小范围投入，做一些浅尝辄止的研究；现在突然出现了ChatGPT这样一个好产品，大家看到了明确的商业方向，于是都开始加大投入。

另一方面，很多公司面臨商業競爭的壓力，不做大模型可能就掉隊了，所以必須上馬大模型項目。

白馬商評：周鴻禕最近說他收回“國內大模型跟國外差距兩年”這句話，他認為今天已經接近國際水平。這才過去幾個月的時間，大模型好像也不難嘛。你覺得差距有多少？

沈为：差距看跟谁对标吧，我目前没有体验过360智脑的产品，不太好评价。但是国内有些生成式AI产品，我体验以后感觉跟ChatGPT还是有差距的，国内的大模型还需要努力。

重資本投入下，只有頭部公司有機會？

**白馬商評：研發大模型的核心壁壘是什麼？ **

沈为：大模型的核心壁垒包括数据、算力、算法。

從算力上看，訓練ChatGPT這樣的生成式AI需要至少1萬張英偉達A100顯卡，單張顯卡的價格目前是六七萬，性能更優的V100單價8萬元人民幣，也就是說光算力投入至少就要達到六七個億以上，只有少數頭部公司和機構能承擔得起。對於商業機構而言，花幾個億買一堆顯卡，還不一定能產出成果，這是必須要思考的問題。

接下來是數據和算法，算法比較好理解，比如開發框架、優化算法。數據方面，中國不缺數據，甚至互聯網數據比美國還要多，但是選擇哪些數據去訓練、採用什麼樣的方式處理，這些都是核心的壁壘。

**白馬商評：你平時會跟企業交流嗎？非營利性的研究機構和企業在研究上有什麼區別？ **

沈为：我们会跟企业的研究部门有一些交流。跟企业交流我们会更加了解实际的业务需求，有时候我们做的学术研究会更关注技术前瞻性，对落地性要求不那么高；但企业一般更强调落地性。

**白馬商評：你有沒有研究過國內的大模型？最看好哪家？ **

沈为：可能还是头部公司能跑出来吧。一是重资本的投入，只有头部公司有实力；二是几家头部公司手里的数据更丰富；三是在人工智能领域已经有了一段时间的技术积累。

**白馬商評：你最看好的大模型應用是什麼？ **

沈为：从技术角度看，最先应用的应该是自然语言处理和图像领域，语音识别可能要晚一些。

大家看到比較多的用ChatGPT來寫文案，這類內容創作的應用越來越多，其他我覺得像智能客服這種應用應該也會比較快。現在的一些智能客服很多時候理解不了用戶的需求，解決不了實際問題，如果讓用戶區分不出到底是人還是機器人，體驗就會改善很多；包括遊戲中的NPC，以前的對話是寫死的，現在漸漸可以互動了，玩家體驗也會更好。

**白馬商評：你原來做過頭部券商的首席分析師，從投資角度看，你覺得大模型有哪些機會？ **

沈为：资金炒作的逻辑是从应用到算法、模型，再到算力；产业的逻辑反而是相反的，算力是有明确的增长预期的，所以英伟达最近上涨很快、很多。投资者现在也明白了，谁家的大模型能跑出来、能变现还需要验证，但是增加的资本投入大部分都投到了算力。经过反复炒作，普涨行情应该已经告一段落，后面需要逻辑验证和业绩兑现。

我原來主要看傳媒互聯網行業，比如前段時間比較強勢的遊戲板塊，資本的邏輯一是應用大模型提升研發效率、降低成本；二是大模型帶來更好的體驗，NPC角色更智能，最後用戶的粘性提升、UP值提升。當然，最終可能還需要業績驗證。

人類無法左右AI，甚至無法左右自己的命運

**白馬商評：我們看到包括奧特曼、馬斯克都對人工智能的安全性問題提出過擔憂，現在我們只知道通過大模型訓練出現了智能化的結果，但訓練過程像一個黑箱，其實挺可怕的。你怎麼看待安全問題？ **

沈为：在安全方面，首先我观察到几个反常的现象。第一个是今年3月包括马斯克、苹果公司联合创始人史蒂夫·沃兹尼亚克在内的1000多人签署了一份公开信，呼吁暂停训练比GPT-4更强大的AI系统。

第二個是，今年5月谷歌首席科學家、已經75歲的“AI教父”杰弗裡·辛頓辭職，他離開谷歌的直接原因是擔憂人工智能的危險，甚至對自己一生從事的工作感到後悔。

第三個是近兩年學術領域訓練大模型新增了倫理討論。

目前來看，我覺得大模型還是可控的，沒有大的問題；但是技術發展太快了，出圈以來短短幾個月的時間，GPT就又經歷了幾次迭代，發展速度太快，越來越智能，會不會產生自主意識，不再聽人類的“使喚”，走向失控？這個問題是大家擔心的。

**白馬商評：你覺得AI會不會造成大量失業？在AI面前，普通人怎麼保住工作？ **

沈为：从宏观上看我不觉得AI会造成大量的失业，人类总会有工作的，只是说人的工作内容会发生转变。当然，从个体角度看肯定会出现结构性的失业，我们只能不断学习。

**白馬商評：之前很多人說機器沒有感情、缺乏想像力，取代不了人類；現在既然人類大腦可以通過AI模擬出來，那人類的情慾、性慾是不是未來也可以模擬，荷爾蒙、多巴胺這些不過是一種生物學的獎勵機制嘛。 **

沈为：机器没有感情是当前的假设，人工智能越来越接近人的思考模式，那是不是就会产生类似于人类的“感情”？只是他们和人类生活在不同的空间维度，就像《流浪地球》里图恒宇的女儿。人工智能可能会产生自己世界类似于人类的生物学意义上奖励机制。

**白馬商評：如果一切都可以計算、規劃、設置，是不是有點無趣？ **

沈为：AI的行为并不是人类预测和规划的，而是他自我强化、自我训练的结果，《流浪地球》里MOSS的决策是自己做的，而不是服从人类给的指令。

**白馬商評：矽基文明取代碳基文明是不是確定性的方向？ **

沈为：这个问题超纲了。按照目前的发展趋势可能是这样的，就像《流浪地球》里真正主宰人类命运的是MOSS，而不是人类；但现实中也有可能技术会停滞在某个阶段，跨不过去，毕竟技术发展不是线性的。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

1人點讚了這條動態

讚賞
1
留言
分享

留言

0/400

暫無留言

話題
Dr.Han入駐Gate廣場
25207 熱度
Gate VIP 煥新升級
26187 熱度
非農就業數據來襲
17716 熱度
4Gate Alpha交易分享
8956 熱度
5Gate上線xStocks交易
18095 熱度
6BTC重返11萬
2624 熱度
7特朗普馬斯剋分歧
31628 熱度
8Solana質押型ETF
20050 熱度
9特朗普稅改法案
32580 熱度
10Gate廣場創作者星火計畫
144583 熱度

關於大模型，我和專業人士一次性聊透了

GPT路徑跑通了，所以有了“百模大戰”

**重資本投入下，只有頭部公司有機會？ **

人類無法左右AI，甚至無法左右自己的命運

重資本投入下，只有頭部公司有機會？