7個月了,中國AI 大模型學不來ChatGPT

來源:鈦媒體

作者:林志佳

圖片來源:由無界AI生成

與此前幾週的人工智能(AI)相關會議情況類似,2023全球數字經濟大會人工智能高峰論壇上,企業家、學術界紛紛探討大模型、生成式AI 技術對於社會和產業界的影響。

“前幾個月大家都在討論OpenAI和中國什麼時候能夠做出自己的大模型,這幾個月大模型層出不窮,我看到很多投資人開始急了。”360公司董事長周鴻禕在論壇演講中表示,大模型真正的機會在中國,尤其是企業級市場,包括政府和城市,而中國做大模型最應該抓住產業互聯網發展的機會。

曠視科技聯合創始人唐文斌,智譜AI CEO張鵬,銜遠科技創始人、清華大學惠妍講席教授周伯文等嘉賓也在現場表示認同這一看法,他們普遍認為,大模型不應該再消耗大量資金做ChatGPT這類千億級參數的通用大模型,而是應該打造十億級行業大模型,深入To B行業解決方案,解決垂直領域的實際問題。

事實上,隨著ChatGPT掀起中國AI 大模型的投資、產業發展熱潮,企業紛紛效仿ChatGPT爭做“中國版OpenAI”,現在已有超過80個大模型公開內測。

**但問題在於,“卷”了七個月後很多投資人、企業家發現,大模型技術門檻並不高,同時算力價格持續攀升,成本高居不下,企業急需盈利,需要尋找大模型的商業化方案,而ChatGPT的“每月20美元”Plus會員服務在國內只能變“免費”,OpenAI那種持續性AI 技術投入在國內行不通。 **

**最終發現,能給“大模型”買單的只有政務、金融、醫療等幾個垂直領域客戶。 **

鈦媒體App編輯統計國內AI大模型數據最新信息

企業不再拼AI大模型技術,而是回歸商業化

過去半年多時間,以ChatGPT、GPT-4為代表的大模型技術,引領了新一輪全球AI 創新熱潮。國內外大模型科研高速迭代,各類模型層出不窮,模型性能不斷提升。

在國內,從百度文心一言、阿里通義千問、華為盤古大模型,再到360智慧大腦、智譜AI ChatGLM等,各行各業都在打造大模型。據北京市經濟和信息化局局長姜廣智最新透露,迄今中國已有80餘個大模型公開發布,其中北京約佔一半(超40個)。

“我們好像爬了很長時間的山,終於見到了新的高峰、見到了新的曙光。”姜廣智在致辭時表示,過去二十多年,經歷了互聯網、智能手機、雲計算、大數據、物聯網這一系列IT技術的重大變化,深刻地改變了我們的生產生活等各個方面,現在我們又迎來了通用AI 的新時代。

不過,相比ChatGPT這類消費級平台的付費模式,中國AI 大模型普遍免費內測使用,用戶只要在平台申請內測就能得到使用許可。不僅如此,“百模大戰”下人人都做大模型,很難形成企業自身和產業壁壘,加上AI 算力成本高昂,大模型的商業化沒有想像當中那麼容易。

簡單來說,國內AI 大模型與OpenAI的商業模式、技術成本相距甚遠。 OpenAI 能投入數億美元的算力訓練成本,國內中小AI 公司無法達到,尤其大部分都集中於應用端。

“參數量其實是一個辯證的問題。千億萬億參數只是代表你最高的能力,但高參數意味著思維能力要求更高、算力高,而客戶場景不一定需要這麼高的算力要求,因為不是所有場景都能接受千億參數量成本。”第四範式創始人、CEO戴文淵今年5月對鈦媒體App表示,在各種條件製約以及企業尋找盈利下,To B客戶均開始選擇成本可控的垂直AI 大模型。

**在2023全球數字經濟大會人工智能高峰論壇上,周鴻禕、張鵬、周伯文等嘉賓都普遍提到大模型的“行業化”、“垂直化”,深入政務、金融、文創、醫療等行業拓展,同時也圍繞模型安全、可信、可控進行討論。 **

周鴻禕認為,大模型真正的機會在企業級市場,中國做大模型,最應該抓住產業發展的機會。但目前的公有大模型用在政府、城市、行業等企業級場景時,存在四點不足,包括缺乏行業深度、數據安全隱患、無法保障內容可信、訓練和部署成本過高等。

“公有大模型存在很多數據安全隱患。每個企業自己內部的Know-how是核心資產,肯定不會訓練到公域大模型;公有大模型使用會有數據洩露的問題,因為很多想法和計劃都要告訴它,它才能寫出一篇好的文章;公有大模型是生成式AI,本身算法的特點就是會胡說八道,而且是一本正經、理直氣壯地胡說八道,這個特點用來做小說、寫劇本,作為聊天機器人逗悶子效果很不錯,但放在企業級場景問題就很大,要是真的拿醫療大模型開的藥方,你敢不敢相信、敢不敢吃;公有大模型無法實現成本可控,因為大模型成本之高也被渲染得很厲害,訓練一次要一千萬美金,需要多少算力、多少顯卡,企業內部做垂直大模型不用追求知識的全面,也不用追求能力面面俱到,百億模型可能就足夠了,千億到百億看起來參數做小了十倍,節省的訓練和部署成本可遠遠不止十倍。”

周鴻禕直言,**未來企業級市場真正需要的大模型要符合行業化、企業化、垂直化、小型化、專有化等特點。不僅如此,在他看來,**構建企業級大模型要堅持以下三個原則:

1、安全:首先是安全原則,大模型存在網絡安全、數據安全、算法安全等風險,特別在生成內容安全方面,目前已經有人利用AIGC生成各種以假亂真的內容用於詐騙,且治理起來比搜索引擎要復雜很多。因此人工智能安全的問題需要從現在開始著手研究。 2、可信:其次是可信原則,可通過企業知識庫和搜索的校正解決大模型的“幻覺”問題,以及知識不能及時更新問題。 “如何解決輸出內容準確的問題?現在可以通過向量數據庫、企業搜索和外部知識庫進行校正。” 3、可控:最后是可控原则,周鸿祎认为,大模型目前还有点不靠谱的情况下,建议企业和政府使用大模型时,一开始步子可以小一点,不要向它开放API、插件和函数模式,还是要坚持它是一个助手,最后人是在决策的“回路”上。他在PPT中提到,要采取监控审计手段,把大橫型“关在笼子里”。

對於企業如何使用大模型,周鴻禕強調,企業大模型首先要用好通用能力,充分發揮大模型最擅長、最成熟的能力;著眼企業痛點和剛需,小切口,大縱深,比如信息分析和決策、企業知識搜索和管理、辦公協作和智能客服等辦公場景,都是最合適的切入點。

同時,周鴻禕還建議企業在使用大模型時先開啟“助手”和“副駕駛”模式,讓大模型與現有的業務系統保持相對獨立,保持隔離度,對企業來說也更安全可控。此外,企業大模型應當領導、員工都能用,做到AI普惠。

“老是有人渲染應用大模型就要大裁員,搞得很多員工對大模型很抵觸。我堅決反對這個觀點,大模型目前想獨立完成一項工作還是很難的,更多的定位是人類很好的工具、知識的助手,所以大模型的發展要以人為本。”周鴻禕提到,易用好用是大模型發展的第一原則。

周鴻禕判斷,數字人將成為企業級大模型的重要入口和承載形式。此前360智腦發布的“有靈魂”的數字助理,可解決大模型的易用性難題。此次現場,周鴻禕還展示了定制化的“北京客服問不倒”和“北京城市招商寶”,為北京市訓練的兩個大模型數字人,解決一些政企領域的核心需求。

不僅是周鴻禕,智譜AI CEO張鵬提到,從商業落地角度來說,智譜AI 提出MaaS(Model As A Service)大模型服務理念,是希望讓千億級、高精度的大模型被更多個人和企業使用,享受AI賦能。

“我們有三個版本,一是有端到端模型訓練服務,已經在自建算力平台上幫助大家完成若干模型遷移訓練;二是提供模型搭建服務,提供License;三是和雲計算廠商合作,提出API調用以及Model Instance服務,幫助大家能夠快速構建強大的基礎設施能力。”張鵬表示。

鈦媒體App了解到,智譜AI正在研發新的ChatGLM2大模型產品,參數量減少但數據質量提升,相比於初代模型,ChatGLM2-6B在數理邏輯、知識推理、長文檔理解等多個維度的能力上,都取得了巨大的提升。在多個評測中,ChatGLM2得分要超過GPT-4和ChatGPT。

銜遠科技創始人、清華大學惠妍講席教授周伯文則表示,Al能否與業務充分結合,是決定Al能否實現經濟價值的關鍵因素。只有緊貼業務的Al戰路設計、完善的配套架構、充足的Al人才,以及健全的內部培養機制,才能使AI與業務發展需求充分融合,最大化經濟收益。

崑崙萬維CEO方漢則認為,目前來看大模型處於B端降本,C端增效狀態。

他認為,中國的B端服務企業,可以看到很難有一家企業能夠壟斷整個B端服務。由於大模型對行業數據的需求,B端必然會出現每家大模型企業都能夠在一兩個行業中取得先發成功,沒有一家企業能夠在所有行業取得成功,而且很難有企業能拿到全行業的數據;而C端必然碎片化,由於中國市場的付費習慣,其實同海外有非常大的差別,中國用戶的免費習慣是非常明顯的,所有給C端用戶提供服務的企業必然是以免費模式為主,VIP模式為輔。

“大潮將起,落地為王。我們希望這一波通用人工智能的創業浪潮、投資浪潮能夠和上一波不太一樣,可以更快地落地、產生用戶和收入。”方漢的理論依然偏向大模型的商業化。他提到,崑崙萬維研發的AI 生成音樂產品已經落地文旅場景,今年4月與北京東城區簽署協議。

中國電信集團大數據和AI中心副總經理張鑫,則在現場公佈了其研發的TeleChat大模型,支持輸出代碼、寫演講稿等。張鑫提到,電信數科公司研發目標是打造萬級AI算法艙,以成為百億級AI服務商,產品涵蓋AI算法、平台、應用、硬件、大模型等。

這是中國電信首次對外公佈其大模型產品。張鑫還稱,相對於其他大模型,TeleChat產品使用的大部分是國內中文大數據,數據90%都是國內為主,而且基於中國電信天翼雲和云網融合底座,TeleChat做模型訓練參數的時候,能力能夠達到47%,而且模型訓練的效率、模型算法能力還在不斷提升。

在應用場景中,中國電信的TeleChat大模型已經開始廠商智能化,解決一些語音接線員的人才緊缺和覆蓋不足問題。通過AI技術提升,實現社會治理能力的現代化,減少成本消耗。

雲知聲創新事業部副總裁郭凡曾提到,由雲知聲和北京友誼醫院共同開發的基於山海大模型的門診病歷生成系統示範應用,在智慧醫療領域,基於雲知聲700億參數規模的自研“山海”大模型,結合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術,預計可提升醫生的電子病歷錄入效率超過400%,節約單個患者問診時間超過40%,提升醫生門診效率超過66%。

實際上,大模型是典型贏家通吃領域。需要更多的錢,需要更多的算力,以及更優秀人才。因為更好的算力意味著更多人用,更多人用意味著更多數據,更多數據意味著更好的算力結果。大模型必然是巨頭必爭之地,巨頭有錢,有技術,更重要是有數據。

而創業公司項目太多,資金過於分散,尤其在企業端最終都變成了消耗資金買英偉達A100卡、買雲服務,沒有一個量化的企業發展流程。尤其在AI 公司、SaaS公司普遍盈利難、造血難之下,初創公司需要進行大模型商業化、盈利化。

所以,目前國內AI 大模型正在形成的是以阿里、騰訊、百度、華為、商湯等大公司建立的通用大模型基座以及算力中心,以及包括毫末智行、天眼查、雲知聲、中科聞歌、曠視等公司建立的垂直或行業領域大模型,只專注於一兩個領域解決核心問題。

政府支撐大模型場景落地

本次論壇上,北京市經信局再次公佈了北京市通用人工智能產業創新夥伴計劃第二批成員,有63家企業入選。

據了解,截至6月30日,共有416家京內外大模型研發和應用企業申請加入第二批“夥伴計劃”。最終,包括北京百度網訊科技有限公司、中電數據服務有限公司、北京集智未來人工智能產業創新基地有限公司等63家企業入選並公佈。其中,算力夥伴10家,數據夥伴10家,模型夥伴10家,應用夥伴24家、投資夥伴9家。此外,評估出模型觀察員30家。

據鈦媒體App估算,截至目前已經有超過80家公司和機構,入選到了北京市通用人工智能產業創新夥伴計劃當中。

**目前,北京正快速推進AI 大模型建設和產業佈局工作。 **

5月21日,北京市人民政府印發《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025年)》的通知,到2025年,北京人工智能技術創新與產業發展進入新階段,基礎理論研究取得突破,原始創新成果影響力不斷提升,而且人工智能產業規模持續提升,形成具有國際競爭力和技術主導權的產業集群。

5月23日,北京市人民政府辦公廳印發《北京市促進通用人工智能創新發展的若干措施》的通知,要求充分發揮政府引導作用和創新平台催化作用,整合創新資源,加強要素配置,營造創新生態,重視風險防範,推動北京市通用人工智能實現創新引領和理性健康發展。

鈦媒體App在現場注意到,關於AI 大模型在政務領域的落地案例和企業參與者越來越多,阿里、華為、汽車之家、值得買科技等公司均在參與。

北京市政務服務管理局一位負責人在現場演講中提到,為了支撐平台“京策”建設,政府需要在場景領域進行通用大模型技術落地,從而提升政策規範管理和精準服務能力。 “對海量市民訴求數據進行深度挖掘分析,為領導決策、基層治理、城市治理提供更有力支撐。”

上述負責人提到,場景推進方面,先期會使用開放的小接口模式,後續會開展私有化的深度應用。長期來看,他們將在數據安全可控的條件下,通過建立數字保護機制和技術評價,來開放高質量可信的政務數據集。

中科聞歌交付中心負責人王璋盛在和鈦媒體App交流中提到,政府類客戶對於AI 大模型的訴求是很高的,該領域在大模型應用中也需要數據安全、數據治理等條件,尤其進行高質量數據訓練,從而更好解決該領域的實際應用問題。

蜜度CTO劉益東對鈦媒體App表示,公司去年開始使用華為雲基礎設施產品展開政務、媒體等領域的業務落地,如今該公司即將發布專注於網絡輿論的垂直行業大模型產品。

“政府開始買單'大模型',一方面是政策引導和實際應用場景訴求,另一方面是企業自身需要通過大模型來解決成本問題、商業化問題。”一位行業人士向鈦媒體App分析,國內大模型行業正在回到AI 企業與政府結合形成商業化、拿政府補助的時期。

姜廣智表示,當前,北京正加快推進國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區建設,打造具有全球影響力的人工智能創新策源地,具體措施包括以下三點:

一是加強政策創新和標準引領。解決數據數量相對匱乏、質量難以保證、採集標註成本高及合規使用等問題。籌劃出台“算力券”政策,支持基於落地應用場景的中小企業獲取多元化、低成本優質算力,支持本市人工智能企業與相關行業組織在人工智能國家標準、行業標準、地方標準制定中發揮引領作用,參與模型性能、數據安全、隱私保護等方面的技術標準制定。 二是加大場景開放力度、率先落地標杆應用。推動本市政府機關、事業單位、國有企業等具有管理公共事務職能的組織積極採購和使用安全、可靠的大模型相關產品和服務,在政務服務、智慧城市等領域率先落地應用,提升城市治理能力現代化水平。 三是推動夥伴計劃走深走實。目前夥伴計劃中,有10餘家算力夥伴計劃提供不少於4000P低成本優質算力,供北京市人工智能中小企業開展大模型訓練和推理。 10個數據夥伴開放18個、近500T高質量數據集供大模型企業訓練使用。同時,也將加快推動大模型行業應用落地,深入發揮夥伴計劃這一市場化對接合作平台的作用,營造北京市大模型創新合作、應用落地的良好生態。

姜廣智強調,北京市經信局將不斷加強優質資源要素配置,有效整合創新資源,積極營造創新生態,夯實人工智能產業發展基礎。

“大模型不是一家企業能夠做出來的,最好是大家在算力、模型、數據這些層面形成幾個大的生態,尤其是在政府部門的指導下,企業能夠在生態中形成夥伴關係,這樣大家更多是合作而不是競爭。未來,大模型可能會形成有生態,有夥伴,大家一起共贏的關係。”君聯資本執行董事紀海泉表示。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)