🎉 Gate xStocks 交易開啓啦,現貨、合約、Alpha齊上線!
📝 在Gate廣場發帖,曬出你的交易體驗或精彩截圖,瓜分$1,000大獎池!
🎁 廣場優質創作者5名,每人獨享$100合約體驗券!
🎉 帖文同步分享到X(推特),瀏覽量前十再得$50獎勵!
參與方式:
1️⃣ 關注 @Gate廣場_Official
2️⃣ 帶 #Gate xStocks 交易体验# ,原創發帖(不少於20字,僅用活動標籤)
3️⃣ 若分享到推特,請將連結提交表單:https://www.gate.com/questionnaire/6854
注:表單可多次提交,發布更多帖文可提升獲獎機會!
📅 7月3日16:00—7月9日24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/45926
每一條體驗,都有機會贏取大獎!快在Gate廣場show出你的操作吧!
7個月了,中國AI 大模型學不來ChatGPT
來源:鈦媒體
作者:林志佳
與此前幾週的人工智能(AI)相關會議情況類似,2023全球數字經濟大會人工智能高峰論壇上,企業家、學術界紛紛探討大模型、生成式AI 技術對於社會和產業界的影響。
“前幾個月大家都在討論OpenAI和中國什麼時候能夠做出自己的大模型,這幾個月大模型層出不窮,我看到很多投資人開始急了。”360公司董事長周鴻禕在論壇演講中表示,大模型真正的機會在中國,尤其是企業級市場,包括政府和城市,而中國做大模型最應該抓住產業互聯網發展的機會。
曠視科技聯合創始人唐文斌,智譜AI CEO張鵬,銜遠科技創始人、清華大學惠妍講席教授周伯文等嘉賓也在現場表示認同這一看法,他們普遍認為,大模型不應該再消耗大量資金做ChatGPT這類千億級參數的通用大模型,而是應該打造十億級行業大模型,深入To B行業解決方案,解決垂直領域的實際問題。
事實上,隨著ChatGPT掀起中國AI 大模型的投資、產業發展熱潮,企業紛紛效仿ChatGPT爭做“中國版OpenAI”,現在已有超過80個大模型公開內測。
**但問題在於,“卷”了七個月後很多投資人、企業家發現,大模型技術門檻並不高,同時算力價格持續攀升,成本高居不下,企業急需盈利,需要尋找大模型的商業化方案,而ChatGPT的“每月20美元”Plus會員服務在國內只能變“免費”,OpenAI那種持續性AI 技術投入在國內行不通。 **
**最終發現,能給“大模型”買單的只有政務、金融、醫療等幾個垂直領域客戶。 **
企業不再拼AI大模型技術,而是回歸商業化
過去半年多時間,以ChatGPT、GPT-4為代表的大模型技術,引領了新一輪全球AI 創新熱潮。國內外大模型科研高速迭代,各類模型層出不窮,模型性能不斷提升。
在國內,從百度文心一言、阿里通義千問、華為盤古大模型,再到360智慧大腦、智譜AI ChatGLM等,各行各業都在打造大模型。據北京市經濟和信息化局局長姜廣智最新透露,迄今中國已有80餘個大模型公開發布,其中北京約佔一半(超40個)。
“我們好像爬了很長時間的山,終於見到了新的高峰、見到了新的曙光。”姜廣智在致辭時表示,過去二十多年,經歷了互聯網、智能手機、雲計算、大數據、物聯網這一系列IT技術的重大變化,深刻地改變了我們的生產生活等各個方面,現在我們又迎來了通用AI 的新時代。
不過,相比ChatGPT這類消費級平台的付費模式,中國AI 大模型普遍免費內測使用,用戶只要在平台申請內測就能得到使用許可。不僅如此,“百模大戰”下人人都做大模型,很難形成企業自身和產業壁壘,加上AI 算力成本高昂,大模型的商業化沒有想像當中那麼容易。
簡單來說,國內AI 大模型與OpenAI的商業模式、技術成本相距甚遠。 OpenAI 能投入數億美元的算力訓練成本,國內中小AI 公司無法達到,尤其大部分都集中於應用端。
“參數量其實是一個辯證的問題。千億萬億參數只是代表你最高的能力,但高參數意味著思維能力要求更高、算力高,而客戶場景不一定需要這麼高的算力要求,因為不是所有場景都能接受千億參數量成本。”第四範式創始人、CEO戴文淵今年5月對鈦媒體App表示,在各種條件製約以及企業尋找盈利下,To B客戶均開始選擇成本可控的垂直AI 大模型。
**在2023全球數字經濟大會人工智能高峰論壇上,周鴻禕、張鵬、周伯文等嘉賓都普遍提到大模型的“行業化”、“垂直化”,深入政務、金融、文創、醫療等行業拓展,同時也圍繞模型安全、可信、可控進行討論。 **
周鴻禕直言,**未來企業級市場真正需要的大模型要符合行業化、企業化、垂直化、小型化、專有化等特點。不僅如此,在他看來,**構建企業級大模型要堅持以下三個原則:
同時,周鴻禕還建議企業在使用大模型時先開啟“助手”和“副駕駛”模式,讓大模型與現有的業務系統保持相對獨立,保持隔離度,對企業來說也更安全可控。此外,企業大模型應當領導、員工都能用,做到AI普惠。
“老是有人渲染應用大模型就要大裁員,搞得很多員工對大模型很抵觸。我堅決反對這個觀點,大模型目前想獨立完成一項工作還是很難的,更多的定位是人類很好的工具、知識的助手,所以大模型的發展要以人為本。”周鴻禕提到,易用好用是大模型發展的第一原則。
周鴻禕判斷,數字人將成為企業級大模型的重要入口和承載形式。此前360智腦發布的“有靈魂”的數字助理,可解決大模型的易用性難題。此次現場,周鴻禕還展示了定制化的“北京客服問不倒”和“北京城市招商寶”,為北京市訓練的兩個大模型數字人,解決一些政企領域的核心需求。
“我們有三個版本,一是有端到端模型訓練服務,已經在自建算力平台上幫助大家完成若干模型遷移訓練;二是提供模型搭建服務,提供License;三是和雲計算廠商合作,提出API調用以及Model Instance服務,幫助大家能夠快速構建強大的基礎設施能力。”張鵬表示。
鈦媒體App了解到,智譜AI正在研發新的ChatGLM2大模型產品,參數量減少但數據質量提升,相比於初代模型,ChatGLM2-6B在數理邏輯、知識推理、長文檔理解等多個維度的能力上,都取得了巨大的提升。在多個評測中,ChatGLM2得分要超過GPT-4和ChatGPT。
銜遠科技創始人、清華大學惠妍講席教授周伯文則表示,Al能否與業務充分結合,是決定Al能否實現經濟價值的關鍵因素。只有緊貼業務的Al戰路設計、完善的配套架構、充足的Al人才,以及健全的內部培養機制,才能使AI與業務發展需求充分融合,最大化經濟收益。
崑崙萬維CEO方漢則認為,目前來看大模型處於B端降本,C端增效狀態。
他認為,中國的B端服務企業,可以看到很難有一家企業能夠壟斷整個B端服務。由於大模型對行業數據的需求,B端必然會出現每家大模型企業都能夠在一兩個行業中取得先發成功,沒有一家企業能夠在所有行業取得成功,而且很難有企業能拿到全行業的數據;而C端必然碎片化,由於中國市場的付費習慣,其實同海外有非常大的差別,中國用戶的免費習慣是非常明顯的,所有給C端用戶提供服務的企業必然是以免費模式為主,VIP模式為輔。
“大潮將起,落地為王。我們希望這一波通用人工智能的創業浪潮、投資浪潮能夠和上一波不太一樣,可以更快地落地、產生用戶和收入。”方漢的理論依然偏向大模型的商業化。他提到,崑崙萬維研發的AI 生成音樂產品已經落地文旅場景,今年4月與北京東城區簽署協議。
這是中國電信首次對外公佈其大模型產品。張鑫還稱,相對於其他大模型,TeleChat產品使用的大部分是國內中文大數據,數據90%都是國內為主,而且基於中國電信天翼雲和云網融合底座,TeleChat做模型訓練參數的時候,能力能夠達到47%,而且模型訓練的效率、模型算法能力還在不斷提升。
在應用場景中,中國電信的TeleChat大模型已經開始廠商智能化,解決一些語音接線員的人才緊缺和覆蓋不足問題。通過AI技術提升,實現社會治理能力的現代化,減少成本消耗。
雲知聲創新事業部副總裁郭凡曾提到,由雲知聲和北京友誼醫院共同開發的基於山海大模型的門診病歷生成系統示範應用,在智慧醫療領域,基於雲知聲700億參數規模的自研“山海”大模型,結合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術,預計可提升醫生的電子病歷錄入效率超過400%,節約單個患者問診時間超過40%,提升醫生門診效率超過66%。
實際上,大模型是典型贏家通吃領域。需要更多的錢,需要更多的算力,以及更優秀人才。因為更好的算力意味著更多人用,更多人用意味著更多數據,更多數據意味著更好的算力結果。大模型必然是巨頭必爭之地,巨頭有錢,有技術,更重要是有數據。
而創業公司項目太多,資金過於分散,尤其在企業端最終都變成了消耗資金買英偉達A100卡、買雲服務,沒有一個量化的企業發展流程。尤其在AI 公司、SaaS公司普遍盈利難、造血難之下,初創公司需要進行大模型商業化、盈利化。
所以,目前國內AI 大模型正在形成的是以阿里、騰訊、百度、華為、商湯等大公司建立的通用大模型基座以及算力中心,以及包括毫末智行、天眼查、雲知聲、中科聞歌、曠視等公司建立的垂直或行業領域大模型,只專注於一兩個領域解決核心問題。
政府支撐大模型場景落地
本次論壇上,北京市經信局再次公佈了北京市通用人工智能產業創新夥伴計劃第二批成員,有63家企業入選。
據了解,截至6月30日,共有416家京內外大模型研發和應用企業申請加入第二批“夥伴計劃”。最終,包括北京百度網訊科技有限公司、中電數據服務有限公司、北京集智未來人工智能產業創新基地有限公司等63家企業入選並公佈。其中,算力夥伴10家,數據夥伴10家,模型夥伴10家,應用夥伴24家、投資夥伴9家。此外,評估出模型觀察員30家。
據鈦媒體App估算,截至目前已經有超過80家公司和機構,入選到了北京市通用人工智能產業創新夥伴計劃當中。
**目前,北京正快速推進AI 大模型建設和產業佈局工作。 **
5月21日,北京市人民政府印發《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025年)》的通知,到2025年,北京人工智能技術創新與產業發展進入新階段,基礎理論研究取得突破,原始創新成果影響力不斷提升,而且人工智能產業規模持續提升,形成具有國際競爭力和技術主導權的產業集群。
5月23日,北京市人民政府辦公廳印發《北京市促進通用人工智能創新發展的若干措施》的通知,要求充分發揮政府引導作用和創新平台催化作用,整合創新資源,加強要素配置,營造創新生態,重視風險防範,推動北京市通用人工智能實現創新引領和理性健康發展。
北京市政務服務管理局一位負責人在現場演講中提到,為了支撐平台“京策”建設,政府需要在場景領域進行通用大模型技術落地,從而提升政策規範管理和精準服務能力。 “對海量市民訴求數據進行深度挖掘分析,為領導決策、基層治理、城市治理提供更有力支撐。”
上述負責人提到,場景推進方面,先期會使用開放的小接口模式,後續會開展私有化的深度應用。長期來看,他們將在數據安全可控的條件下,通過建立數字保護機制和技術評價,來開放高質量可信的政務數據集。
中科聞歌交付中心負責人王璋盛在和鈦媒體App交流中提到,政府類客戶對於AI 大模型的訴求是很高的,該領域在大模型應用中也需要數據安全、數據治理等條件,尤其進行高質量數據訓練,從而更好解決該領域的實際應用問題。
蜜度CTO劉益東對鈦媒體App表示,公司去年開始使用華為雲基礎設施產品展開政務、媒體等領域的業務落地,如今該公司即將發布專注於網絡輿論的垂直行業大模型產品。
“政府開始買單'大模型',一方面是政策引導和實際應用場景訴求,另一方面是企業自身需要通過大模型來解決成本問題、商業化問題。”一位行業人士向鈦媒體App分析,國內大模型行業正在回到AI 企業與政府結合形成商業化、拿政府補助的時期。
姜廣智表示,當前,北京正加快推進國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區建設,打造具有全球影響力的人工智能創新策源地,具體措施包括以下三點:
姜廣智強調,北京市經信局將不斷加強優質資源要素配置,有效整合創新資源,積極營造創新生態,夯實人工智能產業發展基礎。
“大模型不是一家企業能夠做出來的,最好是大家在算力、模型、數據這些層面形成幾個大的生態,尤其是在政府部門的指導下,企業能夠在生態中形成夥伴關係,這樣大家更多是合作而不是競爭。未來,大模型可能會形成有生態,有夥伴,大家一起共贏的關係。”君聯資本執行董事紀海泉表示。