📢 Gate廣場 #NERO发帖挑战# 秀觀點贏大獎活動火熱開啓!
Gate NERO生態周來襲!發帖秀出NERO項目洞察和活動實用攻略,瓜分30,000NERO!
💰️ 15位優質發帖用戶 * 2,000枚NERO每人
如何參與:
1️⃣ 調研NERO項目
對NERO的基本面、社區治理、發展目標、代幣經濟模型等方面進行研究,分享你對項目的深度研究。
2️⃣ 參與並分享真實體驗
參與NERO生態周相關活動,並曬出你的參與截圖、收益圖或實用教程。可以是收益展示、簡明易懂的新手攻略、小竅門,也可以是行情點位分析,內容詳實優先。
3️⃣ 鼓勵帶新互動
如果你的帖子吸引到他人參與活動,或者有好友評論“已參與/已交易”,將大幅提升你的獲獎概率!
NERO熱門活動(帖文需附以下活動連結):
NERO Chain (NERO) 生態周:Gate 已上線 NERO 現貨交易,爲回饋平台用戶,HODLer Airdrop、Launchpool、CandyDrop、餘幣寶已上線 NERO,邀您體驗。參與攻略見公告:https://www.gate.com/announcements/article/46284
高質量帖子Tips:
教程越詳細、圖片越直觀、互動量越高,獲獎幾率越大!
市場見解獨到、真實參與經歷、有帶新互動者,評選將優先考慮。
帖子需原創,字數不少於250字,且需獲得至少3條有效互動
百川VS智譜,誰是中國的OpenAI?
文章來源:光錐智慧
文:郝鑫
編:劉雨琦
6月初,外媒曾發出了“誰是中國的OpenAI”的拷問,經歷了大模型創業潮之後,大浪淘沙,最終留下的不過寥寥數人。
清華大學幾個十字路口外的賽爾大廈,是明星創業者王小川的百川智慧,搜狐網路大廈是學院派出身的智譜AI。 二者在經歷了市場的檢驗后,成為了最有希望的兩個候選人。
兩棟樓的爭奪戰,似乎已經悄然打響了。
**從融資上看,智譜AI和百川智慧都在今年,完成了多輪大額融資。 **
今年,智譜AI累計總融資金額超25億元人民幣,百川智慧總融資金額達到3.5億美元(約23億人民幣)。 公開信息顯示,**智譜 AI 最新估值已經超100億人民幣,最高或達150億,是國內估值最快超過百億人民幣的公司之一; **最新一輪融資后,百川智慧估值已經超過10億美金(約66億人民幣)。
從團隊構成上看,智譜AI和百川智慧師出同門,智譜AI總裁王紹蘭與搜狗創始人王小川,同為清華系創業團隊。
**從技術追趕速度來看,二者也不分伯仲。 **智譜AI的GLM-130B剛問世就打敗了GPT-3,而最新發佈的Baichuan 2在各維度領先Llama 2,開拓了中國開源生態發展。
種種跡象顯示,智譜AI和百川智慧已經成為了中國大模型賽道衝出的「黑馬」,激烈的角逐下,究竟鹿死誰手?
OpenAI的信徒:智譜AI
智譜AI與OpenAI的淵源可以追溯到2020年,那一年被智譜AI CEO張鵬視為心中真正的“AI大語言模型元年”。
智譜AI與OpenAI的淵源可以追溯到2020年,那一年被智譜AI CEO張鵬視為心中真正的“AI大語言模型元年”。
智譜AI周年慶日的當天,喜悅的空氣氛圍中,時不時能嗅到GPT-3出世帶來的些許焦慮。 達到1750億個參數的GPT-3是嚴格意義上的第一個大語言模型。
彼時,張鵬既震驚於GPT-3的湧現能力,也陷入了“要不要跟隨”的思考之中,不管是當時還是現在,All in超大規模參數大模型方向都是一件極其冒險的事情。 權衡過後,智譜AI決定把OpenAI作為自己的對標物件,投入到超大規模預訓練模型的研發當中。
**在技術路徑選擇上,智譜AI與OpenAI具有同樣的獨立思考性。 **
當時存在BERT、GPT和T5幾種大模型預訓練框架。 三種路徑,在訓練目標、模型結構、訓練數據來源、模型大小幾方面都各有優劣。
假如把大模型訓練過程比作一場英文考試,BERT擅長通過詞句之間關係來做題,通過理解去考試,其複習資料主要源於課本和維琪百科; GPT擅長通過預測下一個詞來做題,通過大量寫作練習來準備考試,其複習資料主要來自各種各樣的網頁; T5則採取了一種將題目形式化的策略,先把題目翻譯成漢語再去解題,在複習時,不僅閱讀課本,還刷了大量題庫。
眾所周知,谷歌選擇了BERT,OpenAI選擇了GPT,智譜AI沒有盲目跟從,**在這兩種路線基礎上提出了 GLM(General Language Model)演算法框架。 該框架實則實現了BERT、GPT優劣互補,“既能在理解的同時,還能完成續寫和填空”。 **
GLM由此成為了智譜AI追逐OpenAI最大的底氣,在此框架之下陸續長出了GLM-130B、ChatGLM-6B、ChatGLM2-6B等GLM系列大模型。 實驗數據顯示,GLM系列大模型在語言理解精度、推理速度、記憶體佔比和大模型適配應用方面都優於GPT。
OpenAI是當前國外能提供基礎模型服務最為完備的機構,其商業化主要分為兩類,一類是API調取收費,一類是ChatGPT訂閱制收費。 在商業化方面,智譜AI也遵循了大致的思路,處於國內大模型商業化較為成熟的企業梯隊。
據光錐智慧梳理髮現,結合中國企業的落地情況,**智譜AI的商業模式分為API調取收費和私有化收費模式。 **
總體提供的模型種類分別有語言大模型、超擬人大模型、向量大模型與代碼大模型,在每個大模型選項下包括了標準定價、雲端私有化定價和本地私有化定價。 對比OpenAI,智譜AI缺乏了語音、圖像大模型服務的提供,但增加了超擬人大模型,這也迎合了中國數位人、智慧NPC等行業的需求。
光錐智慧向開發者瞭解到,“目前,百度文心千帆平臺的特點是完善,通義千問的特點是靈活,智譜AI則是市場主流廠商中API收費最便宜的公司之一”。
智譜AI的ChaGLM-Pro的收費為0.01元/千tokens,並贈送18元的免費額度,ChaGLM-Lite收費降至0.002元/千tokens。 作為參考,OpenAI GPT-3.5收費為0.014元/千tokens,阿裡通義千問-turbo收費為0.012元/千tokens,百度文心一言 emie-bot-turbo的收費標準為0.008元/千 tokens。
正如張鵬所言,智譜AI也正在經歷以OpenAI為目標到“不再追隨OpenAI”的新階段。
產品業務方面,不同於OpenAI只專注於ChatGPT的升級打造,智譜AI選擇了三面出擊。
據其官網顯示,當前智譜AI的業務主要分為了三大塊,分別為大模型MaaS平臺、AMiner 科技情報平臺和認知數位人。 由此形成了三大AI產品矩陣,大模型產品、AMiner產品以及數位人產品。 其中,大模型產品不僅涵蓋了基本對話機器人,還有程式設計、寫作、繪畫垂類的機器人劃分。
與此同時,智譜AI還在通過投資的方式繼續向應用側上探。 截至目前,智譜AI對外投資了聆心智慧和畫壁智慧,並於今年九月份再次增持了聆心智慧股份。
聆心智能同樣孵化自清華大學計算機系,雖系出同源,但聆心智慧更偏向於應用,其開發出的AiU興趣互動社區就是基於智譜AI的超擬人大模型。 其產品的開發思路類似於國外的Character AI,通過創造不同性格與人設的AI角色,與之進行互動聊天,更加偏向於C端應用,強調娛樂的屬性。
從OpenAI轉向LIama:百川智慧
光錐智能發現,相比於OpenAI,百川智慧更像Llama。
**首先是站在原有的技術、經驗基礎之上,發佈和反覆運算速度非常快。 **
百川智慧成立半年,便接連發佈了baichuan-7B/13B,Baichuan2-7B/13B四款開源可免費商用大模型及Baichuan-53B、Baichuan2-53B兩款閉源大模型。 截至9月25日開放Baichuan2-53B API介面,過去的168天里,百川智慧平均以月為單位的速度發佈一款大模型。
Meta靠LLama2重新贏回AI陣地,百川智慧則憑藉Baichuan2系列開源模型打敗LLama2名聲大噪。
據測試結果表明,Baichuan2-7B-Base 和 Baichuan2-13B-Base,在MMLU、CMMLU、GSM8K等幾大權威評估基準中,以絕對優勢領先LLaMA2,相比其他同等參數量大模型,表現也十分亮眼,性能大幅度優於LLaMA2等同尺寸模型競品。
事實證明,百川智慧大模型也的確經得過考驗。 據官方數據,Baichuan在開源社區總下載量已經超過500萬次,月下載量達到300多萬次。
光錐智能發現,百川智慧系列模型在Hugging Face開源社區的最高下載量有11萬多,在中外開源大模型中仍具有競爭力。
其開源之所以具有優勢與其較強的相容性也有關係,百川智慧曾在公開場合介紹,其整個大模型底座結構更加接近Meta的LLAMA的結構,故而從開源設計上就對企業和廠商很友好。
**“開源之後,生態會圍繞LLaMA去構建,在國外有很多開源專案是跟著LLaMA去推動的,這也是我們的結構為什麼跟LLaMA更加接近。 “**王小川道。
據光錐智能瞭解到,百川智慧在架構設計上採用了熱插拔(Hot-pluggable),可支援百川模型與LLAMA模型、百川模型不同模塊之間的隨意切換,比如用LLAMA訓練一個模型後,無需修改,就直接能把這個模型放到百川中使用。 這也解釋了現在多數互聯網大廠使用百川模型,和雲廠商引入百川系列模型的原因。
歷史走過的路,既通向過去,也通向未來,王小川的大模型創業便是如此。
源於搜狗創始人的身份和搜索技術經驗,創業初期,王小川獲得了不少人這樣的評價,“小川,是最適合搞大模型的啊”。
**在搜索經驗和框架中構建大模型成為了百川智慧的底色。 **
百川智慧技術聯創陳煒鵬曾表示,搜索研發與大模型開發有許多類似之處,“百川智慧將搜索的經驗快速遷移到大模型的研發中,這就類似一個'造火箭'系統化工程,將複雜的系統做拆解,通過過程評估來推動團隊的協同,提升團隊的效果”。
王小川也在發佈會現場談道:「因為百川智慧之前有搜索基因,因此天然懂得如何從萬億網頁中間去精選最好的頁面,可以做到去重、反垃圾。 在數據處理中,百川智慧也借鑒了之前搜索的經驗,能小時級完成千億數據的清洗和去重工作”
其大模型搜索的內核在Baichuan-53B中展現得淋漓盡致。 在處理大模型「幻覺」問題上,結合搜索技術沉澱,百川智慧在信息獲取、提升數據品質、搜索增強等方面做了優化。
儘管以開源為始,但百川智慧已經開始探索商業化路徑。 官方資料顯示,百川智慧的目標有兩個方向,橫向維度的目標是「構建中國最好的大模型底座」,縱向維度的目標是在搜索、多模態、教育、醫療等領域增強。
如今的商業化,集中在了Baichuan2-53B,官網顯示,該模型的API調取採用了分時段收費標準。 0:00-8:00收費為0.01元/千tokens,8:00-24:00收費為0.02元/千token,相比較之下,白天的收費價格要高於晚上。
結尾
爭論誰是中國的OpenAI這一問題,在大模型發展的早期沒有太大的意義。 智譜AI、百川智慧等諸多初創公司已經意識到盲目跟隨OpenAI的腳步並不可取,例如智譜AI已經明確了“不做中國GPT”的技術路徑。 再者,在開源蔚然成風,正在形成包圍之勢的當下,OpenAI的絕對技術優勢地位似乎也並不是牢不可破。
智譜AI、百川智慧曾不約而同地提到,超級應用才是更廣闊的市場,也是中國大模型企業的舒適區,不再停留原地,比如一位接近智譜AI人士曾向媒體爆料,智譜AI團隊已經堅定2B路線,瞄準信創市場,並在5個月里,快速擴張團隊,從200人增至500人,以為後續的2B業務儲備人力。
而百川智慧在商業化路徑上,則選擇了參照Llama2的開源生態,也已經開始小步反覆運算。
肉眼可見的是,僅半年時間,百川智慧和智譜AI就已經走過了技術無人區,來到了面向產業落地的商業化階段。 對比AI1.0的創業熱潮,技術打磨期長達3年(2016-2019年),而正是由於在商業落地上受阻,才導致了一大批AI公司在2022年集體走向沒落,倒在了黎明前。
吸取了上一階段的教訓,同時也源於大模型技術的通用性更便於落地,以百川智慧和智譜AI為代表的創業公司,正養兵秣馬,為下一階段做好技術、產品和人才儲備。
不過,場馬拉松也才聽到第一聲槍響,言結果為時尚早。 但至少對賽道的第一階段分解已經完成,目標明確后,比拼的更是耐心和毅力。 這一點,無論對於百川智慧、智譜AI還是OpenAI,都一樣。