📢 股票資產上鏈,全球首發盡在 Gate!
Gate 攜手 @xStocksFi 與 @BackedFi,正式上線全球首個股票衍生品市場,開啓鏈上股票交易新紀元!
支持$TSLA, $NVDA, $CRCL, $AAPL 等熱門股票:
💥 可加槓杆、做多做空
💰 全USDT計價,輕鬆管理風險收益
🔒 實物資產 100% 抵押
🔁 多鏈流轉自由無阻
🌐 RWA × Web3,全新交互方式
CeFi 與 TradFi 的邊界,已經徹底打破。
了解詳情:https://www.gate.com/announcements/article/45926
#xStocksOnGate#
GPT-4是8x2200億參數的混合模型?這個小道消息今天傳瘋了
來源:機器之心
「GPT-4 的參數量高達100 萬億。」相信很多人還記得這個年初刷屏的「重磅」消息和一張被病毒式傳播的圖表。
實際上,許多人相信並傳播這樣的謠言是因為近年來AI 社區不斷在增加AI 模型的參數規模。谷歌在2021 年1 月發布的Switch Transformer 就把AI 大模型參數量拉高到了1.6 萬億。在此之後,很多機構也陸續推出了自己的萬億參數大模型。據此,人們有充分的理由相信,GPT-4 將是一個萬億參數的巨量模型,100 萬億參數也不是不可能。
雖然Sam Altman 的闢謠幫我們去掉了一個錯誤答案,但他背後的OpenAI 團隊一直對GPT-4 的真實參數量守口如瓶,就連GPT-4 的官方技術報告也沒透露任何信息。
直到最近,這個謎團疑似被「天才黑客」喬治・霍茲(George Hotz)捅破了。
喬治・霍茲因17 歲破解iPhone、21 歲攻陷索尼PS3 而聞名,目前是一家研發自動駕駛輔助系統的公司(comma.ai)的老闆。
最近,他接受了一家名為Latent Space 的AI 技術播客的採訪。在採訪中,他談到了GPT-4,稱GPT-4 其實是一個混合模型。具體來說,它採用了由8 個專家模型組成的集成系統,每個專家模型都有2200 億個參數(比GPT-3 的1750 億參數量略多一些),並且這些模型經過了針對不同數據和任務分佈的訓練。
對於未來的趨勢,他認為,人們會訓練規模較小的模型,並通過長時間的微調和發現各種技巧來提升性能。他提到,與過去相比,訓練效果已經明顯提升,儘管計算資源沒有變化,這表明訓練方法的改進起到了很大作用。
目前,George Hotz 關於GPT-4 的「爆料」已經在推特上得到了廣泛傳播。