免費使用，谷歌投資3 億美元的Anthropic 正式推出Claude 2，直接對標GPT-4

2023-07-12 08:08:23

圖片來源：由無界AI 生成

微軟憑藉對OpenAI 的投資在這場AI 變革中大殺四方，其競爭對手谷歌不甘示弱，試圖使用相同的方式來迎戰，重金押注了OpenAI 的競爭對手生成式AI 初創公司Anthropic。 Anthropic 之於谷歌，就像OpenAI 之於微軟。

Anthropic本身就與OpenAI 的淵源頗深。由於在OpenAI在發展方向上產生分歧，擔心微軟對OpenAI的首次10億美元的投資後，會使其走上更加商業化的道路，偏離初衷，彼時為OpenAI研發副總裁Dario Amodei領導的團隊選擇離開並在2021 年成立了Anthropic。

截至2022 年底，Anthropic 已籌集7 億美元資金，其中5 億美元來自Alameda Research。谷歌的雲部門隨後投資3 億美元獲得10% 的股份，該交易要求Anthropic 從谷歌云購買計算資源。 2023年5月，Anthropic在Spark Capital領投的一輪融資中籌集了4.5億美元。至此，Anthropic 已經籌集了近15 億美元資金。

今年3 月份，Anthropic 發布了一款類似ChatGPT的AI聊天機器人產品Claude。 Claude 有520 億個參數，最初通過Slack 集成在封閉測試版中提供，現在用戶可以通過Quora 的Poe 應用程序以及其他六個聊天機器人訪問Claude。然而，Claude 的熱度明顯遠不及ChatGPT 和最新的GPT-4。

7月11 日，Anthropic 推出了新版人工智能聊天機器人：Claude 2，目標直接與GPT-4 競爭。

Anthropic表示，最新模型Claude 2 提高了編碼、數學和推理方面的性能，可以生成更長的響應。

Claude 2具有包含100k 個token 的上下文窗口，是所有商用模型中最大的。 Claude 2 能夠一次性處理大約7.5萬個單詞的文本。用戶可以輸入大量數據集，並要求以備忘錄、信件或故事的形式進行總結。相比之下，ChatGPT可一次性處理3000個單詞的文本，而GPT 4則可以處理25000個單詞的文本。 Claude 2 訓練數據集中10 % 為非英語數據，在處理中文請求時不在話下。

Claude 2 對比GPT-4

英偉達高級AI 科學家Jim Fan 表示，Claude 2 比GPT-4 更便宜，並且在推理和編碼方面比舊版強大得多。

但在標准考試中，它還沒有完全達到GPT-4，但與Claude v1.3 相比已經快速趕上。

GRE口語考試：165 vs 169（GPT-4 獲勝）
GRE寫作考試：5 vs 4（Claude 2 獲勝）
GRE數學考試：154 vs 163 (GPT-4 獲勝)
USMLE（美國職業醫師資格考試）：~67 與~85 (GPT-4 獲勝)
Bar（美國律師執照考試）：76.5 vs 75.7（Claude 2 獲勝）

在推理基準測試中：

Human編碼：71.2% vs 67%（ Claude 獲勝）。值得一提的是，GPT-3.5 的得分僅為48%。 Claude 的編碼能力得到了顯著的提高。
GSM-8K小學數學：88% 與92% (GPT-4 獲勝)。與之前的版本相比，Claude 從85.2%提高到88%。
Claude 2（100K 上下文）比GPT-4-32K 便宜4-5 倍！假設token 長度相似，代幣成本為11 美元/百萬token vs 60 美元/百萬token，完成成本為32 美元/百萬vs 120 美元/百萬。

Claude 2的知識更新截止日期是2023年初，而GPT-4是2021年9月。所以Claude 2 的內容要新鮮得多。除了這些基準測試，Claude 2在編碼、數學和推理方面的進步讓人眼前一亮。

憑藉對超量文本的支持，有用戶認為Claude2 殺死了所有“chatPDF”工具——您現在可以上傳PDF 文件，讓Claude2 幫你分析。 Claude2 目前支持同時對最多5 個10 MB 以內文檔同時進行總結分析。支持pdf、text、csv 等格式。

一位用戶嘗試將特斯拉最新的第一季度財報上傳，並詢問，“特斯拉第一季度財報更新的主要內容是什麼？您能對價格做出任何預測嗎？”

Claude 2 能夠完美地回答這個問題，並有消息來源。

還有用戶上傳了谷歌最新的財報記錄，並要求其總結要點。結果比帶有代碼解釋器的ChatGPT 好得多，後者俱有8k token 限制。

Claude 2 目前已經面向UK 和US 用戶免費開放使用（有興趣的人可以科學嘗試一下，在GPT-4 需要付費訂閱的情況下，這是一個不錯的替代選擇。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

讚賞
點讚
留言
分享

留言

0/400

暫無留言