Claude 2具有包含100k 個token 的上下文窗口,是所有商用模型中最大的。 Claude 2 能夠一次性處理大約7.5萬個單詞的文本。用戶可以輸入大量數據集,並要求以備忘錄、信件或故事的形式進行總結。相比之下,ChatGPT可一次性處理3000個單詞的文本,而GPT 4則可以處理25000個單詞的文本。 Claude 2 訓練數據集中10 % 為非英語數據,在處理中文請求時不在話下。
Claude 2 對比GPT-4
英偉達高級AI 科學家Jim Fan 表示,Claude 2 比GPT-4 更便宜,並且在推理和編碼方面比舊版強大得多。
但在標准考試中,它還沒有完全達到GPT-4,但與Claude v1.3 相比已經快速趕上。
GRE口語考試:165 vs 169(GPT-4 獲勝)
GRE寫作考試:5 vs 4(Claude 2 獲勝)
GRE數學考試:154 vs 163 (GPT-4 獲勝)
USMLE(美國職業醫師資格考試):~67 與~85 (GPT-4 獲勝)
Bar(美國律師執照考試):76.5 vs 75.7(Claude 2 獲勝)
在推理基準測試中:
Human編碼:71.2% vs 67%( Claude 獲勝)。值得一提的是,GPT-3.5 的得分僅為48%。 Claude 的編碼能力得到了顯著的提高。
免費使用,谷歌投資3 億美元的Anthropic 正式推出Claude 2,直接對標GPT-4
微軟憑藉對OpenAI 的投資在這場AI 變革中大殺四方,其競爭對手谷歌不甘示弱,試圖使用相同的方式來迎戰,重金押注了OpenAI 的競爭對手生成式AI 初創公司Anthropic。 Anthropic 之於谷歌,就像OpenAI 之於微軟。
Anthropic本身就與OpenAI 的淵源頗深。由於在OpenAI在發展方向上產生分歧,擔心微軟對OpenAI的首次10億美元的投資後,會使其走上更加商業化的道路,偏離初衷,彼時為OpenAI研發副總裁Dario Amodei領導的團隊選擇離開並在2021 年成立了Anthropic。
截至2022 年底,Anthropic 已籌集7 億美元資金,其中5 億美元來自Alameda Research。谷歌的雲部門隨後投資3 億美元獲得10% 的股份,該交易要求Anthropic 從谷歌云購買計算資源。 2023年5月,Anthropic在Spark Capital領投的一輪融資中籌集了4.5億美元。至此,Anthropic 已經籌集了近15 億美元資金。
今年3 月份,Anthropic 發布了一款類似ChatGPT的AI聊天機器人產品Claude。 Claude 有520 億個參數,最初通過Slack 集成在封閉測試版中提供,現在用戶可以通過Quora 的Poe 應用程序以及其他六個聊天機器人訪問Claude。然而,Claude 的熱度明顯遠不及ChatGPT 和最新的GPT-4。
7月11 日,Anthropic 推出了新版人工智能聊天機器人:Claude 2,目標直接與GPT-4 競爭。
Anthropic表示,最新模型Claude 2 提高了編碼、數學和推理方面的性能,可以生成更長的響應。
Claude 2具有包含100k 個token 的上下文窗口,是所有商用模型中最大的。 Claude 2 能夠一次性處理大約7.5萬個單詞的文本。用戶可以輸入大量數據集,並要求以備忘錄、信件或故事的形式進行總結。相比之下,ChatGPT可一次性處理3000個單詞的文本,而GPT 4則可以處理25000個單詞的文本。 Claude 2 訓練數據集中10 % 為非英語數據,在處理中文請求時不在話下。
Claude 2 對比GPT-4
英偉達高級AI 科學家Jim Fan 表示,Claude 2 比GPT-4 更便宜,並且在推理和編碼方面比舊版強大得多。
但在標准考試中,它還沒有完全達到GPT-4,但與Claude v1.3 相比已經快速趕上。
Claude 2的知識更新截止日期是2023年初,而GPT-4是2021年9月。所以Claude 2 的內容要新鮮得多。 除了這些基準測試,Claude 2在編碼、數學和推理方面的進步讓人眼前一亮。
憑藉對超量文本的支持,有用戶認為Claude2 殺死了所有“chatPDF”工具——您現在可以上傳PDF 文件,讓Claude2 幫你分析。 Claude2 目前支持同時對最多5 個10 MB 以內文檔同時進行總結分析。支持pdf、text、csv 等格式。
一位用戶嘗試將特斯拉最新的第一季度財報上傳,並詢問,“特斯拉第一季度財報更新的主要內容是什麼?您能對價格做出任何預測嗎?”
Claude 2 能夠完美地回答這個問題,並有消息來源。
還有用戶上傳了谷歌最新的財報記錄,並要求其總結要點。結果比帶有代碼解釋器的ChatGPT 好得多,後者俱有8k token 限制。
Claude 2 目前已經面向UK 和US 用戶免費開放使用(有興趣的人可以科學嘗試一下,在GPT-4 需要付費訂閱的情況下,這是一個不錯的替代選擇。