Miễn phí sử dụng, Google đầu tư 300 triệu USD vào Anthropic chính thức ra mắt Claude 2, trực tiếp benchmark GPT-4

Nguồn hình ảnh: Được tạo bởi Unbounded AI

Với khoản đầu tư vào OpenAI, Microsoft đã giết chết tất cả các bên trong cuộc cách mạng AI này, đối thủ của họ là Google, không chịu kém cạnh, đã cố gắng sử dụng phương pháp tương tự để chiến đấu, đặt cược rất nhiều vào Anthropic, công ty khởi nghiệp AI sáng tạo của đối thủ OpenAI. Anthropic đối với Google giống như OpenAI đối với Microsoft.

Bản thân Anthropic có nguồn gốc sâu xa với OpenAI. Do có sự khác biệt trong hướng phát triển của OpenAI, lo lắng rằng sau khoản đầu tư 1 tỷ USD đầu tiên của Microsoft vào OpenAI, nó sẽ khiến nó đi theo con đường thương mại hơn và đi chệch khỏi ý định ban đầu, nhóm nghiên cứu do Phó chủ tịch R&D của OpenAI, Dario, đứng đầu. Amodei đã chọn Trái và thành lập Anthropic vào năm 2021.

Anthropic đã huy động được 700 triệu đô la tài trợ vào cuối năm 2022, với 500 triệu đô la từ Alameda Research. Cánh tay đám mây của Google sau đó đã đầu tư 300 triệu đô la cho 10% cổ phần, một thỏa thuận yêu cầu Anthropic mua tài nguyên máy tính từ Google Cloud. Vào tháng 5 năm 2023, Anthropic đã huy động được 450 triệu đô la trong vòng tài trợ do Spark Capital dẫn đầu. Đến nay, Anthropic đã huy động được gần 1,5 tỷ USD tiền tài trợ.

Vào tháng 3 năm nay, Anthropic đã phát hành Claude, một sản phẩm robot trò chuyện AI tương tự như ChatGPT. Claude, với 52 tỷ tham số, ban đầu có sẵn trong phiên bản beta kín thông qua tích hợp Slack và giờ đây người dùng có thể truy cập Claude thông qua ứng dụng Poe của Quora, cũng như sáu chatbot khác. Tuy nhiên, sức nóng của Claude rõ ràng là kém xa so với ChatGPT và mới nhất là GPT-4.

Vào ngày 11 tháng 7, Anthropic đã ra mắt phiên bản mới của chatbot AI: Claude 2, nhằm cạnh tranh trực tiếp với GPT-4.

Anthropic cho biết mô hình mới nhất của họ, Claude 2, đã cải thiện hiệu suất trong mã hóa, toán học và lý luận, đồng thời có thể tạo ra các phản hồi dài hơn.

Claude 2 có cửa sổ ngữ cảnh gồm 100 nghìn mã thông báo, lớn nhất trong số tất cả các mô hình thương mại. Claude 2 có khả năng xử lý khoảng 75.000 từ văn bản cùng một lúc. Người dùng có thể nhập các tập dữ liệu lớn và yêu cầu tóm tắt dưới dạng ghi nhớ, thư hoặc câu chuyện. Để so sánh, ChatGPT có thể xử lý 3.000 từ văn bản cùng một lúc, trong khi GPT 4 có thể xử lý 25.000 từ văn bản. 10% tập dữ liệu huấn luyện Claude 2 là dữ liệu không phải tiếng Anh, đây không phải là vấn đề khi xử lý các yêu cầu của Trung Quốc.

Claude 2 so với GPT-4

Nhà khoa học AI cấp cao của Nvidia, Jim Fan, cho biết Claude 2 rẻ hơn GPT-4 và mạnh hơn nhiều về khả năng suy luận và mã hóa so với các phiên bản cũ.

Nhưng trong bài test tiêu chuẩn thì nó chưa hẳn đạt GPT-4 nhưng so với Claude v1.3 thì nó đã bắt kịp rất nhanh.

  • Bài kiểm tra nói GRE: 165 vs 169 (GPT-4 thắng) *Bài kiểm tra viết GRE: 5 vs 4 (Claude 2 thắng)
  • Bài kiểm tra GRE Math: 154 vs 163 (GPT-4 thắng)
  • USMLE: ~67 vs ~85 (GPT-4 thắng)
  • Thanh (USB): 76.5 so với 75.7 (Claude 2 thắng)

Trong điểm chuẩn suy luận:

  • Mã hóa con người: 71,2% so với 67% (Claude thắng). Điều đáng nói là điểm của GPT-3.5 chỉ là 48%. Khả năng mã hóa của Claude đã được cải thiện đáng kể.
  • GSM-8K Elementary Math: 88% vs 92% (GPT-4 thắng). So với phiên bản trước, Claude cải thiện từ 85,2% lên 88%.
  • Claude 2 (100K context) rẻ hơn GPT-4-32K 4-5 lần! Giả sử độ dài mã thông báo tương tự, chi phí mã thông báo là 11 đô la/triệu mã thông báo so với 60 đô la/triệu mã thông báo và chi phí hoàn thành là 32 đô la/triệu so với 120 đô la/triệu mã thông báo.

Hạn chót cập nhật kiến thức cho Claude 2 là đầu năm 2023, trong khi GPT-4 là tháng 9 năm 2021. Vì vậy, nội dung của Claude 2 tươi hơn nhiều. Ngoài những điểm chuẩn này, những cải tiến của Claude 2 về mã hóa, toán học và lý luận là rất ấn tượng.

Với sự hỗ trợ cho quá nhiều văn bản, một số người dùng nghĩ rằng Claude2 đã giết chết tất cả các công cụ "chatPDF" - giờ đây bạn có thể tải lên các tệp PDF và để Claude2 phân tích chúng cho bạn. Claude2 hiện hỗ trợ tóm tắt và phân tích tối đa năm tài liệu trong vòng 10 MB cùng một lúc. Hỗ trợ pdf, văn bản, csv và các định dạng khác.

Một người dùng đã cố gắng tải lên báo cáo thu nhập Q1 mới nhất của Tesla và hỏi: "Những điểm chính từ bản cập nhật thu nhập Q1 của Tesla là gì? Bạn có thể đưa ra bất kỳ dự đoán giá nào không?"

Claude 2 có thể trả lời câu hỏi này một cách hoàn hảo và có nguồn.

Những người dùng khác đã tải lên hồ sơ thu nhập mới nhất của Google và yêu cầu họ tóm tắt những điểm chính. Kết quả tốt hơn nhiều so với ChatGPT với trình thông dịch mã, có giới hạn 8k mã thông báo.

Claude 2 hiện miễn phí cho người dùng ở Vương quốc Anh và Hoa Kỳ (những người quan tâm có thể dùng thử một cách khoa học, đây là một giải pháp thay thế tốt trong trường hợp GPT-4 yêu cầu đăng ký trả phí.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)