Thậm chí không biết làm câu hỏi thời trung học cơ sở, ChatGPT, Wenxin Yiyan, Claude khoe chân gà?

"Kết quả tôi tính toán với một số mô hình là khác nhau..."

Ngày 14/7, một nhóm bạn đã sử dụng AI để hỗ trợ giải bài toán: thể tích tính bằng mililit của một chiếc bục tròn cao 11cm, đường kính đáy trên 7,8cm, đường kính đáy 6,2cm. đáy?

Cư dân mạng này đã sử dụng Claude-2, GPT-4 và ChatGPT và kết quả là: 3634,57 ml, 359,4 ml và 469,3 ml.

Một người bạn khác trong nhóm đã sử dụng các từ của Wenxin để thu được kết quả là 64474,666666666635 ml.

"Em không làm được câu hỏi cấp 2", "Giỏi nhỉ, khác hẳn mọi người", nhóm bạn vội bình luận.

Tôi cũng đã thử nghiệm nó với ChatGPT vì tò mò và kết quả là 1436,08 ml.

Các bước tính mà ChatGPT đưa ra là hoàn toàn chính xác, công thức thể tích của bảng tròn = πh*(R^2+r^2+R*r)/3.

Tuy nhiên, kết quả tính toán là sai.

Tôi đã hỏi lại ChatGPT để trả lời và kết quả là 513,47 ml.

Thật kỳ quặc, các bước tính toán hoàn toàn chính xác và kết quả cuối cùng mỗi lần lại khác nhau.

Tôi cũng đã sử dụng "AI" đi kèm với trình duyệt Baidu, một mô hình lớn được hỗ trợ bởi Wenxin Yiyan.

Kết quả đầu tiên là: 193522.10746113118 ml

Sai quá, em hỏi lại thì ra kết quả: 1168.75 ml

Vẫn không đúng, tôi hỏi lại và kết quả là: 1099620ml

Sau nhiều lần đặt câu hỏi, AI của Baidu không còn được cài đặt nữa và nó đã bị hỏng hoàn toàn.

Trước đây đã có báo cáo rằng GPT-4 đã đạt điểm tối đa trong kỳ thi cử nhân toán học của MIT và sau đó có thông tin tiết lộ rằng một phần lớn bộ dữ liệu thử nghiệm đã bị nhiễm độc. Nói cách khác, người mẫu giống như một học sinh được nghe đáp án trước kỳ thi, đó là sự “gian lận” trắng trợn.

Trước đó cũng có thông tin cho rằng ChatGPT đã bị lật khi đang làm bài kiểm tra toán trong kỳ thi tuyển sinh đại học Trung Quốc.

Các mô hình quy mô lớn chắc chắn là một công nghệ được săn đón gần đây. lý thuyết." Máy **, bộ chuyển đổi tạo ra sự tiếp tục hợp lý của đầu vào, và không khó để hiểu những trò đùa vô nghĩa nghiêm túc.

Nếu mô hình lớn là chiến thắng của lý thuyết xác suất, thì sự thức tỉnh của trí tuệ nhân tạo còn lâu mới đến.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)