Lỗ hổng trong bài báo của Tao Zhexuan đã được AI phát hiện, và dự đoán 26 năm sẽ trở thành sự thật! Đoán hướng nghiên cứu bằng cách nhìn vào tên của định lý, vị thần vĩ đại gọi khả năng AI là tuyệt vời

Nguồn bài viết: New Zhiyuan

Gần đây, Tao Zhexuan, một vị thần toán học quan tâm đến việc sử dụng GPT-4 và Copilot để nghiên cứu, đã phát hiện ra một lỗi ẩn trong bài báo của mình với sự trợ giúp của AI!

Tao Zhexuan nói rằng trong quá trình chính thức hóa lập luận ở trang 6 với Lean4, ông thấy rằng các biểu thức

Tại n = 3 và k = 2, nó thực sự là phân kỳ.

Lỗi không quá rõ ràng này đã được phát hiện kịp thời nhờ Lean4.

Lý do là, Lean yêu cầu anh ta xây dựng 02. Kết quả là, Lean không thể dựa trên số 0 âm

May mắn thay, đây chỉ là một lỗi nhỏ chỉ tồn tại khi giá trị n nhỏ. Tại thời điểm này, bạn chỉ cần sửa đổi một số hằng số trong bài báo.

Một số người hâm mộ đam mê toán học đã thốt lên trong bài đăng này: Điều này thật tuyệt vời, và thật tuyệt khi thấy sự lan rộng của các trợ lý bằng chứng AI, đặt nền tảng vững chắc hơn cho tương lai của nghiên cứu toán học.

Đào Triết Xuân cho rằng điều này hoàn toàn có thể xảy ra.

Có lẽ trong tương lai gần, chúng ta có thể xây dựng một lớp AI trên Lean.
Bằng cách mô tả các bước trong bằng chứng cho AI, AI có thể sử dụng Lean để thực hiện bằng chứng và trong quá trình này, nó cũng có thể gọi các gói đại số máy tính khác nhau.

Vào tháng 6 năm nay, Tao Zhexuan đã dự đoán trong một blog về kinh nghiệm thử nghiệm GPT-4 -

Năm 2026, AI sẽ được kết hợp với các công cụ tìm kiếm và toán học biểu tượng để trở thành đồng tác giả đáng tin cậy trong nghiên cứu toán học.

Trong giai đoạn này, có những người tiếp tục chứng minh điều này. Ví dụ, các học giả từ Caltech, NVIDIA, MIT và các tổ chức khác đã xây dựng một định lý prover dựa trên LLM nguồn mở.

Và Tao Zhexuan cũng đã thực hành nó, và bài báo mới đã bắt đầu được viết bằng GPT-4, và liên tục thốt lên - khả năng tuyệt vời của GitHub Copilot khiến tôi cảm thấy khó chịu!

**AI Blessing God Nghiên cứu Toán học **

Thời gian gần đây, Tao Zhexuan đã hoàn toàn "bước vào hố" của AI.

Với sự giúp đỡ của GPT-4, anh bắt đầu học cách viết bài và nghiên cứu toán học với Lean4.

Anh ấy rất hào hứng với quá trình này đến nỗi cứ vài giờ anh ấy lại đăng lên Mastodon để ghi lại những bài học và kinh nghiệm của mình.

Khi viết một bài báo về sự bất bình đẳng của McLaughlin, Tao đã sử dụng rộng rãi các công cụ AI như GPT-4, Copilot và Lean4.

Địa chỉ:

Khi chúng ta tiếp tục, Tao đã hoàn thành việc sửa chữa lập luận trong Phần 2 của bài báo trong Lean4.

Tuy nhiên, quá trình này tẻ nhạt hơn nhiều so với anh ta mong đợi, và mỗi dòng bằng chứng mất khoảng một giờ để chính thức hóa.

Trong tuần đầu tiên của dự án, nút thắt cổ chai của anh ấy là anh ấy không quen thuộc với cú pháp và công cụ Lean; Nhưng nút thắt cổ chai hiện tại nằm ở chính các công cụ - không tiên tiến như các công cụ trong các gói đại số máy tính.

Ví dụ, trong một dòng bài báo của mình, ông nói rằng sự bất bình đẳng:

Có thể sắp xếp lại như sau:

Giả sử tất cả các mẫu số đều dương, đây là một nhiệm vụ rất nhanh để tính toán thủ công và có thể được thực hiện khá dễ dàng trong bất kỳ gói đại số máy tính tiêu chuẩn nào.

Lean có các công cụ tự động rất hữu ích để xử lý các phép toán tuyến tính, nhưng hiện tại không có công cụ nào để tự động đơn giản hóa các biểu thức phức tạp liên quan đến số mũ.

Do đó, chúng ta phải từng bước xử lý luật hàm mũ và các hoạt động khác được đề cập ở trên, và quá trình này rất tốn thời gian.

Cuối cùng, Tao quyết định không sử dụng ký hiệu tiệm cận trong phần này của lập luận, mà thiết lập một bất đẳng thức với hằng số xác định C:

trong đó

Ban đầu, Tao nghĩ rằng sẽ "đơn giản hơn" để chứng minh sự bất đẳng thức với các giá trị như C = 7. Tuy nhiên, thật cồng kềnh khi sử dụng các công cụ hiện có để chứng minh chặt chẽ C≤7, vì vậy ý tưởng này đã bị từ bỏ để ủng hộ một giá trị C hoạt động chính thức hơn. Bây giờ được chọn, giá trị là khoảng 6,16.

Về vấn đề này, một số cư dân mạng tò mò đã hỏi: "AI làm gì trong việc chứng minh tốc độ so với số học tay?"

Tao Zhexuan nói rằng dựa trên những quan sát của riêng mình, các loại nhiệm vụ cơ học cho các gói đại số máy tính và máy tính không nhất thiết phải là cơ học cho các trợ lý chứng minh chính thức.

Nhưng với sự ra đời của LLM, chúng ta sẽ có thể hợp nhất tất cả các công cụ hỗ trợ máy tính thành một công cụ phổ quát, thân thiện với người dùng. Và công cụ này sẽ có tất cả các lợi ích của từng thành phần.

Thậm chí, trong tương lai gần, chúng ta cũng có thể hình dung việc xây dựng một lớp AI trên Lean -

Các bước trong bằng chứng được mô tả cho AI trong "Tiếng Anh toán học" và AI sau đó có thể cố gắng thực hiện nó bằng cách sử dụng Lean, có lẽ gọi một gói đại số máy tính trong quá trình này.

**Phi công phụ có thể đoán các bước tiếp theo **

Trước đây, trong bài báo về nghiên cứu bất bình đẳng của McLaughlin, Tao Zhexuan đã rất ngạc nhiên khi thấy rằng Copilot có thể dự đoán những gì anh ta muốn làm tiếp theo!

Nó không chỉ có thể dự đoán chính xác nhiều dòng mã được sử dụng cho các xác minh thông thường khác nhau mà còn có thể suy ra hướng mà anh ta muốn thực hiện nghiên cứu của mình dựa trên tên của định lý do Tao Zhexuan cung cấp.

Điều này khiến Đào Triết Xuyên phải thốt lên hết lần này đến lần khác: Thật không thể tin được!

Trong quá trình chứng minh định lý 1.3 trong bài báo, Tao Zhexuan đã sử dụng Lean4 để hoàn thành việc chính thức hóa chứng minh định lý.

Trong bài báo, chỉ có một trang trong quá trình chứng minh, nhưng bằng chứng chính thức sử dụng 200 dòng Lean4.

Ví dụ, trong bài báo, Đào Triết Xuân chỉ giả định

lồi trên bất kỳ số thực nào của a>0 và bất đẳng thức Jensen được gọi sau đó. Nhưng mã mất khoảng 50 dòng.

Trong quá trình này, GitHub Copilot đã cho thấy tất cả các loại dự đoán thần thánh, và dự đoán một cách kỳ diệu hướng nghiên cứu tiếp theo của Tao Zhexuan.

Chiến lược viết lại của Lean cho phép anh ta sửa đổi các giả định hoặc mục tiêu dài dòng thông qua các thay thế có mục tiêu.

Tính năng này cực kỳ quan trọng vì nó cho phép mọi người tự do thao tác các biểu thức này mà không cần phải nhập toàn bộ chúng mọi lúc.

Nói một cách tương đối, ở LaTex, hoạt động này cồng kềnh hơn nhiều.

Tao Zhexuan nói rằng ông cần mô phỏng đại khái chiến lược viết lại của Lean4 và thực hiện các chỉnh sửa có mục tiêu đối với các biểu thức dài từ dòng này sang dòng tiếp theo thông qua các thao tác như cắt và dán. Điều này có thể khiến lỗi chính tả lan rộng trên nhiều dòng trong tài liệu.

Lean4 có thể thực hiện việc viết lại này một cách tự động và có thể kiểm chứng được.

Tất nhiên, Lean 4 không phải là thuốc chữa bách bệnh vào lúc này, và có một số hạn chế. Ví dụ, viết lại các biểu thức liên quan đến các biến ràng buộc không phải lúc nào cũng dễ dàng.

Tao Zhexuan nói rằng anh đang mong chờ khi dễ dàng sử dụng ngôn ngữ tự nhiên để yêu cầu LLM thực hiện chuyển đổi như vậy.

** Vào hố GPT-4 + GitHub Copilot, Crazy Amway **

Ngay từ đầu tháng 9, Tao Zhexuan đã đăng một bài đăng ca ngợi tác dụng của ChatGPT trong việc tạo mã Python - trực tiếp tiết kiệm khối lượng công việc nửa giờ!

Như một thí nghiệm, ông yêu cầu ChatGPT viết một đoạn mã Python tính độ dài M(n) của dãy con dài nhất là 1,...,n cho mỗi số tự nhiên n, trong đó φ của hàm toàn năng của Euler không giảm.

Ví dụ: M(6)=5 vì φ không giảm trên 1,2,3,4,5 (hoặc 1,2,3,4,6) nhưng không giảm trên 1,2,3,4,5,6.

Thật thú vị, nó đã tạo ra một đoạn mã cực kỳ khéo léo để tính toán các hàm toàn năng, khéo léo đến mức Tao phải nhìn chằm chằm vào nó trong vài phút trước khi anh hiểu nguyên tắc đằng sau mã là gì.

Tất nhiên, mã này cũng thiên vị - nó chỉ xem xét các chuỗi con của các số nguyên liên tục, không phải các chuỗi con tùy ý.

Tuy nhiên, điều này là đủ gần, sử dụng mã ban đầu này do ChatGPT tạo ra làm điểm khởi đầu, Tao Zhexuan cuối cùng đã tự tạo mã mà anh ta muốn, giúp anh ta tiết kiệm khoảng nửa giờ làm việc.

Vì kết quả do ChatGPT đưa ra rất tốt, Tao Zhexuan nói rằng anh sẽ sử dụng nó thường xuyên trong tương lai để cung cấp mã ban đầu cho các tính toán tương tự.

Ngay sau đó, Tao Zhexuan lại đăng tải rằng anh đã vào GitHub Copilot dưới sự giới thiệu của cư dân mạng!

Không có gì đáng ngạc nhiên, màn trình diễn tiếp theo của Copilot là một bất ngờ thực sự đối với anh ta - chỉ cần đưa ra đoạn mở đầu và thêm một câu, AI đã đề xuất một cái gì đó rất gần với tầm nhìn của chính anh ta.

Đào Triết Xuân chỉ cần sửa đổi một chút đối với những đề xuất này, và anh ta có thể hoàn thành chúng trong vòng chưa đầy một nửa thời gian dự định ban đầu.

Vào tháng 10, Tao Zhexuan nhận thấy rằng mặc dù GPT-4 không thể cung cấp trợ giúp trực tiếp cho trò chơi, nhưng khi anh bắt đầu sử dụng Lean, GPT-4 trở nên rất hữu ích.

Khi các cấp độ ngày càng trở nên khó khăn hơn, vai trò của GPT bắt đầu thể hiện chính nó.

Trong trường hợp rõ ràng rằng Z là kết quả của X và Y, hỏi GPT "Làm thế nào tôi có thể chứng minh Z nếu tôi đã biết X và Y?" có thể giải quyết tất cả các loại vấn đề ngữ pháp tinh tế trong quá trình này.

Ngoài nội dung liên quan đến chuyên môn, Tao Zhexuan thấy rằng anh ta có thể sử dụng DALL· E 3 và ngay lập tức bắt đầu chơi.

**Netizen: LLM có thể làm cho những người xuất sắc tốt hơn 10.000 lần **

Việc vị thần vĩ đại bị ám ảnh bởi các công cụ AI trong nghiên cứu toán học cũng đã làm dấy lên những cuộc thảo luận sôi nổi giữa các cư dân mạng.

Một số người nói rằng Okami đã bắt đầu học Lean4 với sự trợ giúp của GPT-4 vào đầu tháng này, và thỉnh thoảng anh ấy sẽ ghi lại tiến trình học tập của mình trên mastodon.

Nó cũng cho thấy rằng đối với những người thành công nhất, LLM có thể đẩy nhanh công việc của họ.

Một số người nói rằng ngay cả những người không thể viết mã, miễn là họ là một người giao tiếp LLM tốt, có thể nhanh chóng tự động hóa các chức năng.

Tuy nhiên, nếu chỉ những cá nhân có tay nghề cao mới có thể sử dụng LLM một cách hiệu quả, kết quả là sự bất bình đẳng giữa mọi người có thể tăng lên.

Ai đó ngay lập tức nói rằng đó là sự thật, bạn của anh ấy không thể viết bất cứ điều gì ngoại trừ các công thức Excel, nhưng bây giờ, anh ấy có thể viết các ứng dụng Python với GPT-4!

Là một lập trình viên với 30 năm kinh nghiệm phát triển, anh ta cũng cần phải cầu xin anh ta dạy cho anh ta công nghệ này.

Thành công của anh ấy có lẽ là do khả năng giao tiếp với LLM.

Người ta đã dự đoán rằng theo thời gian, những người sử dụng LLM sẽ gặt hái được những lợi ích to lớn, bất kể trí thông minh của chính họ, và họ sẽ leo ngày càng cao hơn lên nấc thang để trở thành chuyên gia thi cử.

Đối với giới thượng lưu, họ có thể nhận được mức tăng gấp 100 lần từ LLM và đối với các kỹ sư hàng đầu, đó là khoảng 10.000 lần mức tăng.

Tài nguyên:

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)