Kỳ vọng của thị trường đối với Tác nhân AI luôn rất cao. Ngoài các tác nhân có nhiều nhiệm vụ một chiều khác nhau, một thử nghiệm trước đây của Đại học Stanford và Google đã chứng minh một thị trấn ảo (Thị trấn ảo) bao gồm 25 Tác nhân AI tự hoạt động hợp tác với nhau. . Lập lịch trình, cuộc hẹn hàng ngày và lên kế hoạch cho các sự kiện, bữa tiệc tại thị trấn ảo này.
Tuy nhiên, một thử nghiệm nghiên cứu gần đây cho thấy một công ty ảo được thành lập bởi **7 AI Agents đã hoàn thành quá trình phát triển hoàn chỉnh trong 7 phút, với chi phí khoảng 1 USD. **Thí nghiệm này xuất phát từ bài báo mới nhất được phát hành bởi các nhà nghiên cứu từ Đại học Thanh Hoa, Đại học Bưu chính Viễn thông Bắc Kinh, Đại học Công nghệ Đại Liên, Đại học Brown và công ty khởi nghiệp AI trong nước Wall-Facing Intelligence.
Họ đã tạo ra một công ty ảo có tên ChatDev, bao gồm 7 AI Agent, có vai trò là CEO, CTO, CPO, lập trình viên, nhà thiết kế, người thử nghiệm và người đánh giá mã. Các Agent này được hỗ trợ bởi mô hình ChatGPT 3.5.
Mô hình Thác nước dựa trên trình tự phát triển phần mềm chia toàn bộ quá trình thành 4 giai đoạn: thiết kế, lập trình, thử nghiệm và viết tài liệu.Các nhà nghiên cứu đã xác định vai trò, nhiệm vụ được giao và các giao thức truyền thông cần tuân thủ cho từng Agent thông qua lời nhắc, tiêu chí chấm dứt và ràng buộc.
Sau đó, mọi Đại lý trong công ty ChatDev sẽ tham gia vào công việc phát triển ở các giai đoạn khác nhau. Ví dụ: CEO, CPO và CTO sẽ làm việc cùng nhau trong giai đoạn thiết kế, còn giai đoạn lập trình sẽ chủ yếu có sự tham gia của CTO, lập trình viên và nhà thiết kế.
Việc phân bổ vai trò cụ thể ở từng giai đoạn đại khái như trong hình bên dưới, trên đây là vai trò phân bổ nhiệm vụ dựa trên quy trình phát triển phần mềm và Chuỗi trò chuyện sau đây là quy trình giao tiếp và phản hồi ra quyết định:
Sau khi phân công các vai trò khác nhau, công ty ChatDev nhận được lệnh phát triển trò chơi "Gomoku", mọi người ngay lập tức bước vào giai đoạn thiết kế đầu tiên. CEO, CPO và CTO đã có cuộc trò chuyện đơn giản về loại sản phẩm và ngôn ngữ lập trình. Quyết định là được thực hiện và quá trình ra quyết định rất giống với quy trình trong thực tế:
CEO: Để đáp ứng nhu cầu của khách hàng, hãy cùng thảo luận về ngôn ngữ lập trình cụ thể cho sản phẩm và cách triển khai;
CPO: Tôi khuyên bạn nên phát triển trò chơi này dưới dạng phiên bản dành cho máy tính để bàn, vì sau đó nó có thể chơi trên máy tính và nó sẽ có giao diện người dùng và trải nghiệm tương tác rất thân thiện. Theo kinh nghiệm của chúng tôi, tôi khuyên bạn nên sử dụng ngôn ngữ Python.
CEO: Tôi đồng ý với đề xuất của bạn @CTO, bạn có muốn cho tôi lời khuyên cụ thể về việc lựa chọn ngôn ngữ lập trình không?
CTO: Python rất phù hợp và là một lựa chọn tốt.
Giám đốc điều hành: Tính đơn giản và dễ đọc của ngôn ngữ Python đã khiến nó trở thành lựa chọn hàng đầu cho cả người mới bắt đầu và nhà phát triển có kinh nghiệm.
*CTO: Hãy bắt đầu!
Sau đó, CEO và CPO bắt đầu cùng nhau suy nghĩ để xác định thêm các chi tiết cụ thể của sản phẩm:
Sau khi hoàn tất, giai đoạn lập trình bắt đầu. Cốt lõi là quá trình phát triển và đối thoại giữa CTO, lập trình viên, nhà thiết kế và người đánh giá mã, đồng thời công việc phát triển trò chơi được hoàn thành thông qua sự hợp tác.
Sau khi hoàn thành các quy trình phát triển và thử nghiệm sản phẩm khác nhau, CTO, lập trình viên, CEO và CPO sẽ cùng nhau viết một tài liệu chi tiết về sự tương tác của phần mềm để tương tác với khách hàng.
Toàn bộ quá trình chia các nhiệm vụ thành hơn 70 nhiệm vụ phụ. Sau khi hoàn thành việc phân chia nhiệm vụ, quá trình phát triển sản phẩm được hoàn thành trong gần 7 phút (chu kỳ phát triển thông thường có thể mất 2-4 tuần) và thông qua bộ nhớ * và ** chức năng tự phản ánh*, xác định một số lỗ hổng tiềm ẩn và khắc phục chúng.
Các nhà nghiên cứu này đã thống kê chi phí cho từng giai đoạn của toàn bộ quá trình phát triển. Ngoài ra, toàn bộ quá trình chỉ mất trung bình chưa đầy 7 phút, toàn bộ chi phí chưa đến 1 đô la Mỹ**, chứng tỏ phần mềm rất cao hiệu quả phát triển. . Sau đây là quy trình triển khai đơn giản của sản phẩm trò chơi này:
Theo bài báo, 86,66% Tác nhân AI được thực thi hoàn hảo trong toàn bộ quá trình và ở phần thực thi không thành công, 50% trường hợp là do giới hạn độ dài mã thông báo của API Loại lỗi này Hạn chế ngăn cản việc lấy mã nguồn hoàn chỉnh trong phạm vi độ dài được chỉ định để tạo mã. Những thách thức này đặc biệt rõ ràng khi xử lý các hệ thống phần mềm phức tạp hoặc các tình huống đòi hỏi phải tạo mã rộng rãi.
50% lỗi còn lại chủ yếu ảnh hưởng đến các vấn đề phụ thuộc bên ngoài. Sự cố sẽ xảy ra khi không thể tìm thấy một số phụ thuộc trên đám mây hoặc có phiên bản sai. Nhưng nhìn chung, kết quả của thử nghiệm này là tương đối thành công. Có lẽ trong tương lai gần, nhiều công việc của chúng ta có thể dựa vào AI Agent.
Toàn văn bài báo có thể xem tại đây:
Mã công khai có thể được xem trên GitHub:
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Một công ty gồm 7 đại lý đã hoàn thành quá trình phát triển trò chơi trong 7 phút
Kỳ vọng của thị trường đối với Tác nhân AI luôn rất cao. Ngoài các tác nhân có nhiều nhiệm vụ một chiều khác nhau, một thử nghiệm trước đây của Đại học Stanford và Google đã chứng minh một thị trấn ảo (Thị trấn ảo) bao gồm 25 Tác nhân AI tự hoạt động hợp tác với nhau. . Lập lịch trình, cuộc hẹn hàng ngày và lên kế hoạch cho các sự kiện, bữa tiệc tại thị trấn ảo này.
Tuy nhiên, một thử nghiệm nghiên cứu gần đây cho thấy một công ty ảo được thành lập bởi **7 AI Agents đã hoàn thành quá trình phát triển hoàn chỉnh trong 7 phút, với chi phí khoảng 1 USD. **Thí nghiệm này xuất phát từ bài báo mới nhất được phát hành bởi các nhà nghiên cứu từ Đại học Thanh Hoa, Đại học Bưu chính Viễn thông Bắc Kinh, Đại học Công nghệ Đại Liên, Đại học Brown và công ty khởi nghiệp AI trong nước Wall-Facing Intelligence.
Họ đã tạo ra một công ty ảo có tên ChatDev, bao gồm 7 AI Agent, có vai trò là CEO, CTO, CPO, lập trình viên, nhà thiết kế, người thử nghiệm và người đánh giá mã. Các Agent này được hỗ trợ bởi mô hình ChatGPT 3.5.
Mô hình Thác nước dựa trên trình tự phát triển phần mềm chia toàn bộ quá trình thành 4 giai đoạn: thiết kế, lập trình, thử nghiệm và viết tài liệu.Các nhà nghiên cứu đã xác định vai trò, nhiệm vụ được giao và các giao thức truyền thông cần tuân thủ cho từng Agent thông qua lời nhắc, tiêu chí chấm dứt và ràng buộc.
Sau đó, mọi Đại lý trong công ty ChatDev sẽ tham gia vào công việc phát triển ở các giai đoạn khác nhau. Ví dụ: CEO, CPO và CTO sẽ làm việc cùng nhau trong giai đoạn thiết kế, còn giai đoạn lập trình sẽ chủ yếu có sự tham gia của CTO, lập trình viên và nhà thiết kế.
Việc phân bổ vai trò cụ thể ở từng giai đoạn đại khái như trong hình bên dưới, trên đây là vai trò phân bổ nhiệm vụ dựa trên quy trình phát triển phần mềm và Chuỗi trò chuyện sau đây là quy trình giao tiếp và phản hồi ra quyết định:
Sau khi phân công các vai trò khác nhau, công ty ChatDev nhận được lệnh phát triển trò chơi "Gomoku", mọi người ngay lập tức bước vào giai đoạn thiết kế đầu tiên. CEO, CPO và CTO đã có cuộc trò chuyện đơn giản về loại sản phẩm và ngôn ngữ lập trình. Quyết định là được thực hiện và quá trình ra quyết định rất giống với quy trình trong thực tế:
Sau đó, CEO và CPO bắt đầu cùng nhau suy nghĩ để xác định thêm các chi tiết cụ thể của sản phẩm:
Sau khi hoàn tất, giai đoạn lập trình bắt đầu. Cốt lõi là quá trình phát triển và đối thoại giữa CTO, lập trình viên, nhà thiết kế và người đánh giá mã, đồng thời công việc phát triển trò chơi được hoàn thành thông qua sự hợp tác.
Sau khi hoàn thành các quy trình phát triển và thử nghiệm sản phẩm khác nhau, CTO, lập trình viên, CEO và CPO sẽ cùng nhau viết một tài liệu chi tiết về sự tương tác của phần mềm để tương tác với khách hàng.
Toàn bộ quá trình chia các nhiệm vụ thành hơn 70 nhiệm vụ phụ. Sau khi hoàn thành việc phân chia nhiệm vụ, quá trình phát triển sản phẩm được hoàn thành trong gần 7 phút (chu kỳ phát triển thông thường có thể mất 2-4 tuần) và thông qua bộ nhớ * và ** chức năng tự phản ánh*, xác định một số lỗ hổng tiềm ẩn và khắc phục chúng.
Các nhà nghiên cứu này đã thống kê chi phí cho từng giai đoạn của toàn bộ quá trình phát triển. Ngoài ra, toàn bộ quá trình chỉ mất trung bình chưa đầy 7 phút, toàn bộ chi phí chưa đến 1 đô la Mỹ**, chứng tỏ phần mềm rất cao hiệu quả phát triển. . Sau đây là quy trình triển khai đơn giản của sản phẩm trò chơi này:
Theo bài báo, 86,66% Tác nhân AI được thực thi hoàn hảo trong toàn bộ quá trình và ở phần thực thi không thành công, 50% trường hợp là do giới hạn độ dài mã thông báo của API Loại lỗi này Hạn chế ngăn cản việc lấy mã nguồn hoàn chỉnh trong phạm vi độ dài được chỉ định để tạo mã. Những thách thức này đặc biệt rõ ràng khi xử lý các hệ thống phần mềm phức tạp hoặc các tình huống đòi hỏi phải tạo mã rộng rãi.
50% lỗi còn lại chủ yếu ảnh hưởng đến các vấn đề phụ thuộc bên ngoài. Sự cố sẽ xảy ra khi không thể tìm thấy một số phụ thuộc trên đám mây hoặc có phiên bản sai. Nhưng nhìn chung, kết quả của thử nghiệm này là tương đối thành công. Có lẽ trong tương lai gần, nhiều công việc của chúng ta có thể dựa vào AI Agent.
Toàn văn bài báo có thể xem tại đây:
Mã công khai có thể được xem trên GitHub: