Thế giới phía tây là ở đây! "Thị trấn" nổi tiếng của Stanford là nguồn mở, 25 đặc vụ AI đang yêu và kết bạn|Với các hướng dẫn ở cấp độ bảo mẫu

Nguồn: "Xinzhiyuan" (ID: AI_era), tác giả: Xinzhiyuan

Hãy sẵn sàng, Stanford Smart Town, đã gây chấn động trong toàn bộ cộng đồng AI, giờ đây chính thức là nguồn mở!

địa chỉ dự án:

Trong thị trấn ảo hộp cát "Thế giới phương Tây" kỹ thuật số này, có trường học, bệnh viện và gia đình.

25 Đặc vụ AI không chỉ có thể làm việc ở đây, trò chuyện, giao lưu, kết bạn và thậm chí yêu nhau mà mỗi Đặc vụ đều có cá tính và câu chuyện nền tảng riêng.

Tuy nhiên, họ không biết rằng họ đang sống trong một mô phỏng.

Nhà khoa học cấp cao của Nvidia Jim Fan đã nhận xét -

Thị trấn Đặc vụ Stanford là một trong những thử nghiệm Đặc vụ AI thú vị nhất năm 2023. Chúng ta thường nói về các khả năng mới nổi của một mô hình ngôn ngữ lớn duy nhất, nhưng giờ đây với nhiều tác nhân AI, tình hình trở nên phức tạp và hấp dẫn hơn. Một nhóm AI có thể suy ra quá trình tiến hóa của toàn bộ nền văn minh.

Giờ đây, thứ đầu tiên bị ảnh hưởng có lẽ là sân thi đấu.

Nói tóm lại, có vô số khả năng mới ở phía trước!

Cư dân mạng: Các nhà sản xuất trò chơi, bạn có hiểu ý tôi không?

Nhiều người tin rằng bài báo Stanford này đánh dấu sự khởi đầu của AGI.

Có thể hình dung rằng các game nhập vai và mô phỏng khác nhau sẽ sử dụng công nghệ này.

Cư dân mạng cũng rất phấn khích và bộ não của họ được mở rộng.

Có người muốn xem Pokémon, có người muốn xem truyện trinh thám giết người, có người muốn xem chương trình tạp kỹ tình cảm...

"Tôi nóng lòng được xem mối tình tay ba giữa các đặc vụ AI."

"Cuộc đối thoại buồn tẻ, lặp đi lặp lại của Animal Crossing và hệ thống tính cách một chiều được chia sẻ bởi tất cả dân làng, thật đáng thất vọng. Nintendo, hãy tìm hiểu nó!"

"Sims có thể chuyển cái này qua không?"

Nếu bạn có thể thấy AI chạy trên NPC trong một trò chơi RPG cổ điển như "God Realm", toàn bộ trải nghiệm trò chơi sẽ bị phá vỡ! "

Một số người cũng hình dung rằng công nghệ này cũng có nhiều kịch bản ứng dụng trong không gian doanh nghiệp, chẳng hạn như cách nhân viên tương tác với các thay đổi môi trường làm việc/quy trình khác nhau.

Tất nhiên, một số người nói, bạn đang hào hứng về điều gì? Trên thực tế, chúng ta đang sống trong một mô phỏng như vậy, nhưng thế giới của chúng ta có nhiều khả năng tính toán hơn.

Vâng, nếu chúng ta phóng đại thế giới ảo này đủ lần, chúng ta chắc chắn có thể nhìn thấy chính mình.

### Karpathy: Đặc vụ AI là biên giới tiếp theo

Trước đây, Karpathy, cựu giám đốc Tesla và chuyên gia về OpenAI, đã nói rằng các tác nhân AI hiện là hướng đi tiên tiến nhất trong tương lai.

Nhóm của OpenAI đã dành 5 năm qua ở nơi khác, nhưng Karpathy hiện tin rằng "Các đại lý đại diện cho một loại tương lai cho AI."

Nếu một bài báo đề xuất một cách khác để đào tạo một mô hình ngôn ngữ lớn, ai đó trong nhóm Slack bên trong OpenAI sẽ nói: "Phương pháp này tôi đã thử hai năm rưỡi trước, nó không hiệu quả."

Tuy nhiên, bất cứ khi nào một tác nhân AI xuất hiện từ một bài báo, tất cả các đồng nghiệp đều rất quan tâm.

Karpathy từng gọi AutoGPT là biên giới tiếp theo của kỹ thuật nhanh

25 đặc vụ AI trong "Westworld"

Trong bộ phim truyền hình Mỹ "Thế giới phương Tây", một người máy có cốt truyện định sẵn được đưa vào công viên giải trí, hoạt động như một con người, sau đó đặt lại trí nhớ và được đưa vào cốt truyện cốt lõi của chính nó vào một ngày mới.

Vào tháng 4 năm nay, các nhà nghiên cứu từ Stanford và Google đã thực sự xây dựng một thị trấn ảo, trong đó 25 đặc vụ AI có thể sống sót và tham gia vào các hành vi phức tạp, có thể gọi là "Thế giới phương Tây" sắp thành hiện thực.

Địa chỉ giấy tờ:

Ngành kiến trúc

Để tạo ra các tác nhân, các nhà nghiên cứu đề xuất một kiến trúc mới mở rộng mô hình ngôn ngữ lớn và có thể lưu trữ trải nghiệm của tác nhân bằng ngôn ngữ tự nhiên.

Theo thời gian, những ký ức này được tổng hợp thành các phản xạ cấp cao hơn mà tác nhân có thể tự động truy xuất để lên kế hoạch cho các hành động của mình.

Cuối cùng, người dùng có thể sử dụng ngôn ngữ tự nhiên để tương tác với tất cả 25 Đặc vụ trong thị trấn.

Như trên, kiến trúc của tác nhân tổng quát thực hiện chức năng "truy xuất".

Hàm này lấy tình huống hiện tại của tác nhân làm đầu vào và trả về một tập hợp con của luồng bộ nhớ để chuyển đến mô hình ngôn ngữ.

Mặt khác, Truy xuất có nhiều triển khai khả thi, tùy thuộc vào các yếu tố quan trọng mà tác nhân xem xét khi quyết định cách hành động.

Một thách thức chính đối với kiến trúc tổng đài viên là làm thế nào để quản lý số lượng lớn các sự kiện và ký ức phải được lưu giữ.

Để giải quyết vấn đề này, cốt lõi của kiến trúc là luồng bộ nhớ, là cơ sở dữ liệu ghi lại toàn bộ trải nghiệm của tác nhân.

Tác nhân có thể truy xuất các ký ức liên quan từ luồng bộ nhớ, giúp tác nhân lập kế hoạch hành động, phản hồi chính xác và mỗi hành động được đưa trở lại luồng bộ nhớ để cải thiện đệ quy các hành động trong tương lai.

Ngoài ra, nghiên cứu cũng giới thiệu một loại trí nhớ thứ hai—phản ánh. Phản ánh là tư duy trừu tượng cấp cao được tạo ra bởi một tác nhân dựa trên những trải nghiệm gần đây.

Trong nghiên cứu này, phản ánh là một quá trình được kích hoạt định kỳ và cơ chế phản ánh sẽ chỉ được kích hoạt khi tác nhân đánh giá điểm quan trọng của một loạt sự kiện gần đây và sự tích lũy vượt quá ngưỡng đã đặt.

Các tác nhân tạo ra nhiều chi tiết hơn theo cách đệ quy từ trên xuống dưới để tạo ra các kế hoạch hợp lý.

Và những kế hoạch này ban đầu chỉ mô tả đại khái những việc phải làm trong ngày hôm đó.

Trong quá trình thực hiện kế hoạch, tác nhân tạo liên tục nhận thức môi trường xung quanh và lưu trữ các quan sát nhận được vào luồng bộ nhớ.

Bằng cách sử dụng các quan sát làm tín hiệu, hãy để mô hình ngôn ngữ quyết định bước tiếp theo của tác nhân: tiếp tục với kế hoạch hiện tại hoặc phản hồi theo cách khác.

Trong đánh giá thử nghiệm, các nhà nghiên cứu đã thực hiện đánh giá có kiểm soát đối với khung này, cũng như đánh giá từ đầu đến cuối.

Đánh giá kiểm soát là để hiểu liệu tác nhân có thể tạo ra hành vi cá nhân hợp lý một cách độc lập hay không. Việc đánh giá từ đầu đến cuối là để hiểu khả năng xuất hiện và tính ổn định của tác nhân.

Ví dụ, Isabella lên kế hoạch tổ chức tiệc Ngày lễ tình nhân và mời mọi người đến dự. Trong số 12 đại lý, 7 đại lý vẫn đang được xem xét (3 có kế hoạch khác và 4 không có ý kiến).

Liên kết này rất giống với chế độ tương tác của con người.

### Tương tác như người thật

Trong thị trấn thế giới hộp cát có tên Smallville này, các khu vực được đánh dấu. Nút gốc mô tả toàn bộ thế giới, các nút con mô tả các khu vực (nhà ở, quán cà phê, cửa hàng) và các nút lá mô tả các đồ vật (bàn, giá sách).

Tác nhân nhớ một biểu đồ con phản ánh các phần của thế giới mà họ nhìn thấy.

Các nhà nghiên cứu đã lập trình một ngôn ngữ tự nhiên để mô tả danh tính của từng tác nhân, bao gồm cả nghề nghiệp và mối quan hệ của họ với các tác nhân khác, như một ký ức hạt giống.

Ví dụ, bộ nhớ hạt giống của đặc vụ John Lin là như thế này -

John Lin là một chủ hiệu thuốc hữu ích, người luôn tìm cách làm cho thuốc dễ tiếp cận hơn với khách hàng. Vợ của John Lin, Mei Lin là giáo sư đại học, con trai Eddy Lin đang học lý thuyết âm nhạc, họ sống cùng nhau John Lin rất yêu gia đình. John Lin đã biết cặp vợ chồng già hàng xóm, Sam Moore và Jennifer Moore, được vài năm, và John Lin nghĩ Sam Moore là một người tốt bụng. John Lin rất thân với người hàng xóm Yuriko Yamamoto. John Lin biết những người hàng xóm của mình, Tamara Taylor và Carmen Ortiz, nhưng chưa bao giờ gặp họ. John Lin và Tom Moreno là đồng nghiệp dược và bạn bè, những người thích thảo luận về chính trị địa phương, v.v.

Sau đây là một buổi sáng của John Lin: thức dậy lúc 6 giờ, bắt đầu đánh răng, tắm rửa, ăn sáng và trước khi ra ngoài làm việc, anh sẽ gặp vợ mình là Mei và con trai Eddy.

Theo cách này, khi mô phỏng bắt đầu, mỗi tác nhân có bộ nhớ gốc của riêng mình.

Các đại lý này tương tác xã hội với nhau. Khi họ chú ý đến nhau, một cuộc trò chuyện có thể xảy ra.

Theo thời gian, các tác nhân này hình thành các mối quan hệ mới và ghi nhớ các tương tác của họ với các tác nhân khác.

Một câu chuyện thú vị là khi bắt đầu mô phỏng, một đặc vụ đã được khởi tạo để tổ chức một bữa tiệc Ngày lễ tình nhân.

Chuỗi sự việc xảy ra sau đó có thể có điểm thất bại, người đại diện có thể không tiếp tục kiên định ý định này, hoặc quên nói với người khác, thậm chí quên xuất hiện.

May mắn thay, trong mô phỏng, bữa tiệc Ngày lễ tình nhân đã thực sự diễn ra, và nhiều đặc vụ đã gặp nhau và có những tương tác thú vị.

Hướng dẫn cấp độ bảo mẫu

Môi trường cấu hình

Trước khi định cấu hình môi trường, trước tiên bạn cần tạo tệp utils.py chứa khóa API OpenAI và tải xuống các gói cần thiết.

Bước 1. Tạo tệp Utils

Trong thư mục Reverie/backend_server (thư mục chứa Reverie.py), tạo một tệp utils.py mới, sao chép và dán nội dung sau vào tệp:

Sao chép và dán Khóa API OpenAI của bạnopenai_api_key = ""# Đặt khóa tên của bạn_owner = ""mê cung_assets_loc = "../../environment/frontend_server/static_dirs/assets"env _matrix = f"{maze_assets_loc}/the_ville/matrix"env_visuals = f"{maze_assets_loc}/the_ville/visuals"fs_storage = "../../ môi trường/giao diện người dùng_server/storage"fs_temp_storage = "../../environment/frontend_server/temp_storage"collision_block_id = "32125"# Gỡ lỗi chi tiết = True

sẽ được thay thế bằng khóa API OpenAI của bạn và sẽ được thay thế bằng tên của bạn.

Bước 2. Cài đặt tests.txt

Cài đặt mọi thứ được liệt kê trong tệp tests.txt (chúng tôi thực sự khuyên bạn nên thiết lập môi trường ảo trước).

Hiện tại, nhóm đã thử nghiệm trên Python 3.9.12.

Chạy mô phỏng

Để chạy một mô phỏng mới, bạn cần khởi động hai máy chủ cùng lúc: máy chủ môi trường và máy chủ mô phỏng tác nhân.

Bước 1. Khởi động máy chủ môi trường

Do môi trường được triển khai dưới dạng dự án Django nên cần khởi động máy chủ Django.

Để thực hiện việc này, trước tiên hãy điều hướng đến môi trường/giao diện người dùng_máy chủ (nơi quản lý.py cư trú) trên dòng lệnh. Sau đó chạy lệnh sau:

python manage.py runserver

Sau đó, truy cập nó trong trình duyệt yêu thích của bạn.

Nếu bạn thấy lời nhắc "Máy chủ môi trường của bạn đang hoạt động", điều đó có nghĩa là máy chủ đang chạy bình thường. Đảm bảo rằng máy chủ môi trường tiếp tục chạy trong khi chạy mô phỏng, vì vậy hãy mở tab dòng lệnh này.

(Lưu ý: Nên dùng Chrome hoặc Safari. Firefox có thể gặp một số trục trặc ở giao diện người dùng, nhưng nó sẽ không ảnh hưởng đến quá trình mô phỏng thực tế.)

Bước 2. Khởi động máy chủ giả

Mở một cửa sổ dòng lệnh khác (máy chủ môi trường bạn đã sử dụng ở bước 1 vẫn đang chạy và cần được giữ nguyên). Điều hướng đến Reverie/backend_server và chạy Reverie.py để khởi động máy chủ giả:

Reverie.py trong python

Tại thời điểm này, một dấu nhắc dòng lệnh sẽ xuất hiện yêu cầu như sau: "Nhập tên của mô phỏng rẽ nhánh:".

Ví dụ: bây giờ chúng tôi muốn bắt đầu một mô phỏng có chứa ba đặc vụ, Isabella Rodriguez, Maria Lopez và Klaus Mueller, sau đó nhập thông tin sau:

cơ sở_the_ville_isabella_maria_klaus

Sau đó, lời nhắc sẽ hỏi: "Nhập tên của mô phỏng mới:".

Tại thời điểm này, bạn chỉ cần nhập một tên tùy ý để đại diện cho mô phỏng hiện tại (chẳng hạn như "mô phỏng thử nghiệm").

mô phỏng thử nghiệm

Giữ máy chủ giả lập chạy. Ở giai đoạn này, nó sẽ hiển thị lời nhắc sau: "Nhập tùy chọn"

Bước 3. Chạy và Lưu Mô phỏng

Chuyển đến trình giả lập_home trong trình duyệt của bạn và tiếp tục mở tab.

Bây giờ bạn sẽ thấy bản đồ của thị trấn và danh sách các đặc vụ đang hoạt động trên bản đồ và có thể sử dụng các mũi tên trên bàn phím để di chuyển quanh bản đồ.

Để chạy mô phỏng, bạn cần nhập lệnh sau trong máy chủ mô phỏng nhắc "Nhập tùy chọn":

chạy

Lưu ý rằng ở trên cần được thay thế bằng một số nguyên đại diện cho số lượng trò chơi di chuyển để mô phỏng.

Ví dụ: nếu bạn muốn mô phỏng trò chơi 100 bước, bạn sẽ nhập run 100. Trong đó, một bước trò chơi đại diện cho 10 giây trong trò chơi.

Bây giờ, mô phỏng sẽ chạy và bạn có thể xem đặc vụ di chuyển trên bản đồ trong trình duyệt.

Khi quá trình chạy hoàn tất, lời nhắc "Nhập tùy chọn" sẽ xuất hiện lại. Tại thời điểm này, bạn có thể tiếp tục mô phỏng bằng cách nhập lại lệnh chạy và chỉ định số bước trò chơi mong muốn hoặc nhập exit để thoát mà không lưu hoặc fin để lưu và thoát.

Lần tới khi bạn chạy máy chủ mô phỏng, bạn có thể truy cập mô phỏng đã lưu chỉ bằng cách cung cấp tên của mô phỏng. Bằng cách này, bạn có thể khởi động lại mô phỏng từ nơi bạn đã dừng lại.

Bước 4. Mô phỏng phát lại

Để phát lại mô phỏng đang chạy, chỉ cần chạy máy chủ môi trường và truy cập địa chỉ sau trong trình duyệt của bạn: phát lại //.

nơi cần được thay thế bằng tên của mô phỏng đang được phát lại và dấu thời gian số nguyên để bắt đầu phát lại sẽ được thay thế.

Bước 5. Mô phỏng demo

Bạn có thể thấy rằng tất cả các họa tiết nhân vật trông giống nhau trong quá trình phát lại. Điều này là do tính năng phát lại chủ yếu để gỡ lỗi và không ưu tiên tối ưu hóa kích thước hoặc hình ảnh của thư mục mô phỏng.

Để thể hiện chính xác một mô phỏng với các họa tiết ký tự, trước tiên cần phải nén mô phỏng. Để thực hiện việc này, hãy sử dụng trình soạn thảo văn bản để mở tệp nén_sim_storage.py nằm trong thư mục hồi tưởng. Sau đó, chức năng nén được thực thi với tên của mô hình đích làm đầu vào. Bằng cách này, tệp mô phỏng sẽ được nén và do đó sẵn sàng để trình bày.

Để bắt đầu bản demo, vui lòng mở địa chỉ sau trong trình duyệt của bạn: demo///.

Lưu ý rằng và có ý nghĩa tương tự như đã đề cập ở trên. Có thể được sử dụng để kiểm soát tốc độ trình bày, trong đó 1 là chậm nhất và 5 là nhanh nhất.

Mô phỏng tùy chỉnh

Bạn có hai tùy chọn để tùy chỉnh mô phỏng.

Phương pháp 1: Ghi và tải lịch sử tác nhân

Đầu tiên là khởi tạo tác nhân với một lịch sử duy nhất khi bắt đầu mô phỏng.

Để thực hiện việc này, bạn cần 1) bắt đầu với một trong các mô phỏng cơ bản, 2) ghi và tải lịch sử đại lý.

Bước 1. Bắt đầu mô phỏng cơ bản

Hai cơ sở mô phỏng được bao gồm trong kho lưu trữ: base_the_ville_n25 (25 tác nhân) và base_the_ville_isabella_maria_klaus (3 tác nhân). Có thể tải một trong các mô phỏng cơ bản bằng cách thực hiện theo các bước ở trên.

Bước 2. Tải tệp lịch sử

Sau đó, khi được nhắc "Nhập tùy chọn", bạn cần tải lịch sử tác nhân bằng lệnh sau:

gọi -- tải lịch sử_ville/.csv

ở đâu, cần được thay thế bằng tên của tệp lịch sử hiện có.

Hai tệp lịch sử ví dụ được bao gồm trong kho lưu trữ: agent_history_init_n25.csv (cho base_the_ville_n25) và agent_history_init_n3.csv (cho base_the_ville_isabella_maria _klaus). Các tệp này chứa danh sách các bản ghi bộ nhớ cho từng tác nhân.

Bước 3. Tùy chỉnh thêm

Để tùy chỉnh quá trình khởi tạo bằng cách ghi các tệp lịch sử của riêng bạn, hãy đặt các tệp vào thư mục sau: môi trường/giao diện người dùng_server/static_dirs/assets/the_ville.

Định dạng cột của tệp lịch sử tùy chỉnh phải khớp với tệp lịch sử mẫu được đính kèm. Do đó, tác giả khuyên bạn nên bắt đầu quá trình bằng cách sao chép và dán các tệp đã có trong kho lưu trữ.

Phương pháp 2: Tạo một mô hình cơ sở mới

Để tùy chỉnh chuyên sâu hơn, bạn sẽ cần viết tệp mô phỏng cơ sở của riêng mình.

Cách đơn giản nhất là sao chép và dán thư mục mô phỏng cơ sở hiện có, sau đó đổi tên và chỉnh sửa nó theo yêu cầu của bạn.

Những tài liệu tham khảo:

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)