Westworld هنا! "بلدة" ستانفورد الشهيرة مفتوحة المصدر ، 25 وكيلًا للذكاء الاصطناعي في حالة حب وتكوين صداقات | مع برامج تعليمية على مستوى المربية

المصدر: "Xinzhiyuan" (المعرف: AI \ _era) ، المؤلف: Xinzhiyuan

استعد ، ستانفورد سمارت تاون ، التي أحدثت ضجة كبيرة في مجتمع الذكاء الاصطناعي بأكمله ، أصبحت الآن مفتوحة المصدر رسميًا!

عنوان المشروع:

في هذه المدينة الافتراضية "العالم الغربي" الافتراضية ، توجد مدارس ومستشفيات وعائلات.

لا يستطيع 25 وكيلًا للذكاء الاصطناعي العمل هنا فقط ، والدردشة ، والتواصل الاجتماعي ، وتكوين صداقات ، وحتى الوقوع في الحب ، ولكن لكل وكيل شخصيته وخلفيته الخاصة.

ومع ذلك ، ليس لديهم فكرة أنهم يعيشون في محاكاة.

علق كبير علماء Nvidia Jim Fan -

تعد Stanford Agent Town واحدة من أكثر تجارب وكيل الذكاء الاصطناعي إثارة في عام 2023. غالبًا ما نتحدث عن القدرات الناشئة لنموذج لغة واحد كبير ، ولكن الآن مع وجود العديد من وكلاء الذكاء الاصطناعي ، أصبح الوضع أكثر تعقيدًا وإبهارًا. يمكن لمجموعة من الذكاء الاصطناعي استنتاج عملية تطور الحضارة بأكملها.

الآن ، قد يكون أول شيء قد يتأثر هو ميدان اللعبة.

باختصار ، هناك احتمالات جديدة لا حصر لها في المستقبل!

مستخدمي الإنترنت: مصنعي الألعاب ، هل تفهمون ما أعنيه؟

يعتقد الكثير من الناس أن ورقة ستانفورد هذه تمثل بداية الذكاء الاصطناعي العام.

من المتصور أن العديد من ألعاب تقمص الأدوار والمحاكاة ستستخدم هذه التقنية.

كان مستخدمو الإنترنت أيضًا متحمسين للغاية وكانت أدمغتهم مفتوحة على مصراعيها.

يرغب البعض في مشاهدة Pokémon ، والبعض الآخر يرغب في مشاهدة قصص القتل البوليسية ، والبعض الآخر يرغب في مشاهدة برامج الحب المتنوعة ...

"لا أطيق الانتظار لرؤية مثلث الحب بين عملاء الذكاء الاصطناعي."

"حوار Animal Crossing المتكرر ، الكئيب ، ونظام الشخصية أحادي البعد الذي يتشاركه جميع القرويين ، مخيب للآمال للغاية. نينتندو ، تعلم ذلك!"

"هل يمكن لسيمز نقل هذا أكثر؟"

إذا كان بإمكانك رؤية AI يعمل على NPC في لعبة RPG كلاسيكية مثل "God Realm" ، فإن تجربة اللعبة بأكملها ستخرب! "

يتخيل بعض الأشخاص أيضًا أن هذه التقنية لها أيضًا العديد من سيناريوهات التطبيق في مساحة المؤسسة ، مثل كيفية تفاعل الموظفين مع بيئات العمل / التغييرات العملية المختلفة.

بالطبع قال البعض ، ما الذي أنت متحمس بشأنه؟ في الواقع ، كنا نعيش في مثل هذه المحاكاة ، لكن عالمنا لديه قوة حوسبية أكبر.

نعم ، إذا قمنا بتكبير هذا العالم الافتراضي مرات كافية ، يمكننا بالتأكيد أن نرى أنفسنا.

### كارباثي: وكلاء الذكاء الاصطناعي هم الحدود التالية

في السابق ، قال كارباثي ، المدير السابق لشركة Tesla ومعلم OpenAI ، إن وكلاء الذكاء الاصطناعي هم الآن الاتجاه الأكثر تطورًا في المستقبل.

قضى فريق OpenAI السنوات الخمس الماضية في مكان آخر ، لكن كارباثي يعتقد الآن أن "الوكلاء يمثلون نوعًا من المستقبل للذكاء الاصطناعي."

إذا اقترحت ورقة بحثية طريقة مختلفة لتدريب نموذج لغوي كبير ، سيقول شخص ما في مجموعة Slack داخل OpenAI: "هذه الطريقة التي جربتها منذ عامين ونصف ، لم تنجح."

ومع ذلك ، كلما ظهر وكيل الذكاء الاصطناعي من الورقة ، يكون جميع الزملاء مهتمين جدًا.

وصف Karpathy ذات مرة AutoGPT بأنها الحدود التالية للهندسة السريعة

25 من وكلاء الذكاء الاصطناعي في "Westworld"

في المسلسل التلفزيوني الأمريكي "العالم الغربي" ، يتم وضع روبوت بقصة محددة مسبقًا في مدينة ملاهي ، ويعمل كإنسان ، ثم يعيد ضبط ذاكرته ، ويتم وضعه في جوهر قصته في يوم جديد.

في أبريل من هذا العام ، بنى باحثون من ستانفورد وجوجل مدينة افتراضية يمكن أن يعيش فيها 25 عميلًا للذكاء الاصطناعي والانخراط في سلوكيات معقدة.يمكن أن يطلق عليها "العالم الغربي" لتصبح حقيقة واقعة.

عنوان الورق:

بنيان

من أجل توليد عوامل ، يقترح الباحثون بنية جديدة توسع نموذج اللغة الكبير ويمكنها تخزين تجربة الوكيل باللغة الطبيعية.

بمرور الوقت ، يتم تصنيع هذه الذكريات في انعكاسات ذات مستوى أعلى يمكن للعامل استردادها ديناميكيًا لتخطيط أفعاله.

في النهاية ، يمكن للمستخدمين استخدام اللغة الطبيعية للتفاعل مع جميع العملاء البالغ عددهم 25 في المدينة.

كما ذكر أعلاه ، فإن بنية العامل التوليدي تنفذ وظيفة "استرجاع".

تأخذ هذه الوظيفة كإدخال الوضع الحالي للوكيل وتعيد مجموعة فرعية من دفق الذاكرة لتمريرها إلى نموذج اللغة.

الاسترداد ، من ناحية أخرى ، له العديد من التطبيقات الممكنة ، اعتمادًا على العوامل المهمة التي يأخذها الوكيل في الاعتبار عند تقرير كيفية التصرف.

يتمثل التحدي الرئيسي لبنية الوكيل التوليدي في كيفية إدارة العدد الكبير من الأحداث والذكريات التي يجب الاحتفاظ بها.

لحل هذه المشكلة ، فإن جوهر البنية هو تدفق الذاكرة ، وهو قاعدة بيانات تسجل التجربة الكاملة للوكيل.

يمكن للوكيل استرداد الذكريات ذات الصلة من تدفق الذاكرة ، مما يساعده على تخطيط الإجراءات والاستجابة بشكل صحيح ، ويتم إعادة إدخال كل إجراء في دفق الذاكرة لتحسين الإجراءات المستقبلية بشكل متكرر.

بالإضافة إلى ذلك ، قدمت الدراسة أيضًا نوعًا ثانيًا من الذاكرة - الانعكاس. الانعكاس هو التفكير المجرد عالي المستوى الذي يولده الوكيل بناءً على التجارب الحديثة.

في هذه الدراسة ، يكون الانعكاس عملية يتم تشغيلها بشكل دوري ، ولن يتم تنشيط آلية الانعكاس إلا عندما يحكم الوكيل على درجات الأهمية لسلسلة من الأحداث الأخيرة ويتجاوز التراكم الحد المعين.

يقوم الوكلاء التوليديون بإنشاء المزيد من التفاصيل بشكل متكرر من أعلى إلى أسفل من أجل إنشاء خطط معقولة.

وهذه الخطط في البداية فقط وصفت بشكل تقريبي ما يجب القيام به في ذلك اليوم.

أثناء تنفيذ الخطة ، يدرك العامل المولِّد باستمرار البيئة المحيطة ويخزن الملاحظات المتصورة في تدفق الذاكرة.

باستخدام الملاحظات كإشارات ، دع نموذج اللغة يقرر الخطوة التالية للوكيل: تابع الخطة الحالية ، أو استجب بطريقة أخرى.

في التقييم التجريبي ، أجرى الباحثون تقييمًا مضبوطًا لهذا الإطار ، بالإضافة إلى تقييم شامل.

تقييم التحكم هو فهم ما إذا كان يمكن للوكيل أن يولد سلوكًا فرديًا معقولًا بشكل مستقل. التقييم الشامل هو فهم قدرة ظهور واستقرار العامل.

على سبيل المثال ، تخطط إيزابيلا لحفلة عيد الحب وتدعو الجميع للحضور. من بين الوكلاء الاثني عشر ، لا يزال 7 قيد الدراسة (3 لديهم خطط أخرى ، و 4 ليس لديهم أفكار).

هذا الرابط مشابه جدًا لوضع التفاعل البشري.

### تفاعل كشخص حقيقي

في هذه المدينة العالمية ذات الصندوق الرمل والتي تسمى سمولفيل ، يتم تمييز المناطق. تصف العقدة الجذرية العالم كله ، وتصف العقد الفرعية المناطق (المنازل ، والمقاهي ، والمتاجر) ، وتصف العقد الورقية الكائنات (الجداول ، وأرفف الكتب).

يتذكر الوكيل رسمًا بيانيًا فرعيًا يعكس أجزاء العالم التي يرونها.

قام الباحثون ببرمجة لغة طبيعية لوصف هوية كل عامل ، بما في ذلك مهنته وعلاقته مع الوكلاء الآخرين ، كذاكرة بذرة.

على سبيل المثال ، الذاكرة الأولية للوكيل جون لين مثل هذا -

John Lin هو مالك صيدلية مفيد يبحث دائمًا عن طرق لجعل الأدوية في متناول العملاء. مي لين ، زوجة جون لين ، أستاذة جامعية ، ويدرس ابنه إيدي لين نظرية الموسيقى ، ويعيشان معًا ، ويحب جون لين عائلته كثيرًا. عرف جون لين الزوجين المسنين المجاورين ، سام مور وجينيفر مور ، لعدة سنوات ، ويعتقد جون لين أن سام مور شخص طيب. جون لين قريب جدًا من جارته يوريكو ياماموتو. كان جون لين يعرف جيرانه ، تمارا تايلور وكارمن أورتيز ، لكنه لم يلتق بهم أبدًا. جون لين وتوم مورينو زميلان في الصيدلة وصديقان يرغبان في مناقشة السياسة المحلية وما إلى ذلك.

التالي هو صباح جون لين: استيقظ في الساعة 6 ، وابدأ في تنظيف الأسنان بالفرشاة ، واستحم ، وتناول وجبة الإفطار ، وقبل الذهاب إلى العمل ، سيلتقي بزوجته مي وابنه إيدي.

بهذه الطريقة ، عندما تبدأ المحاكاة ، يكون لكل وكيل ذاكرة أولية خاصة به.

يتفاعل هؤلاء الوكلاء اجتماعيًا مع بعضهم البعض. عندما يلاحظون بعضهم البعض ، قد يتبع ذلك محادثة.

بمرور الوقت ، يشكل هؤلاء الوكلاء علاقات جديدة ويتذكرون تفاعلاتهم مع الوكلاء الآخرين.

هناك قصة مثيرة للاهتمام وهي أنه في بداية المحاكاة ، تمت تهيئة عميل ليقيم حفلة عيد الحب.

قد تكون هناك نقاط فشل في سلسلة الأشياء التي تحدث بعد ذلك ، فقد لا يستمر الوكيل في الإصرار على هذه النية ، أو نسيان إخبار الآخرين ، أو حتى نسيان الحضور.

لحسن الحظ ، في المحاكاة ، حدث حفل عيد الحب بالفعل ، واجتمع العديد من الوكلاء وكان لديهم تفاعلات مثيرة للاهتمام.

برنامج تعليمي على مستوى المربية

بيئة التكوين

قبل تكوين البيئة ، تحتاج أولاً إلى إنشاء ملف utils.py يحتوي على مفتاح OpenAI API وتنزيل الحزم اللازمة.

** الخطوة الأولى. إنشاء ملف Utils **

في مجلد reverie / backend \ _server (المجلد الذي يوجد فيه reverie.py) ، أنشئ ملفً جديدًا useds.py وانسخ المحتوى التالي والصقه في الملف:

انسخ والصق OpenAI API Keyopenai \ _api \ _key = "" # ضع اسمك \ _owner = "" maze \ _assets \ _loc = "../../environment/frontend_server/static_dirs/assets"env \ _matrix = f "{maze \ _assets \ _loc} / the \ _ville / matrix" env \ _visuals = f "{maze \ _assets \ _loc} / the \ _ville / visuals" fs \ _storage = "../../ البيئة / الواجهة الأمامية \ _ الخادم / التخزين "fs \ _temp \ _storage =" ../../environment/frontend_server/temp_storage"collision_block_id = "32125" # Verbose debug = صحيح

بمفتاح OpenAI API الخاص بك وسيتم استبداله باسمك.

** الخطوة الثانية. متطلبات التثبيت. txt **

قم بتثبيت كل شيء مدرج في ملف requirements.txt (نوصي بشدة بإعداد بيئة افتراضية أولاً).

حاليًا ، اختبر الفريق على Python 3.9.12.

قم بتشغيل المحاكاة

لتشغيل محاكاة جديدة ، تحتاج إلى بدء تشغيل خادمين في نفس الوقت: خادم البيئة وخادم محاكاة الوكيل.

** الخطوة الأولى. بدء تشغيل خادم البيئة **

نظرًا لأن البيئة يتم تنفيذها كمشروع Django ، يجب بدء تشغيل خادم Django.

للقيام بذلك ، انتقل أولاً إلى environment / frontend \ _server (حيث يوجد manager.py) في سطر الأوامر. ثم قم بتشغيل الأمر التالي:

python manager.py runserver

ثم قم بزيارته في متصفحك المفضل.

إذا رأيت المطالبة "خادم البيئة الخاص بك قيد التشغيل" ، فهذا يعني أن الخادم يعمل بشكل طبيعي. تأكد من استمرار تشغيل خادم البيئة أثناء تشغيل المحاكاة ، لذلك احتفظ بعلامة تبويب سطر الأوامر هذه مفتوحة.

(ملاحظة: يوصى باستخدام Chrome أو Safari. قد يواجه Firefox بعض الأخطاء في الواجهة الأمامية ، ولكن لا ينبغي أن يؤثر على المحاكاة الفعلية.)

** الخطوة 2. ابدأ الخادم الوهمي **

افتح نافذة سطر أوامر أخرى (لا يزال خادم البيئة الذي استخدمته في الخطوة 1 قيد التشغيل ويحتاج إلى عدم المساس به). انتقل إلى reverie / backend \ _server وقم بتشغيل reverie.py لبدء الخادم الوهمي:

بيثون خيالية

في هذه المرحلة ، سيظهر موجه سطر أوامر يطلب ما يلي: "أدخل اسم محاكاة متشعبة:".

على سبيل المثال ، نريد الآن بدء محاكاة تحتوي على ثلاثة وكلاء ، إيزابيلا رودريغيز وماريا لوبيز وكلاوس مولر ، ثم أدخل ما يلي:

قاعدة \ _ت \ _فيل \ _ إيزابيلا \ _ ماريا \ _ كلوس

بعد ذلك ، ستسأل المطالبة: "أدخل اسم المحاكاة الجديدة:".

في هذا الوقت ، ما عليك سوى إدخال اسم عشوائي لتمثيل المحاكاة الحالية (مثل "محاكاة الاختبار").

اختبار المحاكاة

حافظ على تشغيل خادم المحاكي. في هذه المرحلة ، سيعرض الأمر التالي: "أدخل الخيار"

** الخطوة 3. تشغيل المحاكاة وحفظها **

انتقل إلى simulator \ _home في متصفحك واحتفظ بعلامة التبويب مفتوحة.

سترى الآن خريطة للمدينة وقائمة بالوكلاء النشطين على الخريطة ، ويمكنك استخدام أسهم لوحة المفاتيح للتنقل في جميع أنحاء الخريطة.

لتشغيل المحاكاة ، تحتاج إلى إدخال الأمر التالي في خادم المحاكاة مطالباً "أدخل الخيار":

يجري

لاحظ أنه يجب استبدال ما سبق بعدد صحيح يمثل عدد حركات اللعبة المراد محاكاتها.

على سبيل المثال ، إذا كنت تريد محاكاة لعبة من 100 خطوة ، فعليك إدخال run 100. حيث تمثل خطوة اللعبة 10 ثوانٍ في اللعبة.

الآن ، سيتم تشغيل المحاكاة ويمكنك مشاهدة الوكيل يتحرك عبر الخريطة في المتصفح.

بمجرد اكتمال التشغيل ، ستظهر مطالبة "Enter option" مرة أخرى. في هذه المرحلة ، يمكنك متابعة المحاكاة عن طريق إعادة إدخال أمر التشغيل وتحديد العدد المطلوب من خطوات اللعبة ، أو كتابة الخروج للخروج دون حفظ ، أو الحفظ والخروج.

في المرة التالية التي تقوم فيها بتشغيل خادم المحاكاة ، يمكنك الوصول إلى المحاكاة المحفوظة ببساطة عن طريق توفير اسم المحاكاة. بهذه الطريقة ، يمكنك إعادة تشغيل المحاكاة من حيث توقفت.

** الخطوة 4. محاكاة الإعادة **

لإعادة تشغيل محاكاة قيد التشغيل ، ما عليك سوى تشغيل خادم البيئة والانتقال إلى العنوان التالي في متصفحك: إعادة التشغيل //.

حيث يلزم استبداله باسم المحاكاة التي يتم إعادة تشغيلها ، وسيتم استبدال الخطوة الزمنية الصحيحة لبدء إعادة التشغيل.

** الخطوة 5. محاكاة العرض **

قد تجد أن جميع النقوش المتحركة تبدو متشابهة في الإعادة. وذلك لأن ميزة إعادة التشغيل مخصصة بشكل أساسي لتصحيح الأخطاء ولا تعطي الأولوية لتحسين الحجم أو العناصر المرئية للمجلد الوهمي.

لإثبات محاكاة مع النقوش المتحركة بشكل صحيح ، من الضروري أولاً ضغط المحاكاة. للقيام بذلك ، استخدم محرر نصوص لفتح الملف المضغوط \ _sim \ _storage.py الموجود في دليل reverie. بعد ذلك ، يتم تنفيذ وظيفة الضغط باسم محاكاة الهدف كمدخل. بهذه الطريقة ، سيتم ضغط ملف المحاكاة وبذلك يصبح جاهزًا للعرض التقديمي.

لبدء العرض التوضيحي ، يرجى فتح العنوان التالي في متصفحك: demo ///.

لاحظ ذلك ولها نفس المعنى كما هو مذكور أعلاه. يمكن استخدامه للتحكم في سرعة العرض ، حيث 1 هو الأبطأ و 5 هو الأسرع.

محاكاة مخصصة

لديك خياران لتخصيص mocks.

** الطريقة الأولى: كتابة وتحميل سجل الوكيل **

الأول هو تهيئة العامل بسجل فريد في بداية المحاكاة.

للقيام بذلك ، تحتاج إلى 1) البدء بأحد عمليات المحاكاة الأساسية ، 2) كتابة وتحميل محفوظات الوكيل.

الخطوة 1. ابدأ المحاكاة الأساسية

يتم تضمين عمليتي محاكاة أساسيتين في المستودع: base \ _the \ _ville \ _n25 (25 وكيلًا) و base \ _the \ _ville \ _isabella \ _maria \ _klaus (3 وكلاء). يمكن تحميل إحدى عمليات المحاكاة الأساسية باتباع الخطوات المذكورة أعلاه.

الخطوة 2. تحميل ملف التاريخ

بعد ذلك ، عندما يُطلب منك "إدخال الخيار" ، تحتاج إلى تحميل سجل الوكيل بالأمر التالي:

استدعاء - تاريخ تحميل \ _فيل / .csv

حيث ، يحتاج إلى استبداله باسم ملف المحفوظات الموجود.

يتم تضمين ملفين من ملفات المحفوظات في المستودع: agent \ _history \ _init \ _n25.csv (للقاعدة \ _the \ _ville \ _n25) والعميل \ _history \ _init \ _n3.csv (للقاعدة \ _the \ _ville \ _isabella \ _maria \ _كلوس). تحتوي هذه الملفات على قائمة سجلات الذاكرة لكل وكيل.

الخطوة 3. مزيد من التخصيص

لتخصيص التهيئة عن طريق كتابة ملفات المحفوظات الخاصة بك ، ضع الملفات في المجلد التالي: environment / frontend \ _server / static \ _dirs / الأصول / the \ _ville.

يجب أن يتطابق تنسيق العمود لملف المحفوظات المخصص مع ملف محفوظات العينة المرفق. لذلك ، يوصي المؤلف ببدء العملية عن طريق نسخ ولصق الملفات الموجودة بالفعل في المستودع.

** الطريقة الثانية: إنشاء نموذج أساسي جديد **

لمزيد من التخصيص المتعمق ، ستحتاج إلى كتابة ملف المحاكاة الأساسي الخاص بك.

الطريقة الأكثر مباشرة هي نسخ ولصق مجلد مضاهاة القاعدة الحالي ، ثم إعادة تسميته وتحريره وفقًا لمتطلباتك.

** المواد المرجعية: **

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت