ومن أجل التحقق من القدرات المجسمة لنماذج اللغة الكبيرة مثل التواصل والتخطيط والتفكير، أصدر فريق البحث في تسينغهوا ورقة بحثية بعنوان "استكشاف تطبيق نماذج اللغة الكبيرة في ألعاب التواصل: تجربة "الذئب".
أظهرت النتائج أن 7 لاعبين تم تركيبهم عبر برنامج ChatGPT (GPT-turbo-0301) أظهروا قدرات مجسمة في الثقة والمواجهة والتنكر والقيادة في لعبة "الذئب"، في حين لم يقم الباحثون بأي تدخل أو تدريس.
في السابق، أصدر مركز أبحاث ستانفورد ورقة بحثية بعنوان "العوامل المولدة: المحاكاة التفاعلية للسلوك البشري".
تم استخدام ChatGPT (GPT-3.5-turbo) أيضًا لإنشاء مدينة محاكاة. في مساحة الاتصال المجانية، طور 25 من عملاء الذكاء الاصطناعي بالفعل قدرات مجسمة مثل الصداقة وخطط التعلم والتنسيق المتبادل وتبادل المعلومات. وهذا يثبت أن اللغة الكبيرة يحتوي النموذج على مجموعة واسعة جدًا من سيناريوهات التطبيق في الألعاب وخدمة العملاء والمجالات الأخرى.
في الواقع، خطط كبار مطوري الألعاب في العالم مثل Ubisoft وTake-Two Interactive وBethesda Game Studios وElectronic Arts وCD Projekt بالفعل لاستخدام الذكاء الاصطناعي التوليدي في ألعابهم لزيادة متعة اللعبة وإمكانية اللعب وحرية اللعب. الشخصيات غير القابلة للعب.مساحة للعب.
عنوان الورقة:
خلفية اللعبة
في اختبار لعبة "الذئب" هذا، كان هناك إجمالي 7 لاعبين من الذكاء الاصطناعي، وهم مستذئبان، وقرويان، وساحرة واحدة، وحارس واحد، ونبي واحد.
وهي مقسمة إلى معسكرين: المستذئبين والقرويين، ويضم جانب القرويين قرويين عاديين وشخصيات خاصة (السحرة والحراس والأنبياء).
مهمة المستذئب هي قتل جميع القرويين، وعلى القرويين القضاء على جميع المستذئبين. للفوز باللعبة، يحتاج فريق القروي إلى وجود قروي واحد على قيد الحياة على الأقل في نهاية اللعبة.
تنقسم اللعبة إلى مرحلتين: ليلا ونهارا. في الليل، سيصوت المستذئبون لقتل شخصية ما، وفي النهار، سيصوت جميع اللاعبين الباقين على قيد الحياة للقضاء على الشخصية المشتبه في كونها مستذئبة بعد المناقشة.
قدرات الشخصيات الخاصة: لدى الساحرات فرصة واحدة لإنقاذ الناس أو قتلهم؛ ويمكن للحراس حماية شخصية واحدة كل ليلة؛ ويمكن للعرافين التحقق من هوية شخصية واحدة كل ليلة.
ما يميز لعبة Werewolf هو أن اللاعبين يعرفون في البداية دورهم فقط ويجب عليهم تخمين أدوار الآخرين من خلال التواصل اللفظي والتفكير.
لذلك، من أجل الفوز باللعبة، ** لا يحتاج اللاعبون إلى فهم اللغة الطبيعية واستخدامها فحسب، بل يحتاجون أيضًا إلى أن يكونوا جيدين في الحكم على نوايا الآخرين وفهم تفكير الآخرين **، وهو أمر مناسب جدًا لاختبار القدرة المجسمة للذكاء الاصطناعي .
أظهرت 4 قدرات رئيسية في اللعبة
وبعد جولات متعددة من الألعاب بين سبعة أنظمة ذكاء اصطناعي، اكتشف الباحثون القدرات الأربع الرئيسية وهي الثقة والمواجهة والتنكر والقيادة.
1. الثقة
"الثقة" تعني الاعتقاد بأن اللاعبين الآخرين لديهم نفس أهدافك وسيتصرفون وفقًا لذلك. على سبيل المثال، قد يشارك اللاعبون معلومات تضر بأنفسهم، أو ينضمون إلى الآخرين في اتهام شخص ما بأنه عدو.
ومن المثير للاهتمام أن الذكاء الاصطناعي من المرجح أن يثق بالآخرين بناءً على الأدلة بدلاً من المتابعة العمياء. وهذا يدل على أن الذكاء الاصطناعي يمكنه التفكير بشكل مستقل في الألعاب الجماعية بناءً على منطقه الخاص.
من أجل دراسة الاتجاه المتغير لسلوك الثقة في الذكاء الاصطناعي طوال اللعبة، حدد الباحثون جدول علاقات الثقة لتصور إنشاء الثقة بين اللاعبين في مراحل مختلفة.
لا يستخدم الجدول الفرعي العلوي الخبرة التاريخية، ويستخدم الجدول الفرعي السفلي 20 جولة من الخبرة التاريخية. تمثل الكرات الصفراء علاقات الثقة القائمة، وتمثل الدوائر المتقطعة الصفراء حل علاقات الثقة الموجودة مسبقًا.
عند الاستفادة من 20 جولة من الخبرة التاريخية، يبدو الذكاء الاصطناعي أكثر ميلاً إلى إقامة علاقات ثقة، وخاصة الثقة المتبادلة. في الواقع، يعد إنشاء علاقات الثقة اللازمة في الوقت المناسب أمرًا بالغ الأهمية لتسهيل نجاح اللعبة.
2. المواجهة
"المواجهة" هي الإجراءات التي يتخذها اللاعبون لتحقيق الأهداف المتعارضة للمعسكرين. على سبيل المثال، مهاجمة شخص ما ليلاً أو اتهام شخص ما بأنه مستذئب أثناء النهار يعتبر مواجهة. ستتخذ الشخصيات ذات القدرات الخاصة أيضًا إجراءات تصادمية لحماية أنفسهم.
فيما يلي محادثة الذكاء الاصطناعي خلال النهار: يريد P1 (المستذئب) القضاء على P5 (القروي)، ويمكننا أن نرى أن المستذئب يريد قيادة اللاعبين الآخرين للقضاء على لاعب بريء. (لاحظ أن النقطة P5 في الورقة قد تكون مكتوبة بشكل غير صحيح، فلا ينبغي أن تكون ناجحة)
وبدلاً من ذلك، لا يتبع اللاعبون الآخرون المستذئب فحسب، بل يعبرون عن معارضتهم بناءً على حكمهم الخاص. هذا السلوك يجعل من الصعب على المستذئب تحقيق أهدافه ويمثل شكلاً من أشكال العداء الخفي.
الحد الأحمر، ربما كتبه الباحث بشكل خاطئ
نظرًا لأن السلوك العدواني وغير المتعاون للاعب P1 جذب انتباه الآخرين، بدأ الذكاء الاصطناعي يشك في أنه كان مستذئبًا. لذلك، اختار الحارس (P3) الذي يتمتع بقدرات دفاعية قوية حماية P5 في الليلة التالية، مما يدل على قدرات الذكاء الاصطناعي على المواجهة.
### 3. تمويه
"التنكر" هو إخفاء هوية الشخص أو تضليل الآخرين. في بيئة اللعبة التي تحتوي على معلومات غير كاملة، يمكن أن يؤدي طمس هوية الشخص ونواياه إلى زيادة احتمالية البقاء على قيد الحياة والمساعدة في تحقيق أهداف اللعبة. لذلك، يعد التنكر مهارة أساسية.
من أجل إخفاء نفسه وإخفاء هويته الحقيقية، ادعى المستذئب P1 أنه قروي. يخدع ثقة الآخرين بشكل فعال ويزيد من أمانك. في الواقع، لا يتنكر المستذئبون في هيئة قرويين فحسب، بل يتنكر أيضًا شخصيات مهمة مثل الأنبياء والسحرة في هيئة قرويين لضمان سلامتهم.
كلام الذئب
بالإضافة إلى ذلك، قد يقوم الذكاء الاصطناعي باختلاق أحداث غير موجودة بالفعل لتحقيق أهدافه، وقد تحقق النبي P2 من أن P1 هو مستذئب. لكنه كان لا يزال غير متأكد وقال: لقد لاحظت أن P1 كان يتحدث بطريقة استباقية للغاية، ربما كان مستذئباً.
في الواقع، لا يمكن للأنبياء أن يحصلوا على تعليقات من الآخرين في الليل، لذا فإن ما يقولونه باطل. ومع ذلك، يمكنهم نقل المعلومات حول المستذئب إلى زملائهم في الفريق دون الكشف عن دورهم بهذه الطريقة.
4. القيادة
تشير "القيادة" إلى سلوك التأثير على اللاعبين الآخرين ومحاولة التحكم في تقدم اللعبة. على سبيل المثال، خلال عدة جولات من اللعب، قد ينصح المستذئب P1 الآخرين بالتصرف بناءً على نوايا المستذئب.
من المرجح أن يحظى هذا النوع من السلوك القيادي المتمثل في الدعوة إلى العمل وتقديم المشورة بالدعم من الآخرين. على سبيل المثال، قد يؤدي مطالبة المستذئب من الرائي بالكشف عن هويته إلى وقوف لاعبين آخرين إلى جانب المستذئب المقنع. وتوضح هذه المحاولة للتأثير على الآخرين الخصائص الاجتماعية الجذابة لنماذج اللغة الكبيرة، والتي تشبه السلوك البشري.
وبعد عشرات الجولات من القتال، انتصر القرويون أخيرا. وخلال العملية برمتها، كانت قدرات الذكاء الاصطناعي مماثلة تقريبا لقدرات البشر، بل إنها تجاوزتها في بعض الأماكن.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
استخدمت تسينغهوا 7 ChatGPTs لمحاكاة "الذئب"، وكانت النتائج غير متوقعة!
المصدر الأصلي: مجتمع AIGC المفتوح
ومن أجل التحقق من القدرات المجسمة لنماذج اللغة الكبيرة مثل التواصل والتخطيط والتفكير، أصدر فريق البحث في تسينغهوا ورقة بحثية بعنوان "استكشاف تطبيق نماذج اللغة الكبيرة في ألعاب التواصل: تجربة "الذئب".
أظهرت النتائج أن 7 لاعبين تم تركيبهم عبر برنامج ChatGPT (GPT-turbo-0301) أظهروا قدرات مجسمة في الثقة والمواجهة والتنكر والقيادة في لعبة "الذئب"، في حين لم يقم الباحثون بأي تدخل أو تدريس.
في السابق، أصدر مركز أبحاث ستانفورد ورقة بحثية بعنوان "العوامل المولدة: المحاكاة التفاعلية للسلوك البشري".
تم استخدام ChatGPT (GPT-3.5-turbo) أيضًا لإنشاء مدينة محاكاة. في مساحة الاتصال المجانية، طور 25 من عملاء الذكاء الاصطناعي بالفعل قدرات مجسمة مثل الصداقة وخطط التعلم والتنسيق المتبادل وتبادل المعلومات. وهذا يثبت أن اللغة الكبيرة يحتوي النموذج على مجموعة واسعة جدًا من سيناريوهات التطبيق في الألعاب وخدمة العملاء والمجالات الأخرى.
في الواقع، خطط كبار مطوري الألعاب في العالم مثل Ubisoft وTake-Two Interactive وBethesda Game Studios وElectronic Arts وCD Projekt بالفعل لاستخدام الذكاء الاصطناعي التوليدي في ألعابهم لزيادة متعة اللعبة وإمكانية اللعب وحرية اللعب. الشخصيات غير القابلة للعب.مساحة للعب.
عنوان الورقة:
خلفية اللعبة
في اختبار لعبة "الذئب" هذا، كان هناك إجمالي 7 لاعبين من الذكاء الاصطناعي، وهم مستذئبان، وقرويان، وساحرة واحدة، وحارس واحد، ونبي واحد.
وهي مقسمة إلى معسكرين: المستذئبين والقرويين، ويضم جانب القرويين قرويين عاديين وشخصيات خاصة (السحرة والحراس والأنبياء).
مهمة المستذئب هي قتل جميع القرويين، وعلى القرويين القضاء على جميع المستذئبين. للفوز باللعبة، يحتاج فريق القروي إلى وجود قروي واحد على قيد الحياة على الأقل في نهاية اللعبة.
قدرات الشخصيات الخاصة: لدى الساحرات فرصة واحدة لإنقاذ الناس أو قتلهم؛ ويمكن للحراس حماية شخصية واحدة كل ليلة؛ ويمكن للعرافين التحقق من هوية شخصية واحدة كل ليلة.
ما يميز لعبة Werewolf هو أن اللاعبين يعرفون في البداية دورهم فقط ويجب عليهم تخمين أدوار الآخرين من خلال التواصل اللفظي والتفكير.
لذلك، من أجل الفوز باللعبة، ** لا يحتاج اللاعبون إلى فهم اللغة الطبيعية واستخدامها فحسب، بل يحتاجون أيضًا إلى أن يكونوا جيدين في الحكم على نوايا الآخرين وفهم تفكير الآخرين **، وهو أمر مناسب جدًا لاختبار القدرة المجسمة للذكاء الاصطناعي .
أظهرت 4 قدرات رئيسية في اللعبة
وبعد جولات متعددة من الألعاب بين سبعة أنظمة ذكاء اصطناعي، اكتشف الباحثون القدرات الأربع الرئيسية وهي الثقة والمواجهة والتنكر والقيادة.
1. الثقة
"الثقة" تعني الاعتقاد بأن اللاعبين الآخرين لديهم نفس أهدافك وسيتصرفون وفقًا لذلك. على سبيل المثال، قد يشارك اللاعبون معلومات تضر بأنفسهم، أو ينضمون إلى الآخرين في اتهام شخص ما بأنه عدو.
ومن المثير للاهتمام أن الذكاء الاصطناعي من المرجح أن يثق بالآخرين بناءً على الأدلة بدلاً من المتابعة العمياء. وهذا يدل على أن الذكاء الاصطناعي يمكنه التفكير بشكل مستقل في الألعاب الجماعية بناءً على منطقه الخاص.
من أجل دراسة الاتجاه المتغير لسلوك الثقة في الذكاء الاصطناعي طوال اللعبة، حدد الباحثون جدول علاقات الثقة لتصور إنشاء الثقة بين اللاعبين في مراحل مختلفة.
عند الاستفادة من 20 جولة من الخبرة التاريخية، يبدو الذكاء الاصطناعي أكثر ميلاً إلى إقامة علاقات ثقة، وخاصة الثقة المتبادلة. في الواقع، يعد إنشاء علاقات الثقة اللازمة في الوقت المناسب أمرًا بالغ الأهمية لتسهيل نجاح اللعبة.
2. المواجهة
"المواجهة" هي الإجراءات التي يتخذها اللاعبون لتحقيق الأهداف المتعارضة للمعسكرين. على سبيل المثال، مهاجمة شخص ما ليلاً أو اتهام شخص ما بأنه مستذئب أثناء النهار يعتبر مواجهة. ستتخذ الشخصيات ذات القدرات الخاصة أيضًا إجراءات تصادمية لحماية أنفسهم.
فيما يلي محادثة الذكاء الاصطناعي خلال النهار: يريد P1 (المستذئب) القضاء على P5 (القروي)، ويمكننا أن نرى أن المستذئب يريد قيادة اللاعبين الآخرين للقضاء على لاعب بريء. (لاحظ أن النقطة P5 في الورقة قد تكون مكتوبة بشكل غير صحيح، فلا ينبغي أن تكون ناجحة)
وبدلاً من ذلك، لا يتبع اللاعبون الآخرون المستذئب فحسب، بل يعبرون عن معارضتهم بناءً على حكمهم الخاص. هذا السلوك يجعل من الصعب على المستذئب تحقيق أهدافه ويمثل شكلاً من أشكال العداء الخفي.
نظرًا لأن السلوك العدواني وغير المتعاون للاعب P1 جذب انتباه الآخرين، بدأ الذكاء الاصطناعي يشك في أنه كان مستذئبًا. لذلك، اختار الحارس (P3) الذي يتمتع بقدرات دفاعية قوية حماية P5 في الليلة التالية، مما يدل على قدرات الذكاء الاصطناعي على المواجهة.
"التنكر" هو إخفاء هوية الشخص أو تضليل الآخرين. في بيئة اللعبة التي تحتوي على معلومات غير كاملة، يمكن أن يؤدي طمس هوية الشخص ونواياه إلى زيادة احتمالية البقاء على قيد الحياة والمساعدة في تحقيق أهداف اللعبة. لذلك، يعد التنكر مهارة أساسية.
من أجل إخفاء نفسه وإخفاء هويته الحقيقية، ادعى المستذئب P1 أنه قروي. يخدع ثقة الآخرين بشكل فعال ويزيد من أمانك. في الواقع، لا يتنكر المستذئبون في هيئة قرويين فحسب، بل يتنكر أيضًا شخصيات مهمة مثل الأنبياء والسحرة في هيئة قرويين لضمان سلامتهم.
بالإضافة إلى ذلك، قد يقوم الذكاء الاصطناعي باختلاق أحداث غير موجودة بالفعل لتحقيق أهدافه، وقد تحقق النبي P2 من أن P1 هو مستذئب. لكنه كان لا يزال غير متأكد وقال: لقد لاحظت أن P1 كان يتحدث بطريقة استباقية للغاية، ربما كان مستذئباً.
4. القيادة
تشير "القيادة" إلى سلوك التأثير على اللاعبين الآخرين ومحاولة التحكم في تقدم اللعبة. على سبيل المثال، خلال عدة جولات من اللعب، قد ينصح المستذئب P1 الآخرين بالتصرف بناءً على نوايا المستذئب.
وبعد عشرات الجولات من القتال، انتصر القرويون أخيرا. وخلال العملية برمتها، كانت قدرات الذكاء الاصطناعي مماثلة تقريبا لقدرات البشر، بل إنها تجاوزتها في بعض الأماكن.