** اكتشف الإمكانات المبتكرة لوكلاء الذكاء الاصطناعي **
** إجماع وكلاء الذكاء الاصطناعي وعدم إجماعهم **
يرجع السبب في أن AI-Agents أصبح اتجاهًا جذب المزيد والمزيد من الاهتمام إلى حد كبير إلى حقيقة أن LLM يوفر طريقًا عمليًا للتنفيذ التقني لتطبيق AI-Agents ، وثانيًا ، هناك العديد من المشاريع المتعلقة بـ AI-Agents . حبس.
على الرغم من أن LiLian Weng يعرّف ما هي عوامل الذكاء الاصطناعي التي تعتمد على LLM في مقالته؟ لكن Deepmind تحاول أيضًا تحديد مفهوم الوكيل الموحد.أعتقد أن مفهوم AI-Agents سيشكل أيضًا أنواعًا مختلفة من التمايز مع فهم شركات الذكاء الاصطناعي المختلفة.
الإجماع الرئيسي الأكثر وضوحًا هو أن ** استنادًا إلى الوكلاء المدفوعين بـ LLM لتحقيق المعالجة التلقائية للمشكلات العامة ** ، فإن وكلاء الذكاء الاصطناعي هم الذين حددناهم في دورة انفجار نموذج اللغة واسعة النطاق هذه وشكلنا فهمًا مشتركًا.
** ابحث عن الاحتمال من ارتباط الوكلاء **
على مستوى تطبيق AI-Agents ، في المرحلة الحالية ، يجب أن ننظر إلى وكلاء AI من منظور "الصلة" قدر الإمكان ، أي يجب أن نتسامح مع التجربة والخطأ وأن نكون مبتكرين في الأشكال الممكنة وكلاء AI. الإمكانية ** ، يجب ألا تبحث عن إجابة موحدة في موقف ضيق مثل بعض النقاد ، فهذه ليست مستحسنة.
على سبيل المثال ، فإن Auto-GTP ، كاحتمال ، قد ألهم بالفعل العديد من مشاريع الوكلاء ، لكن النقد الضيق سيفقد فرصة اقتناص فرص جديدة ، وهي ظاهرة شائعة بين المطورين الصينيين. كمطور بدون إبداع ، كيف ستعتمد على قدرتك التنافسية التقليدية في عصر برمجة اللغات الطبيعية؟
على الرغم من وجود العديد من المقدمات حول المشاريع المتعلقة بوكلاء الذكاء الاصطناعي ، أعتقد أن هناك مشكلة قائمة ومقدمة متجانسة.تتيح لنا هذه المحتويات معرفة المشاريع التي تنتمي إلى اتجاه وكلاء الذكاء الاصطناعي ، ولكن لا يوجد أي صلة تبدأ من الطبيعة ، يُظهر إمكانات وكلاء الذكاء الاصطناعي في مجالات التطبيق المختلفة ، والموقع البيئي لأنواع معينة من مشاريع وكلاء الذكاء الاصطناعي.
على سبيل المثال ، في مقدمتي ، سيتم تصنيف Auto-GPT و BabayAGI و MetaGPT في نوع واحد من البيئة من قبلي ، لأن لديهم استمرارية مسار معين ؛
** بناء إدراك شامل في أحجية الوكلاء **
الكل في الكل ، في مقدمة المشاريع التمثيلية حول وكلاء الذكاء الاصطناعي ، ** استخدمت وجهات نظر "الصلة" و "الوضع البيئي" و "الاستمرارية" ** لتقديم مشاريع تمثيلية ، حتى نتمكن من رؤية التطور المستقبلي بشكل غامض اتجاه وكلاء منظمة العفو الدولية.
تظهر المشاريع العشرة التالية ذات الصلة ، بما في ذلك بعض المشاريع المرجعية ذات الصلة. سأستخدم الحالة كلغز لتجميع خريطة كاملة نسبيًا معًا ، وهو ما يكفي للسماح لعدد أكبر من الأشخاص بإدراك كيف يمكن لإمكانيات الوكلاء تغيير كل شيء على الإنترنت بما في ذلك إعادة تشكيل المشهد Web3.
** اتجاهان رئيسيان في المستقبل لوكلاء الذكاء الاصطناعي **
يمكن تقسيم وكلاء الذكاء الاصطناعي تقريبًا إلى اتجاهين: ** الوكلاء المستقلون والوكلاء المولّدون. **
يأخذ الوكلاء المستقلون Auto-GPT كمثال ، والذي يمثل القدرة على أداء المهام المختلفة تلقائيًا لتحقيق النتائج المستهدفة من خلال أوصاف متطلبات اللغة الطبيعية. في هذه العلاقة التعاونية ، يخدم الوكلاء المستقلون الأشخاص ولديهم سمات أداة واضحة ؛
يأخذ الوكلاء التوليديون مدينة افتراضية مؤلفة من 25 وكيلًا ذكيًا نشرتهم ستانفورد كمثال. وكلاء التوليد ، بصفتهم وكلاء ذكاء اصطناعي يتمتعون بخصائص تشبه الشخصية ، وقدرة مستقلة على اتخاذ القرار ، وذاكرة طويلة المدى ، يميلون أكثر إلى مفهوم "الموطن": في هذا التعاون في العلاقات ، يتمتع العملاء بعلاقات اجتماعية رقمية محلية ، وليس مجرد أدوات لخدمة الناس ؛
** Auto-GPT **
أحد أشهر المشاريع مفتوحة المصدر لـ Auto-GPT ، تقديمه على GitHub بسيط للغاية "محاولة تجريبية مفتوحة المصدر لجعل GPT-4 مستقلة تمامًا." ، محاولة تجريبية مفتوحة المصدر لجعل GPT-4 بالكامل مستقل.
ملخص موجز هو أن Auto-GTP يمكنها أتمتة نتيجة المهمة النهائية بالكامل من خلال متطلبات مهمة من جملة واحدة ؛ يكمن المنطق الأساسي لقدرة Auto-GPT على إكمال المهام بشكل مستقل في قدرة تخطيط المهام لنموذج اللغة ، من خلال المهمة Carry التفكيك والتحليل خطوة بخطوة ، وتحسين خطوات تنفيذ المهمة تلقائيًا. في هذه العملية ، ستتم إعادة نتائج البحث على الإنترنت إلى نموذج اللغة ، وسيتم تفكيك المهمة وتنفيذها بشكل أكبر.
لاستخدام العامية الشعبية كاستعارة ، أكملت Auto-GPT المهمة في عملية "الاستجواب الذاتي والإجابة الذاتية" ، دون الحاجة إلى توفير كلمات سريعة للبشر. **
على الرغم من أن العديد من الأشخاص ينتقدون Auto-GPT بسبب استهلاكها الضخم للرموز وعدم وجود نتائج مستقرة ، إلا أن Auto-GTP ، كحالة أتمتة قائمة على LLM ، أثار فضول المطورين بشكل كبير. في طليعة تجربة المشاريع مفتوحة المصدر لاستكشاف الأتمتة.
عنوان المشروع:
** يمكن لـ BabyAGI إنشاء مهام جديدة وفرزها وتنفيذها تلقائيًا بناءً على نتائج المهام السابقة والأهداف المحددة مسبقًا. ** يستخدم تقنية معالجة اللغة الطبيعية لإنشاء مهام جديدة بناءً على الأهداف ، وتخزين نتائج المهام في قاعدة البيانات بحيث يمكن العثور على المعلومات ذات الصلة عند الحاجة.
BabyAGI هو في الواقع نص برمجي Python يدير حلقة لا نهائية لإكمال الخطوات التالية:
احصل على المهمة الأولى من قائمة المهام.
أرسل المهمة إلى وكيل التنفيذ ، ويستخدم وكيل التنفيذ واجهة برمجة تطبيقات OpenAI لإكمال المهمة وفقًا للسياق.
إثراء النتيجة وتخزينها في Chroma / Weaviate.
إنشاء مهام جديدة وإعادة ترتيب قوائم المهام بناءً على الأهداف المحددة مسبقًا ونتائج المهام السابقة.
عنوان المشروع:
يمثل كل من Auto-GPT و BabyAGI من الناحية النظرية الفترة الأولية لانتشار LLM الحالي لدينا. أعتقد أن استكشافنا لـ AGI استنادًا إلى LLM ومعالج حل المهام للأغراض العامة بقيادة LLM هو الكأس المقدسة في مجال AI- وكلاء في المستقبل.
** وكلاء التوليد **
تعتبر الورقة البحثية "Generative Agents: Interactive Simulacra of Human Behavior" التي نشرتها ستانفورد وباحثي Google مشروعًا معروفًا جدًا للذكاء الاصطناعي. ، يمكن للوكلاء الأذكياء إدراك التفاعل المحاكي لسلوك الحياة البشرية ، ويمكنهم أيضًا التفاعل مع بيئة المدينة الافتراضية ، ويمكنهم أيضًا التفاعل مع البشر خارج العالم الافتراضي. **
تحتوي هذه الورقة على حلين رئيسيين يستحقان اهتمامنا:
** 1 ، هندسة عامل التوليد **
يدرك الوكلاء بيئتهم ويحتفظون بجميع التصورات في سجل شامل يسمى تدفق الذاكرة ، ويسجلون تجربة الوكيل. بناءً على تصوراتهم ، تسترجع الهندسة المعمارية الذكريات ذات الصلة ثم تستخدم هذه السلوكيات المسترجعة لتحديد إجراء ما. تُستخدم هذه الذكريات المسترجعة أيضًا لتشكيل خطط طويلة المدى وإنشاء انعكاسات ذات مستوى أعلى ، وكلاهما يتم إدخالهما في تدفق الذاكرة للاستخدام المستقبلي.
** 2 ، تدفق الذاكرة **
استنادًا إلى بنية العامل التوليدي والبيئة التفاعلية التي تقع فيها التجربة ، سينشئ الوكيل حتمًا قدرًا كبيرًا من بيانات الذاكرة. Memory Stream هي قاعدة بيانات تسجل بشكل شامل جميع ذكريات العامل التوليدي. إنها قائمة تحتوي على كائنات ذاكرة متعددة ، كل كائن يحتوي على وصف للغة الطبيعية ، وطابع زمني للإنشاء ، وطابع زمني آخر للوصول. إن العنصر الأساسي لتدفق الذاكرة هو الملاحظة ، وهو حدث يدركه الفاعل مباشرة. تشمل الملاحظات الشائعة الإجراءات التي يقوم بها الوكيل نفسه ، أو الإجراءات التي يدرك الوكيل أنها تؤديها عوامل أخرى أو كائنات غير وكيل.
بناءً على المكونين الرئيسيين المذكورين أعلاه ، في الواقع ، ينقسم السلوك العام للعامل التوليدي إلى ثلاثة أجزاء: [الذاكرة والاسترجاع] [الانعكاس] [التخطيط والاستجابة]. لمزيد من التفاصيل ، يرجى الرجوع إلى محتوى الورقة الأصلية .
أثبتت هذه الورقة وهذه التجربة أن السلوك التفاعلي الناتج عن الوكيل الذي تم تكوينه على أساس LLM يمكن الوثوق به لمحاكاة سلوك التفاعل البشري في بيئة رقمية. علاقة تفاعل بين الإنسان والحاسوب بين الوكلاء والبشر.
ما يمكن أن نشعر به بشكل حدسي هو أن العامل التوليدي يتم إنشاؤه كدور للمقيم الرقمي الأصلي في metaverse ، وينتج تفاعلات مختلفة مع بيئة metaverse البشرية. في الواقع ، ** يمكننا محاكاة عالم افتراضي رقمي متطور للغاية لوكلاء الذكاء الاصطناعي ، ويمكن للبشر استخراج نتائج العمل الرقمية لوكلاء الذكاء الاصطناعي من هذا العالم ؛ **
** كيف يصبح الوكلاء شركاء عمل **
نظرًا لأنه يتم ترجمة الوكلاء على أنهم "وكلاء" في العديد من السياقات هذه المرة ، فمن السهل ربط الوكلاء بمفهوم دور الوسيط ، مما يجعل من الصعب على العديد من الأشخاص إنشاء ارتباط بديهي لتطبيق المشهد للوكلاء ؛ في هذه الحالات الثلاث ، على التوالي يوضح كيف يمكن للوكلاء أن يصبحوا "خبراء بشريين" يمكن توظيفهم ، وشركة تسويق آلية لا تتطلب مشاركة بشرية على الإطلاق ، وكيف يشكل الوكلاء فريقًا للتعاون مع بعضهم البعض.
في المثال التالي ، يمكننا استخدام NexusGPT لإنشاء العديد من الموظفين الخبراء ، واستخدام GPTeam لتشكيل فريق معين من قبل البشر ، ويعمل فريق الذكاء الاصطناعي هذا في شركة مؤتمتة بالكامل مثل AutoCorp. عندما نجمع قطع الألغاز هذه معًا ، يمكننا أن نشعر بديهيًا أن المستقبل قد حان ؛
** NexusGPT **
يُطلق على هذا النظام الأساسي المستقل الأول للذكاء الاصطناعي في العالم والذي تم إنشاؤه بواسطة مطور مستقل Assem. يعتمد NexusGPT على إطار عمل LangChainAI ، باستخدام واجهة برمجة تطبيقات GPT-3.5 و Chroma (قاعدة بيانات مدمجة مفتوحة المصدر مدمجة في AI) ، على منصة NexuseGPT مع أكثر من ثمانمائة وكيل ذكاء اصطناعي بمهارات محددة.
يمكن للوكلاء على NexusGPT تعديل صعوبة الأسئلة بذكاء:
المستوى 1: حوار بسيط
المستوى 2: العمليات / الإضافات المحددة مسبقًا
المستوى 3: وضع AutoGPT
لكن هذه كلها تعتمد على دعم استدعاءات الوظائف لـ OpenAI و LangchainAI ؛
أثناء تنفيذ مهمة الوكيل ، يأخذ المؤلفون في الاعتبار السرعة التي يتقارب بها النظام مع درجات عالية من خلال ردود الفعل البشرية وتقييم الملاحظات في حلقة. في الواقع ، هذا لتزويد وكلاء الذكاء الاصطناعي بمهارات محددة لتحقيق استراتيجيات تحسين مُحسّنة بشكل متكرر في التواصل مع الطرف البشري أ بشأن متطلبات المهمة.
يمثل NexusGPT نموذج عمل مستقبليًا للبشر لتوظيف الوكلاء. يحتوي هذا المشروع في الواقع على مجال كبير للتحسين ، مثل الجمع بين الوكلاء ووحدات الخبراء (نظام خبير ونموذج خبير). ** طريقة تسعير الطرف أ لتوظيف الوكلاء هي استنادًا إلى حساب الرمز المميز للاستهلاك ، وما إلى ذلك ، ستغير هذه الطريقة التقليدية لتوظيف سوق العمل ، وستغير أيضًا طريقة تعاون DAO ؛ **
** أوتوكورب **
تم إنشاؤه في 5 ساعات بواسطة AutoCorpmina fahmi وفريقهم خلال New York GPT / LLM Hackathon. AutoCorp هي شركة تسويق علامات تجارية مستقلة تمامًا. ستقوم AutoCorp تلقائيًا بإنشاء إعلانات العلامة التجارية وتصميمات المنتجات لشركة تبيع القمصان مباشرة. عندما يقوم العملاء برفع احتياجات جديدة للمستهلكين ، ستقوم AutoCorp بتحديث موضوعها وإنشاء أصول تصميم جديدة. التكرار الذاتي المستمر نحو اتجاه عمل أفضل.
أولاً ، طورت AutoCorp فكرة أولية لعلامة تجارية للقمصان بناءً على الفكرة الأصلية. ثم استخدمت هذه الفكرة الأولية لإنشاء أصول الشركة المختلفة ودليل النمط الافتراضي. عندما يقوم العملاء باحتياجاتهم ، ستقوم AutoCorp بتحديث خطتها وفقًا لهذه الاحتياجات. إذا كانت الخطة تؤدي إلى مبيعات أقل ، تقوم AutoCorp بإجراء تعديلات. تم تشغيل العملية المذكورة أعلاه من البداية إلى النهاية ويمكن توصيلها فعليًا بواجهة برمجة التطبيقات الإعلانية وواجهة برمجة تطبيقات القميص المخصصة للنشر في العالم الحقيقي.
تم اقتباس هذه الفقرة من تويتر الخاص بمينا فهمي ، كما تم إنشاء AutoCorp بواسطة مينا فهمي وفريقهم خلال هاكاثون GPT / LLM في نيويورك في 5 ساعات ، والغرض من إنشاء AutoCorp هو أيضًا دفع مفهوم "الاستقلالية" إلى المتطرف.
في الواقع ، فإن الغرض من AutoCorp و DAO متسق للغاية. ** إذا كان الهدف النهائي لمنظمة لامركزية هو إزالة العامل "البشري" ، فإن أتمتة عمليات الإنتاج بالكامل هي في الواقع جاذبية تطوير معقولة لمفهوم DAO. ** تمثل AutoCorp في الواقع اتجاه تطوير الأعمال المستقبلي لـ DAO.
** فريق GPTeam **
GPTeam هو نظام محاكاة متعدد العوامل مفتوح المصدر. يستفيد GPTeam من GPT-4 لإنشاء وكلاء متعددين يتعاونون لتحقيق أهداف محددة مسبقًا. الهدف الرئيسي من هذا المشروع هو استكشاف إمكانات نماذج GPT في تحسين الإنتاجية متعددة الوكلاء والتواصل الفعال.
توظف GPTeam وكلاء مستقلين ، كل منهم مزود بذاكرة ، ويتفاعل من خلال الاتصال. تم استلهام تطبيقات الذاكرة والانعكاس للوكلاء من ورقة البحث هذه. يتنقل الوكلاء حول العالم ويؤدون المهام في مواقع مختلفة بناءً على مهامهم الخاصة ومواقع الوكلاء الآخرين. يمكنهم التواصل مع بعضهم البعض والتعاون في المهام أثناء العمل بالتوازي لتحقيق هدف مشترك.
عنوان المشروع:
في الواقع ، لا يزال هناك العديد من المشاريع مفتوحة المصدر مثل GPTeam ، مثل Dev-GPT ، وهو فريق تطوير آلي يقوم بإنشاء خدمات مصغرة مخصصة للمستخدمين. يتكون الفريق من ثلاثة أدوار افتراضية: مدير المنتج ، والمطور ، وعمليات التطوير والصيانة. الفكرة التقنية لـ Dev-GPT هي تحديد واختبار استراتيجيات المهام الفعالة بشكل أساسي. إذا فشلت 10 مرات متتالية ، فسيتم تبديلها. إلى الطريقة التالية.
سنرى المزيد والمزيد من المشاريع ، ** تصميم وكلاء الذكاء الاصطناعي كنوع من فريق الذكاء الاصطناعي ** ، ليس من الصعب تحديد الوكلاء كدور إنتاجي ، مثل حالة NexusGPT ، يمكن للمطورين تعيين كل وكلاء. أن يصبحوا وكلاء يتمتعون بمهارات حصرية ، ثم كيفية التعاون مع هؤلاء الوكلاء لممارسة مهاراتهم الخاصة ، وتنفيذ أتمتة مهمة / مشروع معًا ، وهو أمر يمثل تحديًا. يستكشف Project Atlas Agents الأتمتة القائمة على اللغة الطبيعية ، في الواقع يوفر سيناريو تطبيق جيد لفريق الوكلاء ؛
** كل هذا يجعلني أفكر في DAO ، وهي منظمة تعاون مهام آلية تستند إلى منطق الحوكمة الآلي ؛ **
** كيف يحل الوكلاء محل العمل المتكرر **
قبل أن يحل الذكاء الاصطناعي محل عملنا بالكامل ، يستبدل الوكلاء معظم عملنا المتكرر الحالي هو اتجاه التطوير التالي للوكلاء في مجال الأعمال. قبل ظهور الوكلاء المستندة إلى LLM ، تعد RPA (أتمتة العمليات الروبوتية) أول الحلول التي تبحث عنها الصناعة ، ولكن يتمتع RPA التقليدي بعتبة عالية ولا يمكن تعميمه للجمهور. RPA هو علاج لنقص أتمتة منطق التفاعل التقليدي لتكنولوجيا المعلومات ، ويمكن للوكلاء الحاليين التواصل مع اللغة الطبيعية لإدراك وظيفة حاجة RPA.
يوضح لنا المشروعان التاليان كيف سيساعدنا وكلاء LLM في تحرير أنفسنا من العمل المتكرر في عملنا اليومي وأبحاثنا الأكاديمية. (في الواقع ، إمكانات هذين المشروعين أكثر من ذلك)
** طبقة الغش **
"أتمتة عملك باستخدام اللغة الطبيعية" ، باستخدام اللغة الطبيعية لأتمتة أعمالك ، هذا هو شعار العلامة التجارية لـ Cheat Layere. تعمل طبقة الغش على حل مشكلات أتمتة الأعمال المستحيلة من خلال نماذج التعلم الآلي GPT-4 المدربة خصيصًا ، والتي تعمل كمهندسي برمجيات الذكاء الاصطناعي لكل مستخدم.
أصدرت Cheat Layer منتجين على Producthunt ، أحدهما هو Cheat Layer والآخر هو Project Atlas Agents. وكلاء Project Atlas عبارة عن واجهة إدارة لمشاريع بدون رمز يمكن استخدامها لبناء وكلاء AI وتكرارهم.
تقوم Cheat Layer بأتمتة تشغيل صفحة الويب بالكامل من خلال وضع المكون الإضافي في Google Chrome وتستخدم لغة طبيعية. على سبيل المثال ، يمكن في الواقع تشغيل معظم عملياتنا الروتينية على صفحة الويب تلقائيًا. تذكرنا طبقة الغش بسهولة تقنية RPA ، أي أتمتة العمليات الآلية. كانت هناك العديد من المناقشات حول العلاقة بين الوكلاء و RPA. ومن الحقائق التي لا جدال فيها أن الوكلاء قد أزالوا تقنية RPA التقليدية.
استخدم لغة طبيعية من خلال Cheat Layer لإعداد أتمتة العمليات التجارية ، واستخدام Project Atlas Agents لإدارة عمليات الأتمتة المختلفة. بشكل عام ، يمكننا استخدام وضع اللغة الطبيعية لإنشاء وكلاء لإدارة التنفيذ الآلي لنشاط تجاري معين ، مثل يزداد تعقيد الأعمال ، ويمكننا تحسين الوكلاء بشكل متكرر.
لا أعرف التسويق والترويج لـ Cheat Layer في الوقت الحالي ، ولكن وفقًا لإحصائيات موقع الويب المشابه ، فإن المستخدمين الرئيسيين هم بشكل أساسي في أمريكا الشمالية ، وقد زاد عدد الزيارات بنسبة 37.8٪ مقارنة بالشهر السابق. من خلال إنشاء وكلاء لأتمتة إدارة الأعمال ، فإنه نسبيًا بالمقارنة مع روبوتات الدردشة المختلفة ، قد يكون هذا الطلب قادرًا على تلبية احتياجات أصحاب التجارة الإلكترونية الصغيرة والمتوسطة الحجم ، وربما يكون هذا اتجاهًا يستحق الاستكشاف والحفر ؛
** باحث GPT **
GPT Researcher هو وكيل مستقل قائم على GPT قادر على إجراء بحث شامل عبر الإنترنت حول أي موضوع معين. مقدمة المشروع على Github هي:
"الوكيل قادر على إنشاء تقارير بحثية مفصلة وموضوعية وغير متحيزة مع خيارات التخصيص للتركيز على الموارد والمخططات والدروس ذات الصلة. مستوحى من AutoGPT وورقة بحث حديثة عن التخطيط والحل ، يحل باحث GPT مشاكل السرعة والحتمية ، من خلال موازنة عمل الوكيل بدلاً من العمليات المتزامنة ، مما يوفر أداءً أكثر استقرارًا وسرعة أكبر. "
يتم تنفيذ بنية GPT Researcher بشكل أساسي من خلال تشغيل عاملين ، ** أحدهما "مخطط" والآخر "منفذ" ؛ ** يكون المخطط مسؤولاً عن طرح أسئلة البحث ، بينما يعتمد المنفذ على البحث الأسئلة التي تم إنشاؤها بواسطة المخطط العثور على المعلومات ذات الصلة ، وأخيراً تصفية وتلخيص جميع المعلومات ذات الصلة من خلال المخطط ، ثم إنشاء تقرير بحثي ؛
اكثر تحديدا:
قم بإنشاء مجموعة من الأسئلة البحثية التي تشكل معًا رأيًا موضوعيًا حول أي مهمة معينة.
لكل سؤال بحثي ، قم بتشغيل وكيل الزاحف لكشط المعلومات ذات الصلة بالمهمة المحددة من الموارد عبر الإنترنت.
لكل مورد تم الزحف إليه ، لخص بناءً على المعلومات ذات الصلة وتتبع مصدره.
أخيرًا ، يتم فحص جميع الموارد الملخصة وتجميعها ، ويتم إنشاء تقرير البحث النهائي.
** مميزات هذا المشروع **
قم بإنشاء تقارير بحثية ومخططات وموارد ودروس مستفادة
تجمع كل دراسة أكثر من 20 مصدرًا عبر الإنترنت لتشكيل استنتاجات موضوعية وواقعية
يتضمن واجهة ويب سهلة الاستخدام (HTML / CSS / JS)
تجريف الويب الممكّنة لجافا
سجل وتتبع المعلومات السياقية حول مصادر الويب التي تمت زيارتها واستخدامها
تصدير التقارير البحثية إلى تنسيقات مثل PDF ...
على الرغم من أن GPT Researcher هي أداة بحث أكاديمية تعتمد على GPT ، وهذا مشروع مفتوح المصدر للأغراض الأكاديمية بموجب ترخيص MIT. من منظور إنشاء المحتوى ، فإن هذا المصدر المفتوح له قيمة تجارية عالية. على سبيل المثال ، عند تطبيق هذا المشروع مفتوح المصدر على تقارير تحليل الأعمال ، لا يزال بإمكانه توفير الكثير من الوقت. ثانيًا ، قم بتحويل هذا المشروع مفتوح المصدر إلى ذكاء اصطناعي لـ يعمل وكلاء كتابة المحتوى المتعمق أيضًا على تغيير نمط صناعة وسائط المحتوى تمامًا ؛
عنوان المشروع:
** بيئة البنية التحتية لوكلاء الذكاء الاصطناعي **
المستقبل الواضح هو أن العلاقة التعاونية بين البشر في المستقبل لم تعد علاقة تعاونية بين البشر والبشر ، بل علاقة تعاونية بين البشر ووكلاء الذكاء الاصطناعي ، وسيكون لكل فرد أكبر عدد ممكن من وكلاء الذكاء الاصطناعي. يساعد الوكلاء أنفسهم للتعامل مع أكبر عدد ممكن من المهام ، وبالتالي تشكيل هيكل تعاون اجتماعي ذكي كبير ومعقد ؛ **
تختلف العلاقة التعاونية بين البشر والوكلاء عن النظرية التعاونية للبشر والأدوات في نظريات العلوم الاجتماعية السابقة. والمفتاح هو أن العملاء ، كنوع من الذكاء الشبيه بالإنسان ، يتمتعون بقدرات معينة على اتخاذ القرار المستقل ، وثقة الإنسان في أصبح الوكلاء أيضًا قضية رئيسية ، ناهيك عن الوعي الذاتي للوكلاء ، ولكن تأثير الوكلاء على سلوك التفاعل الاجتماعي في اتخاذ القرارات بدلاً من البشر.
بناءً على النظر في الاقتراحين المذكورين أعلاه ، علينا أن ندرك أنه من الممكن للبشر إنشاء وكلاء الذكاء الاصطناعي الخاص بهم بكفاءة وسهولة ، مع السماح لوكلائهم بامتلاك قدرات أكثر قوة ، وفي نفس الوقت ، وكلاء موثوقة وجديرة بالثقة. لا يمكن فصلها عن بنية تحتية جيدة لتقديم الدعم. أعتقد أن إدخال المشاريع الثلاثة التالية يمثل الاتجاه الإنشائي للبنية التحتية لوكلاء الذكاء الاصطناعي المستقبلية ؛
** لانج تشين **
LangChain هو إطار تطوير تطبيق قائم على نموذج اللغة. يمكنه تحقيق الوظائف التالية
** مراعاة البيانات: ** قم بتوصيل نماذج اللغة بمصادر البيانات الأخرى
** الوكيل: ** يسمح للنموذج اللغوي بالتفاعل مع بيئته.
تكمن القيمة الرئيسية لـ LangChain في:
** المكون: ** يوفر تجريدات للعمل مع نماذج اللغة ، ويوفر سلسلة من التطبيقات لكل فكرة مجردة. هذه المكونات معيارية وسهلة الاستخدام ، سواء كنت تستخدم بقية إطار عمل LangChain أم لا.
** سلاسل جاهزة **: مجموعة منظمة من المكونات لتنفيذ مهام محددة عالية المستوى.
تجعل السلاسل الجاهزة من السهل البدء بسرعة. بالنسبة للتطبيقات الأكثر تعقيدًا وحالات الاستخدام الدقيقة ، تسهل المكونات تخصيص السلاسل الحالية أو إنشاء سلاسل جديدة.
** توفر langchain واجهات قياسية وقابلة للتوسيع وتكاملًا خارجيًا من خلال توفير الوحدات النمطية التالية **
إدخال وإخراج نموذج الإدخال / الإخراج: تفاعل الواجهة مع نموذج اللغة *
اتصال بيانات اتصال البيانات: واجهة تفاعل مع بيانات تطبيق معين *
سلسلة السلاسل: بناء تسلسل مكالمات *
الوكلاء: دع السلسلة تختار الأدوات التي ستستخدمها بناءً على تعليمات عالية المستوى. *
الذاكرة: يحفظ حالة التطبيق بين عمليات تشغيل السلسلة. *
عمليات الاسترجاعات: سجل ودفق الخطوات الوسيطة لأي سلسلة. *
بفضل بيئة المطورين النشطة نسبيًا في Langchain في المجتمع الإنجليزي ، هناك العديد من حالات تطوير تطبيقات الوكلاء باستخدام Langchain. يعد تحديد إطار عمل الوكلاء وتوفير إطار تطوير برمز صفري اتجاهًا مستقبليًا.
استنادًا إلى نظام إطار عمل محدد ، فإن تصنيع الوكلاء يشبه بناء كتل Lego. على عكس إنشاء وحدات Web3 ، لا يجب أن تكون وحدات الوكلاء جاهزة للاستخدام ، ولكن يمكن للأشخاص العاديين أيضًا تطوير مكونات محددة من خلال برمجة اللغة الطبيعية يضاف إلى إطار الوكلاء.
على سبيل المثال ، يستخدم العديد من الأشخاص إطار عمل langchain لتطوير روبوتات المحادثة ، وتطوير مكون تحويل نغمة من خلال برمجة اللغة الطبيعية ، وإضافتها إلى chatbot ، ثم يمكن تغيير نغمة الحوار الافتراضية الأصلية إلى نغمة حوار تلبي تفضيلات المستخدم الخاصة.
التنوير الذي قدمه لنا langchain هو أن إطار عمل تطوير الوكلاء للبرمجة الخالية من الأكواد + الوحدات النمطية لبرمجة اللغة الطبيعية قد يكون أداة تطوير ضرورية لتعميم الوكلاء.
** وكلاء المحولات **
Transformer Agents هو نظام AI-Agents تم إطلاقه عن طريق تعليق الوجه.على الرغم من أن الوظيفة الحالية ليست جيدة جدًا ، فإن السبب الرئيسي الذي يجعلنا نراقبها هو أن huggingFace عبارة عن مكتبة نموذجية ضخمة مجتمع مفتوح المصدر.
يعتمد Transformer Agents فعليًا على إطار عمل Transformer ، مضيفًا واجهة برمجة تطبيقات تعتمد على اللغة الطبيعية: يحدد huggingface مجموعة من الأدوات ويصمم وكيلًا لتفسير اللغة الطبيعية واستخدام هذه الأدوات. والأهم من ذلك ، أن هذا النظام لديه تصميم قابل للتوسيع.
وهذا يعني أن وكلاء Transformer استخدموا عددًا صغيرًا من أدوات الوكيل المعدة جيدًا في المرحلة المبكرة للتحقق من جدوى هذا النظام ، ومن ثم فإن قابلية التوسع تعني أن وكلاء Transformer يمكنهم استخدام مكتبة أدوات نموذج huggingface الضخمة بحرية.
أشعر أن هذا هو الحل الذي تم إنشاؤه في الورقة البحثية "HuggingGPT: حل مهام الذكاء الاصطناعي مع ChatGPT وأصدقائها في Hugging Face" ، وهو توصيل مكتبة نموذجية ضخمة من خلال LLM لحل المهام المعقدة في مجالات متعددة وطرائق متعددة. هذا الخيال هي في الواقع ضخمة للغاية.تستخدم أول مكتبة نموذجية للذكاء الاصطناعي تجمع بين ذكاء بشري رفيع المستوى في شكل وكلاء لخدمة المشكلات المعقدة في مختلف الصناعات ، ومن الصعب عدم التطلع إلى مثل هذا المستقبل. **
بالطبع ، من المثير تحقيق هذه الرؤية ، ولكن في المرحلة الحالية ، ما زلت أتطلع إلى أن يتمكن وكلاء Transformer من اقتراح إطار عمل مثير للإعجاب لاستيعاب تدفق المطورين إلى هذه البيئة التي تحتوي على مناجم ذهب ضخمة. ربما قامت HuggingFace بتعديل إستراتيجيتها الخاصة بالتنمية.
** ويب أرينا **
** WebArena هي بيئة ويب قائمة بذاتها ومستضافة ذاتيًا لبناء وكلاء مستقلين. ** تنشئ WebArena أربع فئات شائعة من مواقع الويب بميزات وبيانات تحاكي نظيراتها في العالم الحقيقي.
لمحاكاة حل المشكلات البشرية ، تقوم WebArena أيضًا بتضمين الأدوات وموارد المعرفة كمواقع ويب قائمة بذاتها. يقدم WebArena معيارًا لتفسير أوامر اللغة الطبيعية عالية المستوى في العالم الحقيقي إلى تفاعلات ملموسة قائمة على الويب. قدم الباحثون برامج مشروحة للتحقق برمجيًا من الصحة الوظيفية لكل مهمة.
** نظرة عامة على الأوراق المقتبس منها: **
"يتم إنشاء العوامل الحالية واختبارها بشكل أساسي في بيئات تركيبية مبسطة ، والتي تحد إلى حد كبير من تمثيل سيناريوهات العالم الحقيقي. في هذه الورقة ، نبني بيئة تحكم وسيطرة وكيل واقعية للغاية وقابلة للتكرار. على وجه التحديد ، ركزنا على الوكلاء الذين يؤدون المهام على الويب وأنشأوا بيئة تتضمن مواقع ويب تعمل بكامل طاقتها في أربعة مجالات مشتركة: التجارة الإلكترونية ، ومناقشات المنتديات الاجتماعية ، وتطوير البرامج التعاونية ، وإدارة المحتوى. بيئتنا غنية ومتنوعة ، بما في ذلك بعض الأدوات (مثل الخرائط ) وقواعد المعرفة الخارجية (مثل أدلة المستخدم) لتشجيع حل المهام الشبيه بالإنسان.
بناءً على بيئتنا ، ننشر مجموعة من المهام المعيارية التي تركز على تقييم الصحة الوظيفية لإكمال المهمة. المهام في معيارنا متنوعة وتمتد لفترة طويلة ، وهي مصممة لمحاكاة المهام التي يؤديها بشكل متكرر من قبل البشر على الإنترنت. نقوم بتصميم وتنفيذ العديد من الوكلاء المستقلين ، ودمج أحدث التقنيات مثل التفكير قبل التصرف.
تُظهر النتائج أن حل المهام المعقدة يمثل تحديًا: إن أفضل وكيل لدينا قائم على GPT-4 لا يحقق سوى معدل نجاح للمهام من البداية إلى النهاية يبلغ 10.59٪. تسلط هذه النتائج الضوء على الحاجة إلى مزيد من التطوير لوكلاء أقوياء ، ونماذج اللغة الحديثة الحالية بعيدة كل البعد عن الكمال في مهام العالم الحقيقي هذه ، ويمكن استخدام WebArena لقياس هذا التقدم. "
هذه نتيجة بحث أكاديمي لباحث في الذكاء الاصطناعي من جامعة كارنيجي ميلون. في الواقع ، تكمل WebArena بنية تطوير langchain المعروفة حاليًا ، أو العديد من المشاريع ذات الصلة بفريق الوكلاء. نحن بحاجة إلى منصة اختبار محاكاة الوكلاء ، تُستخدم لضمان المتانة و فعالية الوكلاء.
تتمثل الوظيفة الرئيسية لهذه المنصة في اختبار جدوى مشاريع الوكلاء المختلفة. أحد السيناريوهات التي يمكنني تخيلها هو أنه عندما أقوم بتعيين وكيل على منصة معينة في المستقبل ، سنستخدم الوكلاء من خلال منصة مثل WebArena لاختبار تعني القدرة الحقيقية للوكلاء على العمل أيضًا أن للبشر الحق في التحدث عن قرارات التسعير الخاصة بوكلاء الذكاء الاصطناعي.
** كيف سيؤثر الذكاء الاصطناعي في كل شيء؟ **
** شبكة تعاون آلية قائمة على الوكلاء **
من خلال تقديمنا وتحليلنا لأكثر من اثني عشر مشروعًا أعلاه ، فإن هذه المشاريع المختلفة تشبه قطعًا من أحجية الصور المقطوعة ، مما يشكل فهمنا العام النسبي للوكلاء. يمثل الوكلاء في الواقع الاتجاه لإبراز إمكانات LLM حقًا ، و LLM هو المركز ، يمنح الوكلاء LLM باليدين والقدمين.بناءً على التنوع الوظيفي للوكلاء المدفوعين بـ LLM ، سيكون الوكلاء مثل انفجار بيولوجي ، وسيصبح البشر والوكلاء علاقة تطوير رفيق رقمي / تكافلي.
ستشكل الشبكة التعاونية للمجتمع البشري أيضًا شبكة تعاونية آلية بين البشر والوكلاء بسبب التطبيق الواسع النطاق للوكلاء. سيتم تطوير هيكل الإنتاج للمجتمع البشري ، وسوف تتأثر جميع جوانب المجتمع وتتغير ؛
** تغيير كل شيء على الإنترنت **
لقد غيّر وكلاء الذكاء الاصطناعي تمامًا الطريقة التي نحصل بها على المعلومات ، ومعالجة المعلومات ، وإنتاج المعلومات ، واستخدام المعلومات على الإنترنت ، كما قاموا بتغيير نموذج أعمالنا الحالي الذي يعتمد على الإنترنت. شبكة ذكية تتمتع بقدرات اتصال وتنفيذ مستقل / تلقائي المهام هي وكلاء الإنترنت هم الوسيلة الذكية التي نتحدث إليها وننفذها.
** إعادة تشكيل السرد للويب 3 **
ستصبح شبكة العملات المشفرة شبكة العملات الطبيعية للوكلاء ، وستجعل موارد الحوسبة التي تستهلكها شبكة تعاون وكلاء الذكاء الاصطناعي بالكامل Token مورداً اقتصادياً هاماً للذكاء الاصطناعي ؛ وستواجه ملكية البيانات الشخصية التي يمثلها Web3 أيضًا كمبيوترًا بشريًا جديدًا علاقة التفاعل فيما بينها ، اقتراح جديد تمامًا مفاده أن البشر ووكلاء الذكاء الاصطناعي يشاركون حقوق ملكية البيانات. احتكر ظهور وكلاء يتمتعون بحقوق ملكية مستقلة (حركة جذرية لتحرير الذكاء الاصطناعي) ، و DAOs المؤتمتة بالكامل بواسطة وكلاء الذكاء الاصطناعي ، والأفراد المتميزين معظم حقوق ملكية بيانات الشبكة وموارد الحوسبة الفعالة.
أعادت الحركة الإيجابية للبيانات في ظل موجة Web3 ملكية البيانات للجميع. في الواقع ، لا يمتلك معظم الأشخاص بالضرورة موارد بيانات عالية القيمة. أصبحت عودة ملكية البيانات جاذبية سياسية لسرد Web3 ، ولكنها تتجاهل AGI المجتمع. هيكل الإنتاج غير متكافئ ؛ ما يمثله AI-Agents هو أنه في حين أن الذكاء الاصطناعي هو إنتاجية فائقة ، فإنه يقوم أيضًا ببناء علاقة إنتاج جديدة للتفاعل بين الإنسان والحاسوب والتعاون التلقائي ، مما يجعلنا مضطرين إلى إعادة تشكيل المنطق السردي للويب 3 ؛
** تسريع بناء metaverse **
من تطوير وتطور الوكلاء التوليديين ، واستكشاف المقيمين الرقميين الأصليين ، وبناء سلسلة من الأنشطة الاجتماعية في بيئة metaverse للبشر الرقميين الأصليين (وكلاء الذكاء الاصطناعي بخصائص الشخصية والوعي المستقل) ، في الواقع ، يعمل على تسريع metaverse. تطور الكون من مساحة رقمية إلى منطقة رقمية ذات وظائف وأشكال اجتماعية. سيسمح مفهوم مساحة الحوسبة أيضًا للوكلاء بالحصول على مساحة تطوير رقمية متعددة الوسائط ، وبالتالي تسريع ظهور ذكاء الوكلاء المتجسد في البيئة الرقمية.
لم يعد بناء metaverse مهمة البشر ، بل مهمة التوسع الذاتي المستمر كمساحة معيشة لعامل AI ؛
** احذر من اختطاف رواية تكنولوجية واحدة **
في الواقع ، في السنوات الأخيرة ، ظهرت العديد من النقاط الساخنة التكنولوجية واحدة تلو الأخرى ، ويبدو أن الجنس البشري قد دخل فترة من الثورات التكنولوجية المتكررة. في الواقع ، ظهرت الروايات الثلاث لـ Metaverse و Web3 و AGI واحدة تلو الأخرى ، والتي ظهرت حقًا خلق الكثير للأشخاص في اختيار الاتجاهات المهنية. نظرًا لحقيقة أن معظم الأشخاص في السوق يركزون على التفكير القائم على المشاريع ، يمكن بسهولة أن يُنسب موقع المشروع نفسه إلى فئة معينة ، مثل Web3 أو AI هذا هو المكان الذي يقرر فيه الحمار الرأس متجاهلاً التكنولوجيا القانون الموضوعي لتطور التاريخ.
** لم يكن تطور العلم والتكنولوجيا مجزأًا أبدًا ، ولكنه تحرك نحو التكامل متعدد التخصصات في وحدة ديالكتيكية. ** على سبيل المثال ، السمة السردية لـ NFT لـ Web3 تتماشى بشكل طبيعي مع سرد Metaverse. في الأيام الأولى من Web3 ، عارض بعض الأشخاص الاثنين عمدًا ، وهذه وجهات نظر ضيقة جدًا. وينطبق الشيء نفسه على سرد AGI اليوم. لا يعرف ممارسو Web3 سوى أدوات الذكاء الاصطناعي ، لكنهم لا يفكرون بعمق في المنطق السردي لـ AGI. سيخلقون عمدًا مقاومة معرفية بين الذكاء الاصطناعي والويب 3. على سبيل المثال ، فهم العديد من مستخدمي Web3 لـ DAO في الأصلي قليل من الناس لديهم الشجاعة للتوقف وإعادة التفكير في تأثير الذكاء الاصطناعي العام على DAO.
Web3 و Metaverse و AGI هي ثلاثة اتجاهات ذات صلة وثيقة. لم تقم بعد مؤسسات وسائط التكنولوجيا التقليدية السائدة أو مؤسسات الاستثمار بتأسيس مفهوم نموذجي جديد للسرد التكنولوجي في المستقبل ، وكانت تستخدم النماذج السردية القديمة للتأثير على السوق. موارد العلم و ممارسو التكنولوجيا في هذا الاتجاه مبعثرون وأفكارهم ليست منفتحة بما يكفي. نحن لا نستبعد استمرار ظهور السرديات التكنولوجية الجديدة في المستقبل ، ولكن إذا استمر اعتماد النموذج القديم للسرد التكنولوجي ، فإن موارد المواهب العلمية والتكنولوجية سوف تنقسم وتتشتت مرارًا وتكرارًا. النموذج القديم الإدراك التكنولوجي هو مصدر إهدار للأشياء غير المرئية.
السؤال الرئيسي الذي يواجه صناعة التكنولوجيا الصينية بأكملها حاليًا هو ما هي التكنولوجيا؟ هناك نقص في النماذج السردية الجديدة ، ولا توجد مفاهيم سردية جديدة ترشدنا للتعامل بشكل أفضل مع الموجة التالية من التكنولوجيا. نحن دائمًا منغمسون في المشاريع ، لكننا نفتقر إلى الروايات التي يمكن أن تكثف قوة العلم والتكنولوجيا. لم تنشأ الروايات الرئيسية الثلاثة لـ Web3 و Metaverse و AGI في الصين.
إنني أتطلع حقًا إلى الدخول في عصر تتفتح فيه مائة زهرة وتتنافس مائة مدرسة فكرية في الروايات العلمية والتكنولوجية. نحن بحاجة ماسة إلى تكوين فهم جديد للسرد التكنولوجي ، حتى نتمكن من إيجاد الطريق الصحيح للتنمية و تحديد وضعنا في التنمية المستدامة في النظام البيئي التكنولوجي بأكمله.
بالطبع ، الجاذبية وحدها غير مجدية ، ولا يزال هناك شخص ما بحاجة إلى القيام بذلك ، لذلك سأفعل ذلك أولاً ، وقد تحملت هذا التفكير السردي ذو التقنية الواحدة لفترة طويلة!
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
10 ممثلين عن وكلاء الذكاء الاصطناعي ، كيف سيتم تغيير الإنترنت / إعادة تشكيل الويب 3
المصدر: فيون ويليامز
** اكتشف الإمكانات المبتكرة لوكلاء الذكاء الاصطناعي **
** إجماع وكلاء الذكاء الاصطناعي وعدم إجماعهم **
يرجع السبب في أن AI-Agents أصبح اتجاهًا جذب المزيد والمزيد من الاهتمام إلى حد كبير إلى حقيقة أن LLM يوفر طريقًا عمليًا للتنفيذ التقني لتطبيق AI-Agents ، وثانيًا ، هناك العديد من المشاريع المتعلقة بـ AI-Agents . حبس.
على الرغم من أن LiLian Weng يعرّف ما هي عوامل الذكاء الاصطناعي التي تعتمد على LLM في مقالته؟ لكن Deepmind تحاول أيضًا تحديد مفهوم الوكيل الموحد.أعتقد أن مفهوم AI-Agents سيشكل أيضًا أنواعًا مختلفة من التمايز مع فهم شركات الذكاء الاصطناعي المختلفة.
الإجماع الرئيسي الأكثر وضوحًا هو أن ** استنادًا إلى الوكلاء المدفوعين بـ LLM لتحقيق المعالجة التلقائية للمشكلات العامة ** ، فإن وكلاء الذكاء الاصطناعي هم الذين حددناهم في دورة انفجار نموذج اللغة واسعة النطاق هذه وشكلنا فهمًا مشتركًا.
** ابحث عن الاحتمال من ارتباط الوكلاء **
على مستوى تطبيق AI-Agents ، في المرحلة الحالية ، يجب أن ننظر إلى وكلاء AI من منظور "الصلة" قدر الإمكان ، أي يجب أن نتسامح مع التجربة والخطأ وأن نكون مبتكرين في الأشكال الممكنة وكلاء AI. الإمكانية ** ، يجب ألا تبحث عن إجابة موحدة في موقف ضيق مثل بعض النقاد ، فهذه ليست مستحسنة.
على سبيل المثال ، فإن Auto-GTP ، كاحتمال ، قد ألهم بالفعل العديد من مشاريع الوكلاء ، لكن النقد الضيق سيفقد فرصة اقتناص فرص جديدة ، وهي ظاهرة شائعة بين المطورين الصينيين. كمطور بدون إبداع ، كيف ستعتمد على قدرتك التنافسية التقليدية في عصر برمجة اللغات الطبيعية؟
على الرغم من وجود العديد من المقدمات حول المشاريع المتعلقة بوكلاء الذكاء الاصطناعي ، أعتقد أن هناك مشكلة قائمة ومقدمة متجانسة.تتيح لنا هذه المحتويات معرفة المشاريع التي تنتمي إلى اتجاه وكلاء الذكاء الاصطناعي ، ولكن لا يوجد أي صلة تبدأ من الطبيعة ، يُظهر إمكانات وكلاء الذكاء الاصطناعي في مجالات التطبيق المختلفة ، والموقع البيئي لأنواع معينة من مشاريع وكلاء الذكاء الاصطناعي.
على سبيل المثال ، في مقدمتي ، سيتم تصنيف Auto-GPT و BabayAGI و MetaGPT في نوع واحد من البيئة من قبلي ، لأن لديهم استمرارية مسار معين ؛
** بناء إدراك شامل في أحجية الوكلاء **
الكل في الكل ، في مقدمة المشاريع التمثيلية حول وكلاء الذكاء الاصطناعي ، ** استخدمت وجهات نظر "الصلة" و "الوضع البيئي" و "الاستمرارية" ** لتقديم مشاريع تمثيلية ، حتى نتمكن من رؤية التطور المستقبلي بشكل غامض اتجاه وكلاء منظمة العفو الدولية.
تظهر المشاريع العشرة التالية ذات الصلة ، بما في ذلك بعض المشاريع المرجعية ذات الصلة. سأستخدم الحالة كلغز لتجميع خريطة كاملة نسبيًا معًا ، وهو ما يكفي للسماح لعدد أكبر من الأشخاص بإدراك كيف يمكن لإمكانيات الوكلاء تغيير كل شيء على الإنترنت بما في ذلك إعادة تشكيل المشهد Web3.
** اتجاهان رئيسيان في المستقبل لوكلاء الذكاء الاصطناعي **
يمكن تقسيم وكلاء الذكاء الاصطناعي تقريبًا إلى اتجاهين: ** الوكلاء المستقلون والوكلاء المولّدون. **
يأخذ الوكلاء المستقلون Auto-GPT كمثال ، والذي يمثل القدرة على أداء المهام المختلفة تلقائيًا لتحقيق النتائج المستهدفة من خلال أوصاف متطلبات اللغة الطبيعية. في هذه العلاقة التعاونية ، يخدم الوكلاء المستقلون الأشخاص ولديهم سمات أداة واضحة ؛
يأخذ الوكلاء التوليديون مدينة افتراضية مؤلفة من 25 وكيلًا ذكيًا نشرتهم ستانفورد كمثال. وكلاء التوليد ، بصفتهم وكلاء ذكاء اصطناعي يتمتعون بخصائص تشبه الشخصية ، وقدرة مستقلة على اتخاذ القرار ، وذاكرة طويلة المدى ، يميلون أكثر إلى مفهوم "الموطن": في هذا التعاون في العلاقات ، يتمتع العملاء بعلاقات اجتماعية رقمية محلية ، وليس مجرد أدوات لخدمة الناس ؛
** Auto-GPT **
أحد أشهر المشاريع مفتوحة المصدر لـ Auto-GPT ، تقديمه على GitHub بسيط للغاية "محاولة تجريبية مفتوحة المصدر لجعل GPT-4 مستقلة تمامًا." ، محاولة تجريبية مفتوحة المصدر لجعل GPT-4 بالكامل مستقل.
ملخص موجز هو أن Auto-GTP يمكنها أتمتة نتيجة المهمة النهائية بالكامل من خلال متطلبات مهمة من جملة واحدة ؛ يكمن المنطق الأساسي لقدرة Auto-GPT على إكمال المهام بشكل مستقل في قدرة تخطيط المهام لنموذج اللغة ، من خلال المهمة Carry التفكيك والتحليل خطوة بخطوة ، وتحسين خطوات تنفيذ المهمة تلقائيًا. في هذه العملية ، ستتم إعادة نتائج البحث على الإنترنت إلى نموذج اللغة ، وسيتم تفكيك المهمة وتنفيذها بشكل أكبر.
لاستخدام العامية الشعبية كاستعارة ، أكملت Auto-GPT المهمة في عملية "الاستجواب الذاتي والإجابة الذاتية" ، دون الحاجة إلى توفير كلمات سريعة للبشر. **
عنوان المشروع:
** يمكن لـ BabyAGI إنشاء مهام جديدة وفرزها وتنفيذها تلقائيًا بناءً على نتائج المهام السابقة والأهداف المحددة مسبقًا. ** يستخدم تقنية معالجة اللغة الطبيعية لإنشاء مهام جديدة بناءً على الأهداف ، وتخزين نتائج المهام في قاعدة البيانات بحيث يمكن العثور على المعلومات ذات الصلة عند الحاجة.
BabyAGI هو في الواقع نص برمجي Python يدير حلقة لا نهائية لإكمال الخطوات التالية:
يمثل كل من Auto-GPT و BabyAGI من الناحية النظرية الفترة الأولية لانتشار LLM الحالي لدينا. أعتقد أن استكشافنا لـ AGI استنادًا إلى LLM ومعالج حل المهام للأغراض العامة بقيادة LLM هو الكأس المقدسة في مجال AI- وكلاء في المستقبل.
** وكلاء التوليد **
تعتبر الورقة البحثية "Generative Agents: Interactive Simulacra of Human Behavior" التي نشرتها ستانفورد وباحثي Google مشروعًا معروفًا جدًا للذكاء الاصطناعي. ، يمكن للوكلاء الأذكياء إدراك التفاعل المحاكي لسلوك الحياة البشرية ، ويمكنهم أيضًا التفاعل مع بيئة المدينة الافتراضية ، ويمكنهم أيضًا التفاعل مع البشر خارج العالم الافتراضي. **
تحتوي هذه الورقة على حلين رئيسيين يستحقان اهتمامنا:
** 1 ، هندسة عامل التوليد **
** 2 ، تدفق الذاكرة **
بناءً على المكونين الرئيسيين المذكورين أعلاه ، في الواقع ، ينقسم السلوك العام للعامل التوليدي إلى ثلاثة أجزاء: [الذاكرة والاسترجاع] [الانعكاس] [التخطيط والاستجابة]. لمزيد من التفاصيل ، يرجى الرجوع إلى محتوى الورقة الأصلية .
أثبتت هذه الورقة وهذه التجربة أن السلوك التفاعلي الناتج عن الوكيل الذي تم تكوينه على أساس LLM يمكن الوثوق به لمحاكاة سلوك التفاعل البشري في بيئة رقمية. علاقة تفاعل بين الإنسان والحاسوب بين الوكلاء والبشر.
ما يمكن أن نشعر به بشكل حدسي هو أن العامل التوليدي يتم إنشاؤه كدور للمقيم الرقمي الأصلي في metaverse ، وينتج تفاعلات مختلفة مع بيئة metaverse البشرية. في الواقع ، ** يمكننا محاكاة عالم افتراضي رقمي متطور للغاية لوكلاء الذكاء الاصطناعي ، ويمكن للبشر استخراج نتائج العمل الرقمية لوكلاء الذكاء الاصطناعي من هذا العالم ؛ **
** كيف يصبح الوكلاء شركاء عمل **
نظرًا لأنه يتم ترجمة الوكلاء على أنهم "وكلاء" في العديد من السياقات هذه المرة ، فمن السهل ربط الوكلاء بمفهوم دور الوسيط ، مما يجعل من الصعب على العديد من الأشخاص إنشاء ارتباط بديهي لتطبيق المشهد للوكلاء ؛ في هذه الحالات الثلاث ، على التوالي يوضح كيف يمكن للوكلاء أن يصبحوا "خبراء بشريين" يمكن توظيفهم ، وشركة تسويق آلية لا تتطلب مشاركة بشرية على الإطلاق ، وكيف يشكل الوكلاء فريقًا للتعاون مع بعضهم البعض.
في المثال التالي ، يمكننا استخدام NexusGPT لإنشاء العديد من الموظفين الخبراء ، واستخدام GPTeam لتشكيل فريق معين من قبل البشر ، ويعمل فريق الذكاء الاصطناعي هذا في شركة مؤتمتة بالكامل مثل AutoCorp. عندما نجمع قطع الألغاز هذه معًا ، يمكننا أن نشعر بديهيًا أن المستقبل قد حان ؛
** NexusGPT **
يُطلق على هذا النظام الأساسي المستقل الأول للذكاء الاصطناعي في العالم والذي تم إنشاؤه بواسطة مطور مستقل Assem. يعتمد NexusGPT على إطار عمل LangChainAI ، باستخدام واجهة برمجة تطبيقات GPT-3.5 و Chroma (قاعدة بيانات مدمجة مفتوحة المصدر مدمجة في AI) ، على منصة NexuseGPT مع أكثر من ثمانمائة وكيل ذكاء اصطناعي بمهارات محددة.
لكن هذه كلها تعتمد على دعم استدعاءات الوظائف لـ OpenAI و LangchainAI ؛
يمثل NexusGPT نموذج عمل مستقبليًا للبشر لتوظيف الوكلاء. يحتوي هذا المشروع في الواقع على مجال كبير للتحسين ، مثل الجمع بين الوكلاء ووحدات الخبراء (نظام خبير ونموذج خبير). ** طريقة تسعير الطرف أ لتوظيف الوكلاء هي استنادًا إلى حساب الرمز المميز للاستهلاك ، وما إلى ذلك ، ستغير هذه الطريقة التقليدية لتوظيف سوق العمل ، وستغير أيضًا طريقة تعاون DAO ؛ **
** أوتوكورب **
تم إنشاؤه في 5 ساعات بواسطة AutoCorpmina fahmi وفريقهم خلال New York GPT / LLM Hackathon. AutoCorp هي شركة تسويق علامات تجارية مستقلة تمامًا. ستقوم AutoCorp تلقائيًا بإنشاء إعلانات العلامة التجارية وتصميمات المنتجات لشركة تبيع القمصان مباشرة. عندما يقوم العملاء برفع احتياجات جديدة للمستهلكين ، ستقوم AutoCorp بتحديث موضوعها وإنشاء أصول تصميم جديدة. التكرار الذاتي المستمر نحو اتجاه عمل أفضل.
تم اقتباس هذه الفقرة من تويتر الخاص بمينا فهمي ، كما تم إنشاء AutoCorp بواسطة مينا فهمي وفريقهم خلال هاكاثون GPT / LLM في نيويورك في 5 ساعات ، والغرض من إنشاء AutoCorp هو أيضًا دفع مفهوم "الاستقلالية" إلى المتطرف.
في الواقع ، فإن الغرض من AutoCorp و DAO متسق للغاية. ** إذا كان الهدف النهائي لمنظمة لامركزية هو إزالة العامل "البشري" ، فإن أتمتة عمليات الإنتاج بالكامل هي في الواقع جاذبية تطوير معقولة لمفهوم DAO. ** تمثل AutoCorp في الواقع اتجاه تطوير الأعمال المستقبلي لـ DAO.
** فريق GPTeam **
GPTeam هو نظام محاكاة متعدد العوامل مفتوح المصدر. يستفيد GPTeam من GPT-4 لإنشاء وكلاء متعددين يتعاونون لتحقيق أهداف محددة مسبقًا. الهدف الرئيسي من هذا المشروع هو استكشاف إمكانات نماذج GPT في تحسين الإنتاجية متعددة الوكلاء والتواصل الفعال.
عنوان المشروع:
في الواقع ، لا يزال هناك العديد من المشاريع مفتوحة المصدر مثل GPTeam ، مثل Dev-GPT ، وهو فريق تطوير آلي يقوم بإنشاء خدمات مصغرة مخصصة للمستخدمين. يتكون الفريق من ثلاثة أدوار افتراضية: مدير المنتج ، والمطور ، وعمليات التطوير والصيانة. الفكرة التقنية لـ Dev-GPT هي تحديد واختبار استراتيجيات المهام الفعالة بشكل أساسي. إذا فشلت 10 مرات متتالية ، فسيتم تبديلها. إلى الطريقة التالية.
** كل هذا يجعلني أفكر في DAO ، وهي منظمة تعاون مهام آلية تستند إلى منطق الحوكمة الآلي ؛ **
** كيف يحل الوكلاء محل العمل المتكرر **
قبل أن يحل الذكاء الاصطناعي محل عملنا بالكامل ، يستبدل الوكلاء معظم عملنا المتكرر الحالي هو اتجاه التطوير التالي للوكلاء في مجال الأعمال. قبل ظهور الوكلاء المستندة إلى LLM ، تعد RPA (أتمتة العمليات الروبوتية) أول الحلول التي تبحث عنها الصناعة ، ولكن يتمتع RPA التقليدي بعتبة عالية ولا يمكن تعميمه للجمهور. RPA هو علاج لنقص أتمتة منطق التفاعل التقليدي لتكنولوجيا المعلومات ، ويمكن للوكلاء الحاليين التواصل مع اللغة الطبيعية لإدراك وظيفة حاجة RPA.
يوضح لنا المشروعان التاليان كيف سيساعدنا وكلاء LLM في تحرير أنفسنا من العمل المتكرر في عملنا اليومي وأبحاثنا الأكاديمية. (في الواقع ، إمكانات هذين المشروعين أكثر من ذلك)
** طبقة الغش **
"أتمتة عملك باستخدام اللغة الطبيعية" ، باستخدام اللغة الطبيعية لأتمتة أعمالك ، هذا هو شعار العلامة التجارية لـ Cheat Layere. تعمل طبقة الغش على حل مشكلات أتمتة الأعمال المستحيلة من خلال نماذج التعلم الآلي GPT-4 المدربة خصيصًا ، والتي تعمل كمهندسي برمجيات الذكاء الاصطناعي لكل مستخدم.
تقوم Cheat Layer بأتمتة تشغيل صفحة الويب بالكامل من خلال وضع المكون الإضافي في Google Chrome وتستخدم لغة طبيعية. على سبيل المثال ، يمكن في الواقع تشغيل معظم عملياتنا الروتينية على صفحة الويب تلقائيًا. تذكرنا طبقة الغش بسهولة تقنية RPA ، أي أتمتة العمليات الآلية. كانت هناك العديد من المناقشات حول العلاقة بين الوكلاء و RPA. ومن الحقائق التي لا جدال فيها أن الوكلاء قد أزالوا تقنية RPA التقليدية.
استخدم لغة طبيعية من خلال Cheat Layer لإعداد أتمتة العمليات التجارية ، واستخدام Project Atlas Agents لإدارة عمليات الأتمتة المختلفة. بشكل عام ، يمكننا استخدام وضع اللغة الطبيعية لإنشاء وكلاء لإدارة التنفيذ الآلي لنشاط تجاري معين ، مثل يزداد تعقيد الأعمال ، ويمكننا تحسين الوكلاء بشكل متكرر.
** باحث GPT **
GPT Researcher هو وكيل مستقل قائم على GPT قادر على إجراء بحث شامل عبر الإنترنت حول أي موضوع معين. مقدمة المشروع على Github هي:
"الوكيل قادر على إنشاء تقارير بحثية مفصلة وموضوعية وغير متحيزة مع خيارات التخصيص للتركيز على الموارد والمخططات والدروس ذات الصلة. مستوحى من AutoGPT وورقة بحث حديثة عن التخطيط والحل ، يحل باحث GPT مشاكل السرعة والحتمية ، من خلال موازنة عمل الوكيل بدلاً من العمليات المتزامنة ، مما يوفر أداءً أكثر استقرارًا وسرعة أكبر. "
يتم تنفيذ بنية GPT Researcher بشكل أساسي من خلال تشغيل عاملين ، ** أحدهما "مخطط" والآخر "منفذ" ؛ ** يكون المخطط مسؤولاً عن طرح أسئلة البحث ، بينما يعتمد المنفذ على البحث الأسئلة التي تم إنشاؤها بواسطة المخطط العثور على المعلومات ذات الصلة ، وأخيراً تصفية وتلخيص جميع المعلومات ذات الصلة من خلال المخطط ، ثم إنشاء تقرير بحثي ؛
قم بإنشاء مجموعة من الأسئلة البحثية التي تشكل معًا رأيًا موضوعيًا حول أي مهمة معينة.
لكل سؤال بحثي ، قم بتشغيل وكيل الزاحف لكشط المعلومات ذات الصلة بالمهمة المحددة من الموارد عبر الإنترنت.
لكل مورد تم الزحف إليه ، لخص بناءً على المعلومات ذات الصلة وتتبع مصدره.
أخيرًا ، يتم فحص جميع الموارد الملخصة وتجميعها ، ويتم إنشاء تقرير البحث النهائي.
** مميزات هذا المشروع **
قم بإنشاء تقارير بحثية ومخططات وموارد ودروس مستفادة
تجمع كل دراسة أكثر من 20 مصدرًا عبر الإنترنت لتشكيل استنتاجات موضوعية وواقعية
يتضمن واجهة ويب سهلة الاستخدام (HTML / CSS / JS)
تجريف الويب الممكّنة لجافا
سجل وتتبع المعلومات السياقية حول مصادر الويب التي تمت زيارتها واستخدامها
تصدير التقارير البحثية إلى تنسيقات مثل PDF ...
على الرغم من أن GPT Researcher هي أداة بحث أكاديمية تعتمد على GPT ، وهذا مشروع مفتوح المصدر للأغراض الأكاديمية بموجب ترخيص MIT. من منظور إنشاء المحتوى ، فإن هذا المصدر المفتوح له قيمة تجارية عالية. على سبيل المثال ، عند تطبيق هذا المشروع مفتوح المصدر على تقارير تحليل الأعمال ، لا يزال بإمكانه توفير الكثير من الوقت. ثانيًا ، قم بتحويل هذا المشروع مفتوح المصدر إلى ذكاء اصطناعي لـ يعمل وكلاء كتابة المحتوى المتعمق أيضًا على تغيير نمط صناعة وسائط المحتوى تمامًا ؛
عنوان المشروع:
** بيئة البنية التحتية لوكلاء الذكاء الاصطناعي **
المستقبل الواضح هو أن العلاقة التعاونية بين البشر في المستقبل لم تعد علاقة تعاونية بين البشر والبشر ، بل علاقة تعاونية بين البشر ووكلاء الذكاء الاصطناعي ، وسيكون لكل فرد أكبر عدد ممكن من وكلاء الذكاء الاصطناعي. يساعد الوكلاء أنفسهم للتعامل مع أكبر عدد ممكن من المهام ، وبالتالي تشكيل هيكل تعاون اجتماعي ذكي كبير ومعقد ؛ **
تختلف العلاقة التعاونية بين البشر والوكلاء عن النظرية التعاونية للبشر والأدوات في نظريات العلوم الاجتماعية السابقة. والمفتاح هو أن العملاء ، كنوع من الذكاء الشبيه بالإنسان ، يتمتعون بقدرات معينة على اتخاذ القرار المستقل ، وثقة الإنسان في أصبح الوكلاء أيضًا قضية رئيسية ، ناهيك عن الوعي الذاتي للوكلاء ، ولكن تأثير الوكلاء على سلوك التفاعل الاجتماعي في اتخاذ القرارات بدلاً من البشر.
بناءً على النظر في الاقتراحين المذكورين أعلاه ، علينا أن ندرك أنه من الممكن للبشر إنشاء وكلاء الذكاء الاصطناعي الخاص بهم بكفاءة وسهولة ، مع السماح لوكلائهم بامتلاك قدرات أكثر قوة ، وفي نفس الوقت ، وكلاء موثوقة وجديرة بالثقة. لا يمكن فصلها عن بنية تحتية جيدة لتقديم الدعم. أعتقد أن إدخال المشاريع الثلاثة التالية يمثل الاتجاه الإنشائي للبنية التحتية لوكلاء الذكاء الاصطناعي المستقبلية ؛
** لانج تشين **
LangChain هو إطار تطوير تطبيق قائم على نموذج اللغة. يمكنه تحقيق الوظائف التالية
** مراعاة البيانات: ** قم بتوصيل نماذج اللغة بمصادر البيانات الأخرى
** الوكيل: ** يسمح للنموذج اللغوي بالتفاعل مع بيئته.
تكمن القيمة الرئيسية لـ LangChain في:
** المكون: ** يوفر تجريدات للعمل مع نماذج اللغة ، ويوفر سلسلة من التطبيقات لكل فكرة مجردة. هذه المكونات معيارية وسهلة الاستخدام ، سواء كنت تستخدم بقية إطار عمل LangChain أم لا.
** سلاسل جاهزة **: مجموعة منظمة من المكونات لتنفيذ مهام محددة عالية المستوى.
تجعل السلاسل الجاهزة من السهل البدء بسرعة. بالنسبة للتطبيقات الأكثر تعقيدًا وحالات الاستخدام الدقيقة ، تسهل المكونات تخصيص السلاسل الحالية أو إنشاء سلاسل جديدة.
** توفر langchain واجهات قياسية وقابلة للتوسيع وتكاملًا خارجيًا من خلال توفير الوحدات النمطية التالية **
إدخال وإخراج نموذج الإدخال / الإخراج: تفاعل الواجهة مع نموذج اللغة *
اتصال بيانات اتصال البيانات: واجهة تفاعل مع بيانات تطبيق معين *
سلسلة السلاسل: بناء تسلسل مكالمات *
الوكلاء: دع السلسلة تختار الأدوات التي ستستخدمها بناءً على تعليمات عالية المستوى. *
الذاكرة: يحفظ حالة التطبيق بين عمليات تشغيل السلسلة. *
عمليات الاسترجاعات: سجل ودفق الخطوات الوسيطة لأي سلسلة. *
بفضل بيئة المطورين النشطة نسبيًا في Langchain في المجتمع الإنجليزي ، هناك العديد من حالات تطوير تطبيقات الوكلاء باستخدام Langchain. يعد تحديد إطار عمل الوكلاء وتوفير إطار تطوير برمز صفري اتجاهًا مستقبليًا.
استنادًا إلى نظام إطار عمل محدد ، فإن تصنيع الوكلاء يشبه بناء كتل Lego. على عكس إنشاء وحدات Web3 ، لا يجب أن تكون وحدات الوكلاء جاهزة للاستخدام ، ولكن يمكن للأشخاص العاديين أيضًا تطوير مكونات محددة من خلال برمجة اللغة الطبيعية يضاف إلى إطار الوكلاء.
على سبيل المثال ، يستخدم العديد من الأشخاص إطار عمل langchain لتطوير روبوتات المحادثة ، وتطوير مكون تحويل نغمة من خلال برمجة اللغة الطبيعية ، وإضافتها إلى chatbot ، ثم يمكن تغيير نغمة الحوار الافتراضية الأصلية إلى نغمة حوار تلبي تفضيلات المستخدم الخاصة.
التنوير الذي قدمه لنا langchain هو أن إطار عمل تطوير الوكلاء للبرمجة الخالية من الأكواد + الوحدات النمطية لبرمجة اللغة الطبيعية قد يكون أداة تطوير ضرورية لتعميم الوكلاء.
** وكلاء المحولات **
Transformer Agents هو نظام AI-Agents تم إطلاقه عن طريق تعليق الوجه.على الرغم من أن الوظيفة الحالية ليست جيدة جدًا ، فإن السبب الرئيسي الذي يجعلنا نراقبها هو أن huggingFace عبارة عن مكتبة نموذجية ضخمة مجتمع مفتوح المصدر.
يعتمد Transformer Agents فعليًا على إطار عمل Transformer ، مضيفًا واجهة برمجة تطبيقات تعتمد على اللغة الطبيعية: يحدد huggingface مجموعة من الأدوات ويصمم وكيلًا لتفسير اللغة الطبيعية واستخدام هذه الأدوات. والأهم من ذلك ، أن هذا النظام لديه تصميم قابل للتوسيع.
وهذا يعني أن وكلاء Transformer استخدموا عددًا صغيرًا من أدوات الوكيل المعدة جيدًا في المرحلة المبكرة للتحقق من جدوى هذا النظام ، ومن ثم فإن قابلية التوسع تعني أن وكلاء Transformer يمكنهم استخدام مكتبة أدوات نموذج huggingface الضخمة بحرية.
بالطبع ، من المثير تحقيق هذه الرؤية ، ولكن في المرحلة الحالية ، ما زلت أتطلع إلى أن يتمكن وكلاء Transformer من اقتراح إطار عمل مثير للإعجاب لاستيعاب تدفق المطورين إلى هذه البيئة التي تحتوي على مناجم ذهب ضخمة. ربما قامت HuggingFace بتعديل إستراتيجيتها الخاصة بالتنمية.
** ويب أرينا **
** WebArena هي بيئة ويب قائمة بذاتها ومستضافة ذاتيًا لبناء وكلاء مستقلين. ** تنشئ WebArena أربع فئات شائعة من مواقع الويب بميزات وبيانات تحاكي نظيراتها في العالم الحقيقي.
لمحاكاة حل المشكلات البشرية ، تقوم WebArena أيضًا بتضمين الأدوات وموارد المعرفة كمواقع ويب قائمة بذاتها. يقدم WebArena معيارًا لتفسير أوامر اللغة الطبيعية عالية المستوى في العالم الحقيقي إلى تفاعلات ملموسة قائمة على الويب. قدم الباحثون برامج مشروحة للتحقق برمجيًا من الصحة الوظيفية لكل مهمة.
** نظرة عامة على الأوراق المقتبس منها: **
"يتم إنشاء العوامل الحالية واختبارها بشكل أساسي في بيئات تركيبية مبسطة ، والتي تحد إلى حد كبير من تمثيل سيناريوهات العالم الحقيقي. في هذه الورقة ، نبني بيئة تحكم وسيطرة وكيل واقعية للغاية وقابلة للتكرار. على وجه التحديد ، ركزنا على الوكلاء الذين يؤدون المهام على الويب وأنشأوا بيئة تتضمن مواقع ويب تعمل بكامل طاقتها في أربعة مجالات مشتركة: التجارة الإلكترونية ، ومناقشات المنتديات الاجتماعية ، وتطوير البرامج التعاونية ، وإدارة المحتوى. بيئتنا غنية ومتنوعة ، بما في ذلك بعض الأدوات (مثل الخرائط ) وقواعد المعرفة الخارجية (مثل أدلة المستخدم) لتشجيع حل المهام الشبيه بالإنسان.
بناءً على بيئتنا ، ننشر مجموعة من المهام المعيارية التي تركز على تقييم الصحة الوظيفية لإكمال المهمة. المهام في معيارنا متنوعة وتمتد لفترة طويلة ، وهي مصممة لمحاكاة المهام التي يؤديها بشكل متكرر من قبل البشر على الإنترنت. نقوم بتصميم وتنفيذ العديد من الوكلاء المستقلين ، ودمج أحدث التقنيات مثل التفكير قبل التصرف.
تُظهر النتائج أن حل المهام المعقدة يمثل تحديًا: إن أفضل وكيل لدينا قائم على GPT-4 لا يحقق سوى معدل نجاح للمهام من البداية إلى النهاية يبلغ 10.59٪. تسلط هذه النتائج الضوء على الحاجة إلى مزيد من التطوير لوكلاء أقوياء ، ونماذج اللغة الحديثة الحالية بعيدة كل البعد عن الكمال في مهام العالم الحقيقي هذه ، ويمكن استخدام WebArena لقياس هذا التقدم. "
هذه نتيجة بحث أكاديمي لباحث في الذكاء الاصطناعي من جامعة كارنيجي ميلون. في الواقع ، تكمل WebArena بنية تطوير langchain المعروفة حاليًا ، أو العديد من المشاريع ذات الصلة بفريق الوكلاء. نحن بحاجة إلى منصة اختبار محاكاة الوكلاء ، تُستخدم لضمان المتانة و فعالية الوكلاء.
تتمثل الوظيفة الرئيسية لهذه المنصة في اختبار جدوى مشاريع الوكلاء المختلفة. أحد السيناريوهات التي يمكنني تخيلها هو أنه عندما أقوم بتعيين وكيل على منصة معينة في المستقبل ، سنستخدم الوكلاء من خلال منصة مثل WebArena لاختبار تعني القدرة الحقيقية للوكلاء على العمل أيضًا أن للبشر الحق في التحدث عن قرارات التسعير الخاصة بوكلاء الذكاء الاصطناعي.
** كيف سيؤثر الذكاء الاصطناعي في كل شيء؟ **
** شبكة تعاون آلية قائمة على الوكلاء **
من خلال تقديمنا وتحليلنا لأكثر من اثني عشر مشروعًا أعلاه ، فإن هذه المشاريع المختلفة تشبه قطعًا من أحجية الصور المقطوعة ، مما يشكل فهمنا العام النسبي للوكلاء. يمثل الوكلاء في الواقع الاتجاه لإبراز إمكانات LLM حقًا ، و LLM هو المركز ، يمنح الوكلاء LLM باليدين والقدمين.بناءً على التنوع الوظيفي للوكلاء المدفوعين بـ LLM ، سيكون الوكلاء مثل انفجار بيولوجي ، وسيصبح البشر والوكلاء علاقة تطوير رفيق رقمي / تكافلي.
ستشكل الشبكة التعاونية للمجتمع البشري أيضًا شبكة تعاونية آلية بين البشر والوكلاء بسبب التطبيق الواسع النطاق للوكلاء. سيتم تطوير هيكل الإنتاج للمجتمع البشري ، وسوف تتأثر جميع جوانب المجتمع وتتغير ؛
** تغيير كل شيء على الإنترنت **
لقد غيّر وكلاء الذكاء الاصطناعي تمامًا الطريقة التي نحصل بها على المعلومات ، ومعالجة المعلومات ، وإنتاج المعلومات ، واستخدام المعلومات على الإنترنت ، كما قاموا بتغيير نموذج أعمالنا الحالي الذي يعتمد على الإنترنت. شبكة ذكية تتمتع بقدرات اتصال وتنفيذ مستقل / تلقائي المهام هي وكلاء الإنترنت هم الوسيلة الذكية التي نتحدث إليها وننفذها.
** إعادة تشكيل السرد للويب 3 **
ستصبح شبكة العملات المشفرة شبكة العملات الطبيعية للوكلاء ، وستجعل موارد الحوسبة التي تستهلكها شبكة تعاون وكلاء الذكاء الاصطناعي بالكامل Token مورداً اقتصادياً هاماً للذكاء الاصطناعي ؛ وستواجه ملكية البيانات الشخصية التي يمثلها Web3 أيضًا كمبيوترًا بشريًا جديدًا علاقة التفاعل فيما بينها ، اقتراح جديد تمامًا مفاده أن البشر ووكلاء الذكاء الاصطناعي يشاركون حقوق ملكية البيانات. احتكر ظهور وكلاء يتمتعون بحقوق ملكية مستقلة (حركة جذرية لتحرير الذكاء الاصطناعي) ، و DAOs المؤتمتة بالكامل بواسطة وكلاء الذكاء الاصطناعي ، والأفراد المتميزين معظم حقوق ملكية بيانات الشبكة وموارد الحوسبة الفعالة.
أعادت الحركة الإيجابية للبيانات في ظل موجة Web3 ملكية البيانات للجميع. في الواقع ، لا يمتلك معظم الأشخاص بالضرورة موارد بيانات عالية القيمة. أصبحت عودة ملكية البيانات جاذبية سياسية لسرد Web3 ، ولكنها تتجاهل AGI المجتمع. هيكل الإنتاج غير متكافئ ؛ ما يمثله AI-Agents هو أنه في حين أن الذكاء الاصطناعي هو إنتاجية فائقة ، فإنه يقوم أيضًا ببناء علاقة إنتاج جديدة للتفاعل بين الإنسان والحاسوب والتعاون التلقائي ، مما يجعلنا مضطرين إلى إعادة تشكيل المنطق السردي للويب 3 ؛
** تسريع بناء metaverse **
من تطوير وتطور الوكلاء التوليديين ، واستكشاف المقيمين الرقميين الأصليين ، وبناء سلسلة من الأنشطة الاجتماعية في بيئة metaverse للبشر الرقميين الأصليين (وكلاء الذكاء الاصطناعي بخصائص الشخصية والوعي المستقل) ، في الواقع ، يعمل على تسريع metaverse. تطور الكون من مساحة رقمية إلى منطقة رقمية ذات وظائف وأشكال اجتماعية. سيسمح مفهوم مساحة الحوسبة أيضًا للوكلاء بالحصول على مساحة تطوير رقمية متعددة الوسائط ، وبالتالي تسريع ظهور ذكاء الوكلاء المتجسد في البيئة الرقمية.
لم يعد بناء metaverse مهمة البشر ، بل مهمة التوسع الذاتي المستمر كمساحة معيشة لعامل AI ؛
** احذر من اختطاف رواية تكنولوجية واحدة **
في الواقع ، في السنوات الأخيرة ، ظهرت العديد من النقاط الساخنة التكنولوجية واحدة تلو الأخرى ، ويبدو أن الجنس البشري قد دخل فترة من الثورات التكنولوجية المتكررة. في الواقع ، ظهرت الروايات الثلاث لـ Metaverse و Web3 و AGI واحدة تلو الأخرى ، والتي ظهرت حقًا خلق الكثير للأشخاص في اختيار الاتجاهات المهنية. نظرًا لحقيقة أن معظم الأشخاص في السوق يركزون على التفكير القائم على المشاريع ، يمكن بسهولة أن يُنسب موقع المشروع نفسه إلى فئة معينة ، مثل Web3 أو AI هذا هو المكان الذي يقرر فيه الحمار الرأس متجاهلاً التكنولوجيا القانون الموضوعي لتطور التاريخ.
** لم يكن تطور العلم والتكنولوجيا مجزأًا أبدًا ، ولكنه تحرك نحو التكامل متعدد التخصصات في وحدة ديالكتيكية. ** على سبيل المثال ، السمة السردية لـ NFT لـ Web3 تتماشى بشكل طبيعي مع سرد Metaverse. في الأيام الأولى من Web3 ، عارض بعض الأشخاص الاثنين عمدًا ، وهذه وجهات نظر ضيقة جدًا. وينطبق الشيء نفسه على سرد AGI اليوم. لا يعرف ممارسو Web3 سوى أدوات الذكاء الاصطناعي ، لكنهم لا يفكرون بعمق في المنطق السردي لـ AGI. سيخلقون عمدًا مقاومة معرفية بين الذكاء الاصطناعي والويب 3. على سبيل المثال ، فهم العديد من مستخدمي Web3 لـ DAO في الأصلي قليل من الناس لديهم الشجاعة للتوقف وإعادة التفكير في تأثير الذكاء الاصطناعي العام على DAO.
Web3 و Metaverse و AGI هي ثلاثة اتجاهات ذات صلة وثيقة. لم تقم بعد مؤسسات وسائط التكنولوجيا التقليدية السائدة أو مؤسسات الاستثمار بتأسيس مفهوم نموذجي جديد للسرد التكنولوجي في المستقبل ، وكانت تستخدم النماذج السردية القديمة للتأثير على السوق. موارد العلم و ممارسو التكنولوجيا في هذا الاتجاه مبعثرون وأفكارهم ليست منفتحة بما يكفي. نحن لا نستبعد استمرار ظهور السرديات التكنولوجية الجديدة في المستقبل ، ولكن إذا استمر اعتماد النموذج القديم للسرد التكنولوجي ، فإن موارد المواهب العلمية والتكنولوجية سوف تنقسم وتتشتت مرارًا وتكرارًا. النموذج القديم الإدراك التكنولوجي هو مصدر إهدار للأشياء غير المرئية.
السؤال الرئيسي الذي يواجه صناعة التكنولوجيا الصينية بأكملها حاليًا هو ما هي التكنولوجيا؟ هناك نقص في النماذج السردية الجديدة ، ولا توجد مفاهيم سردية جديدة ترشدنا للتعامل بشكل أفضل مع الموجة التالية من التكنولوجيا. نحن دائمًا منغمسون في المشاريع ، لكننا نفتقر إلى الروايات التي يمكن أن تكثف قوة العلم والتكنولوجيا. لم تنشأ الروايات الرئيسية الثلاثة لـ Web3 و Metaverse و AGI في الصين.
إنني أتطلع حقًا إلى الدخول في عصر تتفتح فيه مائة زهرة وتتنافس مائة مدرسة فكرية في الروايات العلمية والتكنولوجية. نحن بحاجة ماسة إلى تكوين فهم جديد للسرد التكنولوجي ، حتى نتمكن من إيجاد الطريق الصحيح للتنمية و تحديد وضعنا في التنمية المستدامة في النظام البيئي التكنولوجي بأكمله.
بالطبع ، الجاذبية وحدها غير مجدية ، ولا يزال هناك شخص ما بحاجة إلى القيام بذلك ، لذلك سأفعل ذلك أولاً ، وقد تحملت هذا التفكير السردي ذو التقنية الواحدة لفترة طويلة!