تحديث ميتا الثقيل ، لدى Xiaoza يمكنه القيام بالأعمال المنزلية في metaverse! الصور الرمزية البشرية واقعية للغاية ، ويتفاعل وكلاء الذكاء الاصطناعي مع الناس في العالم المادي الحقيقي
اليوم ، أصدرت Meta Habitat 3.0 ، وهو وكيل الذكاء الاصطناعي تم تدريبه من قبلها وتعلم العثور على الأشخاص ومساعدة الأشخاص على تنظيف الغرف. الروبوتات الاجتماعية ، المعلم التالي!
بدءا من اليوم ، يقترب البشر خطوة واحدة من الروبوتات التي تساعد في الأعمال المنزلية!
أعلنت Meta عن Habitat 3.0 بهدف تطوير وكيل الذكاء الاصطناعي اجتماعي ، مما يعني أن روبوتات الذكاء الاجتماعي قد دخلت معلما جديدا.
المفتاح وراء هذه الذكاءات المتجسدة هو ، بالطبع ، الذكاء الاصطناعي العميل. معهم ، يمكن للروبوتات التعاون مع البشر ومساعدتهم على إكمال المهام اليومية.
عنوان الورقة:
عنوان المشروع:
في الواقع ، أعلنت Meta عن ثلاثة تطورات رئيسية في نفس الوقت اليوم -
**1. الموئل 3.0 هو أول جهاز محاكاة يدعم التدريب على نطاق واسع على مهام التفاعل بين الإنسان والآلة في بيئات داخلية متنوعة وواقعية. **
وهو يدعم كلا من الروبوتات والصور الرمزية البشرية ، مما يسمح للبشر والروبوتات بالتعاون في بيئة منزلية ، مثل المساعدة في تنظيف الغرفة.
**2. مجموعة بيانات المشهد الاصطناعي للموئل (HSSD-200) هي مجموعة بيانات ثلاثية الأبعاد أنشأها فنانون وتحتوي على أكثر من 18000 كائن في 466 فئة دلالية في 211 مشهدا. **
يتمتع HSSD-200 بأعلى جودة في مجموعات البيانات المماثلة ، ويمكنه تدريب وكلاء الملاحة ، وله تأثير تعميم جيد جدا على مشاهد إعادة الإعمار ثلاثية الأبعاد في العالم المادي ، وعدد المشاهد المستخدمة أقل بأمرين.
**3. HomeRobot عبارة عن منصة أجهزة وبرامج ميسورة التكلفة للغاية لمساعدي الروبوت المنزلي ، مما يسمح للروبوتات بأداء مهام المفردات المفتوحة في بيئات محاكاة ومادية. **
في التعلم على نطاق واسع ، يمكن ل Habitat 3.0 إكمال أكثر من 1000 خطوة في الثانية على وحدة معالجة رسومات واحدة.
**Netizen: متى سيخرج الروبوت القادر على الأعمال المنزلية **
قال مستخدمو الإنترنت: هذه قفزة كبيرة في مجال الروبوتات.
هناك أيضا أشخاص يتنهدون: هذه لعبة Sims متقدمة جدا.
يتطلع بعض الأشخاص بالفعل إلى تجربة Habitat 3.0 في Meta Quest VR.
حلم ، لا ينبغي أن تكون روبوتات المساعدة في التدبير المنزلي بعيدة.
الموئل 3.0
مع Habitat 3.0 ، لا توفر Meta محاكاة واقعية للبشر في المظهر والموقف فقط.
كما أنه يدعم أنواعا مختلفة من الإجراءات ، من الإجراءات البسيطة (مثل المشي والتلويح) إلى المعقدة (مثل التفاعل مع الأشياء) ، وهو متوافق مع التقاط الحركة.
بالإضافة إلى ذلك ، يمكن التحكم في الصورة الرمزية برمجيا دون تدهور الأداء - تشبه سرعة محاكاة الإنسان والآلة سرعة محاكاة الروبوت والروبوت.
### ** أشخاص في الحلقة**
ميزة رئيسية أخرى للموئل 3.0 هي "الإنسان في الحلقة".
باستخدام الماوس أو لوحة المفاتيح أو الواقع الافتراضي ، يمكننا تحقيق تحكم مذهل في التفاعل بين الإنسان والحاسوب.
بعد الانتهاء من المهمة ، يجمع النظام استراتيجية الروبوت وبياناته ، ويقيم التفاعل بين الإنسان والآلة.
المهام الاجتماعية
بالإضافة إلى ذلك ، يمكن ل Habitat 3.0 محاكاة مجموعة متنوعة من السيناريوهات الاجتماعية في العالم الحقيقي.
في مهمة تعرف باسم الملاحة الاجتماعية ، على سبيل المثال ، تحتاج الروبوتات إلى العثور على البشر ومتابعتهم مع الحفاظ على سلامتهم.
في مهمة أخرى ، تحتاج الروبوتات إلى العمل مع البشر لإكمال مهام مثل ترتيب الغرفة.
في هذه المرحلة ، يحتاج البشر والروبوتات إلى الذهاب إلى الموقع المستهدف بشكل منفصل ، ويحتاج الروبوت إلى إيجاد طريقة لتحقيق هذا الهدف مع البشر بأكبر قدر ممكن من الكفاءة.
روبوتات مدربة يمكنها تحقيق مجموعة متنوعة من السلوكيات الاجتماعية!
بالإضافة إلى الحفاظ على مسافة آمنة من البشر ، ستتراجع الروبوتات أيضا عند الضرورة ، مما يترك مجالا للبشر للمشي.
**دع وكلاء الذكاء الاصطناعي يتفاعلون مع البشر في العالم الحقيقي **
في الماضي ، عندما فكرنا في الذكاء الاصطناعي مساعدين ، كنا نفكر عادة في روبوتات الدردشة المستندة إلى الويب أو مكبرات الصوت الذكية.
يأمل باحثو Meta في تنفيذ وكلاء الذكاء الاصطناعي المتجسدين بذكاء عام ، حتى يتمكنوا من الشعور بالبيئة والتواصل مع البشر ومساعدتهم في العالمين الرقمي والمادي.
تتمثل إحدى الرؤى في صنع سماعات رأس AR يمكن ارتداؤها طوال اليوم للاستخدام البشري.
بالإضافة إلى ذلك ، يعمل الباحثون على تحسين التكنولوجيا الكامنة وراء الروبوتات الذكية الاجتماعية ، مما يسمح لهم بمساعدة البشر في الأعمال المنزلية والتكيف مع التفضيلات الفردية للبشر لمتطلبات شركائهم.
يركز العمل على البحث المتعمق في الأنظمة المدمجة لجعل الجيل القادم من تجارب AR و VR أفضل.
ومع ذلك ، فإن التدريب والاختبار المجسد الذكاء الاصطناعي وكلاء مع أشخاص حقيقيين على الأجهزة المادية ، سواء كانت روبوتات أو نظارات AR ، له بعض قيود قابلية التوسع وقد يكون لديه مشكلات أمنية.
ويتطلب ذلك وضع إجراءات معيارية موحدة.
لذلك ، طور باحثو Meta مجموعة جديدة من الأدوات لأبحاث الروبوت عبر أجهزة المحاكاة ومجموعات البيانات.
لقد طوروا أيضا مجموعة تقنية تتضمن أجهزة وبرامج لجعل هذا الجانب من البحث أسهل وبأسعار معقولة.
لتحسين قدرات الروبوت بسرعة ، يقوم الباحثون بتطوير واختبار خوارزميات ونماذج جديدة في أجهزة المحاكاة ثم نقلها إلى الروبوتات المادية.
على مر السنين ، حققت Habitat Simulator العديد من التطورات المهمة.
يمكن للروبوتات الافتراضية المدربة على Habitat 1.0 التنقل في عمليات المسح ثلاثية الأبعاد لمنازل العالم المادي بسرعات تزيد عن 10000 خطوة في الثانية (SPS).
يقدم Habitat 2.0 بيئات تفاعلية (على سبيل المثال ، العناصر التي يجب التقاطها ، والأدراج التي يمكن فتحها) ويدرب الروبوتات الافتراضية لتنظيف المنازل عن طريق إعادة ترتيب العناصر.
يذهب Habitat 3.0 إلى أبعد من ذلك ويمكنه دعم كل من الروبوتات والصور الرمزية البشرية ، مما يتيح التعاون بين الإنسان والآلة لإكمال المهام اليومية ، مثل ترتيب غرفة المعيشة وإعداد الوصفات في المطبخ.
هذا يفتح آفاقا جديدة لدراسة التعاون بين الإنسان والروبوت في مهام متنوعة وواقعية وبصرية وغنية لغويا.
بالإضافة إلى ذلك ، يدعم Habitat 3.0 الصور الرمزية البشرية ذات المظهر الواقعي والمشية الطبيعية والحركات ، والتي يمكنها محاكاة التفاعلات الواقعية منخفضة المستوى وعالية المستوى.
يمكن التحكم في هذه الصور الرمزية إما عن طريق الاستراتيجيات المكتسبة أو عن طريق أشخاص حقيقيين من خلال واجهة "الإنسان في الحلقة".
تدعم هذه الواجهة لوحات المفاتيح وأجهزة الماوس وسماعات الرأس VR.
إن التعايش بين البشر والروبوتات في بيئات محاكاة يمكن البشر من تعلم استراتيجيات الذكاء الاصطناعي الروبوتية ، وإكمال المهام اليومية ، وتقييمها لأول مرة في بيئة شبيهة بالأسرة ، في وجود صور رمزية بشرية.
هذا بلا شك ذو أهمية كبيرة -
تتطلب خوارزميات التعلم المعزز عادة ملايين التكرارات لتعلم معرفة ذات مغزى ، لذلك قد يستغرق الأمر سنوات لإجراء هذه التجارب في العالم المادي.
في تجربة المحاكاة ، يمكن القيام بذلك في غضون أيام قليلة.
2. جمع البيانات في منازل مختلفة في العالم المادي أمر غير عملي ، لأن هذا يتطلب نقل الروبوت إلى أماكن مختلفة وكذلك إعداد البيئة.
في المحاكاة ، يمكنك تغيير البيئة في جزء من الثانية والبدء فورا في التجربة في بيئة جديدة.
إذا لم يتم تدريب النموذج جيدا ، فإن الروبوت لديه القدرة على إتلاف البيئة أو إيذاء الناس في العالم المادي.
تسمح أجهزة المحاكاة للباحثين باختبار الأساليب في بيئة آمنة قبل نشرها في العالم المادي ، مما يضمن الأمان.
تتطلب نماذج الذكاء الاصطناعي الأكثر تقدما اليوم كميات كبيرة من البيانات للتدريب ، وتسهل عمليات المحاكاة على الباحثين توسيع نطاق جمع البيانات.
في العالم المادي ، يمكن أن يكون جمع البيانات مكلفا وبطيئا للغاية.
علاوة على ذلك ، يقترح الباحثون مهمتين مهمتين للغاية ومجموعة من المعايير لوضع معايير في مجال الذكاء الاصطناعي المجسدة الاجتماعية.
المهمة الأولى هي "الترتيب الاجتماعي" ، والتي تتضمن الروبوتات والصور الرمزية البشرية التي تعمل معا لأداء سلسلة من مهام الالتقاط والمكان ، مثل تنظيف المنازل.
في هذه المهمة ، يجب أن تعمل الروبوتات والبشر بشكل متضافر لتحقيق هدف مشترك. يحدث هذا السلوك الذكي بعد تدريب محاكاة واسع النطاق.
المهمة الثانية هي "الملاحة الاجتماعية" ، والتي تسمح للروبوت بتحديد موقع الشخص وتتبعه مع الحفاظ على مسافة آمنة.
** مجموعة بيانات مشهد تركيب الموائل **
مجموعات بيانات المشهد 3D ضرورية لتدريب الروبوتات في بيئة محاكاة.
في الوقت الحالي، على الرغم من وجود العديد من مجموعات البيانات التي تدعم توسيع نطاق بيانات التدريب، فإننا لا نفهم المفاضلة بين حجم مجموعة البيانات وصحتها.
تحقيقا لهذه الغاية ، أطلقت Meta مجموعة بيانات مشهد 3D اصطناعية جديدة - HSSD-200.
وهو يتألف من 211 مشاهد 3D عالية الجودة تمثل البيئة الداخلية الفعلية ، بما في ذلك 18،656 نماذج من كائنات العالم المادي من 466 فئة دلالية. أقرب إلى الفيزياء الحقيقية من مجموعات البيانات السابقة.
على وجه التحديد ، يوفر HSSD-200 مشاهد داخلية ثلاثية الأبعاد عالية الجودة ومصطنعة بالكامل ، ويتضمن تصنيفا دلاليا دقيقا يتوافق مع أنطولوجيا WordNet.
بالإضافة إلى ذلك ، تتيح وظيفة ضغط الأصول في HSSD-200 محاكاة الذكاء الاصطناعي عالية الأداء.
من حيث المشاهد ، تم تصنيع HSSD-200 باستخدام واجهة التصميم الداخلي Floorplanner ، والتصميم هو في الأساس استنساخ للمنزل الفعلي.
من بينها ، يتم إنشاء كائنات فردية من قبل فنانين 3D محترفين ، في معظم الحالات مطابقة الأثاث والأجهزة الفعلية.
أظهرت التجارب أن مجموعة بيانات HSSD-200 الأصغر ولكن الأعلى جودة يمكن أن تولد وكلاء objectNav مع كائنات كأهداف تنقل ، وأدائها مشابه لأداء الوكلاء المدربين على مجموعات بيانات أكبر.
علاوة على ذلك ، فإن عدد السيناريوهات المطلوبة لتدريب وكيل على HSSD-200 هو 2 أوامر أقل من حيث الحجم -
بالمقارنة مع الوكلاء المدربين على 10000 سيناريو ProcTHOR ، فإن الوكلاء المدربين على 122 سيناريو HSSD-200 يعممون بشكل أفضل على سيناريوهات العالم المادي HM3DSem.
هوم روبوت
تعد المنصات المشتركة والشائعة جزءا مهما من تقدم التعلم الآلي ، ولكن في مجال الروبوتات ، تفتقر إلى منصات مماثلة لأنه من الصعب تكرار إنجازات الأجهزة وتوسيع نطاقها.
في هذا الصدد ، تقترح Meta ثلاثة أهداف لمنصة أبحاث الروبوتات القابلة للتكرار:
- نجم الشمال الملهم:
تحتاج المنصة إلى توفير بعثات موجهة لنجم الشمال لتحفيز الباحثين ومساعدتهم في عملهم. من بينها ، يمكنهم أيضا مقارنة طرق مختلفة حول مشاكل العالم الحقيقي المثيرة للاهتمام.
على سبيل المثال ، "معالجة حركة الكلمات المفتوحة (OVMM)" - التقاط الكائنات في أي بيئة غير معروفة ووضعها في مكان معين. وهذا يتطلب إدراكا قويا للغاية على المدى الطويل وفهما للمشهد ، وهو مفيد لمجموعة واسعة من المهام.
- قدرات البرمجيات:
يحتاج النظام الأساسي إلى توفير بعض واجهة التجريد لتسهيل استخدام الروبوت لمجموعة متنوعة من المهام ، بما في ذلك التنقل والتلاعب.
-مجتمع:
تحتاج المنصة إلى تشجيع المطورين على المشاركة ومحاولة بناء مجتمع حول قاعدة البيانات.
لتعزيز البحث في هذا المجال ، أطلقت Meta مكتبة HomeRobot جديدة تتيح دعم ميزات التنقل والتلاعب في Hello Robot Stretch.
عنوان المشروع:
على وجه التحديد ، يحتوي HomeRobot على مكونين:
مكونات المحاكاة: لاستخدام مجموعة كبيرة ومتنوعة من الأشياء في بيئات منزلية جديدة وعالية الجودة متعددة الغرف ؛
مكونات العالم المادي: يوفر مكدسات برامج لمنتجات Hello Robot Stretch و Boston Dynamics منخفضة التكلفة لتشجيع تكرار تجارب العالم المادي عبر المختبرات.
بالإضافة إلى ذلك ، يوفر HomeRobot مجموعة برامج سهلة الاستخدام للغاية ، مما يسمح للمستخدمين بإعداد الروبوت بسرعة واختباره على الفور. وتشمل الميزات:
-قابليه:
هناك حالة موحدة ومساحة عمل بين إعدادات عالم المحاكاة والفيزياء لكل مهمة ، مما يوفر طريقة سهلة لتشغيل الروبوت باستخدام مساحة حركة عالية المستوى (مثل استراتيجية إمساك محددة مسبقا) أو تحكم مشترك مستمر منخفض المستوى.
** - النمطية: **
يدعم مكون الإدراك والعمل الحالات عالية المستوى (على سبيل المثال ، الخرائط الدلالية ، والسحب النقطية المجزأة) والإجراءات عالية المستوى (على سبيل المثال ، الذهاب إلى موقع الهدف ، والتقاط كائن مستهدف).
- وكيل القاعدة:
يمكن تطوير استراتيجيات لاستخدام هذه القدرات لتوفير الوظائف الأساسية ل OVMM ، بالإضافة إلى أدوات لبناء عوامل أكثر تعقيدا ، من قبل فرق أخرى.
في معيار HomeRobot OVMM ، يمكن للوكيل الاستيلاء على العناصر الجديدة في البيئة المنزلية ووضعها في أو في حاوية مستهدفة.
من بينها ، تستخدم Meta التعلم المعزز وخطوط الأساس الإرشادية (القائمة على النموذج) لإظهار أنه يمكن نقل مهارات التنقل والتنسيب من المحاكاة إلى العالم المادي. تظهر النتائج أن خط الأساس يمكن أن يحقق معدل نجاح بنسبة 20٪ في العالم المادي.
موارد:
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تحديث ميتا الثقيل ، لدى Xiaoza يمكنه القيام بالأعمال المنزلية في metaverse! الصور الرمزية البشرية واقعية للغاية ، ويتفاعل وكلاء الذكاء الاصطناعي مع الناس في العالم المادي الحقيقي
المصدر: شين تشي يوان
اليوم ، أصدرت Meta Habitat 3.0 ، وهو وكيل الذكاء الاصطناعي تم تدريبه من قبلها وتعلم العثور على الأشخاص ومساعدة الأشخاص على تنظيف الغرف. الروبوتات الاجتماعية ، المعلم التالي!
بدءا من اليوم ، يقترب البشر خطوة واحدة من الروبوتات التي تساعد في الأعمال المنزلية!
عنوان المشروع:
في الواقع ، أعلنت Meta عن ثلاثة تطورات رئيسية في نفس الوقت اليوم -
**1. الموئل 3.0 هو أول جهاز محاكاة يدعم التدريب على نطاق واسع على مهام التفاعل بين الإنسان والآلة في بيئات داخلية متنوعة وواقعية. **
وهو يدعم كلا من الروبوتات والصور الرمزية البشرية ، مما يسمح للبشر والروبوتات بالتعاون في بيئة منزلية ، مثل المساعدة في تنظيف الغرفة.
يتمتع HSSD-200 بأعلى جودة في مجموعات البيانات المماثلة ، ويمكنه تدريب وكلاء الملاحة ، وله تأثير تعميم جيد جدا على مشاهد إعادة الإعمار ثلاثية الأبعاد في العالم المادي ، وعدد المشاهد المستخدمة أقل بأمرين.
في التعلم على نطاق واسع ، يمكن ل Habitat 3.0 إكمال أكثر من 1000 خطوة في الثانية على وحدة معالجة رسومات واحدة.
**Netizen: متى سيخرج الروبوت القادر على الأعمال المنزلية **
قال مستخدمو الإنترنت: هذه قفزة كبيرة في مجال الروبوتات.
الموئل 3.0
مع Habitat 3.0 ، لا توفر Meta محاكاة واقعية للبشر في المظهر والموقف فقط.
ميزة رئيسية أخرى للموئل 3.0 هي "الإنسان في الحلقة".
المهام الاجتماعية
بالإضافة إلى ذلك ، يمكن ل Habitat 3.0 محاكاة مجموعة متنوعة من السيناريوهات الاجتماعية في العالم الحقيقي.
في مهمة تعرف باسم الملاحة الاجتماعية ، على سبيل المثال ، تحتاج الروبوتات إلى العثور على البشر ومتابعتهم مع الحفاظ على سلامتهم.
في هذه المرحلة ، يحتاج البشر والروبوتات إلى الذهاب إلى الموقع المستهدف بشكل منفصل ، ويحتاج الروبوت إلى إيجاد طريقة لتحقيق هذا الهدف مع البشر بأكبر قدر ممكن من الكفاءة.
بالإضافة إلى الحفاظ على مسافة آمنة من البشر ، ستتراجع الروبوتات أيضا عند الضرورة ، مما يترك مجالا للبشر للمشي.
**دع وكلاء الذكاء الاصطناعي يتفاعلون مع البشر في العالم الحقيقي **
في الماضي ، عندما فكرنا في الذكاء الاصطناعي مساعدين ، كنا نفكر عادة في روبوتات الدردشة المستندة إلى الويب أو مكبرات الصوت الذكية.
يأمل باحثو Meta في تنفيذ وكلاء الذكاء الاصطناعي المتجسدين بذكاء عام ، حتى يتمكنوا من الشعور بالبيئة والتواصل مع البشر ومساعدتهم في العالمين الرقمي والمادي.
تتمثل إحدى الرؤى في صنع سماعات رأس AR يمكن ارتداؤها طوال اليوم للاستخدام البشري.
بالإضافة إلى ذلك ، يعمل الباحثون على تحسين التكنولوجيا الكامنة وراء الروبوتات الذكية الاجتماعية ، مما يسمح لهم بمساعدة البشر في الأعمال المنزلية والتكيف مع التفضيلات الفردية للبشر لمتطلبات شركائهم.
يركز العمل على البحث المتعمق في الأنظمة المدمجة لجعل الجيل القادم من تجارب AR و VR أفضل.
ويتطلب ذلك وضع إجراءات معيارية موحدة.
لذلك ، طور باحثو Meta مجموعة جديدة من الأدوات لأبحاث الروبوت عبر أجهزة المحاكاة ومجموعات البيانات.
لقد طوروا أيضا مجموعة تقنية تتضمن أجهزة وبرامج لجعل هذا الجانب من البحث أسهل وبأسعار معقولة.
لتحسين قدرات الروبوت بسرعة ، يقوم الباحثون بتطوير واختبار خوارزميات ونماذج جديدة في أجهزة المحاكاة ثم نقلها إلى الروبوتات المادية.
على مر السنين ، حققت Habitat Simulator العديد من التطورات المهمة.
يقدم Habitat 2.0 بيئات تفاعلية (على سبيل المثال ، العناصر التي يجب التقاطها ، والأدراج التي يمكن فتحها) ويدرب الروبوتات الافتراضية لتنظيف المنازل عن طريق إعادة ترتيب العناصر.
يذهب Habitat 3.0 إلى أبعد من ذلك ويمكنه دعم كل من الروبوتات والصور الرمزية البشرية ، مما يتيح التعاون بين الإنسان والآلة لإكمال المهام اليومية ، مثل ترتيب غرفة المعيشة وإعداد الوصفات في المطبخ.
هذا يفتح آفاقا جديدة لدراسة التعاون بين الإنسان والروبوت في مهام متنوعة وواقعية وبصرية وغنية لغويا.
بالإضافة إلى ذلك ، يدعم Habitat 3.0 الصور الرمزية البشرية ذات المظهر الواقعي والمشية الطبيعية والحركات ، والتي يمكنها محاكاة التفاعلات الواقعية منخفضة المستوى وعالية المستوى.
تدعم هذه الواجهة لوحات المفاتيح وأجهزة الماوس وسماعات الرأس VR.
إن التعايش بين البشر والروبوتات في بيئات محاكاة يمكن البشر من تعلم استراتيجيات الذكاء الاصطناعي الروبوتية ، وإكمال المهام اليومية ، وتقييمها لأول مرة في بيئة شبيهة بالأسرة ، في وجود صور رمزية بشرية.
هذا بلا شك ذو أهمية كبيرة -
في تجربة المحاكاة ، يمكن القيام بذلك في غضون أيام قليلة.
في المحاكاة ، يمكنك تغيير البيئة في جزء من الثانية والبدء فورا في التجربة في بيئة جديدة.
تسمح أجهزة المحاكاة للباحثين باختبار الأساليب في بيئة آمنة قبل نشرها في العالم المادي ، مما يضمن الأمان.
في العالم المادي ، يمكن أن يكون جمع البيانات مكلفا وبطيئا للغاية.
المهمة الأولى هي "الترتيب الاجتماعي" ، والتي تتضمن الروبوتات والصور الرمزية البشرية التي تعمل معا لأداء سلسلة من مهام الالتقاط والمكان ، مثل تنظيف المنازل.
في هذه المهمة ، يجب أن تعمل الروبوتات والبشر بشكل متضافر لتحقيق هدف مشترك. يحدث هذا السلوك الذكي بعد تدريب محاكاة واسع النطاق.
المهمة الثانية هي "الملاحة الاجتماعية" ، والتي تسمح للروبوت بتحديد موقع الشخص وتتبعه مع الحفاظ على مسافة آمنة.
** مجموعة بيانات مشهد تركيب الموائل **
مجموعات بيانات المشهد 3D ضرورية لتدريب الروبوتات في بيئة محاكاة.
في الوقت الحالي، على الرغم من وجود العديد من مجموعات البيانات التي تدعم توسيع نطاق بيانات التدريب، فإننا لا نفهم المفاضلة بين حجم مجموعة البيانات وصحتها.
تحقيقا لهذه الغاية ، أطلقت Meta مجموعة بيانات مشهد 3D اصطناعية جديدة - HSSD-200.
وهو يتألف من 211 مشاهد 3D عالية الجودة تمثل البيئة الداخلية الفعلية ، بما في ذلك 18،656 نماذج من كائنات العالم المادي من 466 فئة دلالية. أقرب إلى الفيزياء الحقيقية من مجموعات البيانات السابقة.
بالإضافة إلى ذلك ، تتيح وظيفة ضغط الأصول في HSSD-200 محاكاة الذكاء الاصطناعي عالية الأداء.
من بينها ، يتم إنشاء كائنات فردية من قبل فنانين 3D محترفين ، في معظم الحالات مطابقة الأثاث والأجهزة الفعلية.
علاوة على ذلك ، فإن عدد السيناريوهات المطلوبة لتدريب وكيل على HSSD-200 هو 2 أوامر أقل من حيث الحجم -
بالمقارنة مع الوكلاء المدربين على 10000 سيناريو ProcTHOR ، فإن الوكلاء المدربين على 122 سيناريو HSSD-200 يعممون بشكل أفضل على سيناريوهات العالم المادي HM3DSem.
هوم روبوت
تعد المنصات المشتركة والشائعة جزءا مهما من تقدم التعلم الآلي ، ولكن في مجال الروبوتات ، تفتقر إلى منصات مماثلة لأنه من الصعب تكرار إنجازات الأجهزة وتوسيع نطاقها.
في هذا الصدد ، تقترح Meta ثلاثة أهداف لمنصة أبحاث الروبوتات القابلة للتكرار:
- نجم الشمال الملهم:
تحتاج المنصة إلى توفير بعثات موجهة لنجم الشمال لتحفيز الباحثين ومساعدتهم في عملهم. من بينها ، يمكنهم أيضا مقارنة طرق مختلفة حول مشاكل العالم الحقيقي المثيرة للاهتمام.
على سبيل المثال ، "معالجة حركة الكلمات المفتوحة (OVMM)" - التقاط الكائنات في أي بيئة غير معروفة ووضعها في مكان معين. وهذا يتطلب إدراكا قويا للغاية على المدى الطويل وفهما للمشهد ، وهو مفيد لمجموعة واسعة من المهام.
يحتاج النظام الأساسي إلى توفير بعض واجهة التجريد لتسهيل استخدام الروبوت لمجموعة متنوعة من المهام ، بما في ذلك التنقل والتلاعب.
-مجتمع:
تحتاج المنصة إلى تشجيع المطورين على المشاركة ومحاولة بناء مجتمع حول قاعدة البيانات.
لتعزيز البحث في هذا المجال ، أطلقت Meta مكتبة HomeRobot جديدة تتيح دعم ميزات التنقل والتلاعب في Hello Robot Stretch.
على وجه التحديد ، يحتوي HomeRobot على مكونين:
مكونات المحاكاة: لاستخدام مجموعة كبيرة ومتنوعة من الأشياء في بيئات منزلية جديدة وعالية الجودة متعددة الغرف ؛
مكونات العالم المادي: يوفر مكدسات برامج لمنتجات Hello Robot Stretch و Boston Dynamics منخفضة التكلفة لتشجيع تكرار تجارب العالم المادي عبر المختبرات.
-قابليه:
هناك حالة موحدة ومساحة عمل بين إعدادات عالم المحاكاة والفيزياء لكل مهمة ، مما يوفر طريقة سهلة لتشغيل الروبوت باستخدام مساحة حركة عالية المستوى (مثل استراتيجية إمساك محددة مسبقا) أو تحكم مشترك مستمر منخفض المستوى.
** - النمطية: **
يدعم مكون الإدراك والعمل الحالات عالية المستوى (على سبيل المثال ، الخرائط الدلالية ، والسحب النقطية المجزأة) والإجراءات عالية المستوى (على سبيل المثال ، الذهاب إلى موقع الهدف ، والتقاط كائن مستهدف).
- وكيل القاعدة:
يمكن تطوير استراتيجيات لاستخدام هذه القدرات لتوفير الوظائف الأساسية ل OVMM ، بالإضافة إلى أدوات لبناء عوامل أكثر تعقيدا ، من قبل فرق أخرى.
من بينها ، تستخدم Meta التعلم المعزز وخطوط الأساس الإرشادية (القائمة على النموذج) لإظهار أنه يمكن نقل مهارات التنقل والتنسيب من المحاكاة إلى العالم المادي. تظهر النتائج أن خط الأساس يمكن أن يحقق معدل نجاح بنسبة 20٪ في العالم المادي.
موارد: