كسر اللعبة! إنجازات NVIDIA الجديدة في البيانات الاصطناعية: إنشاء "آلة تدريب على الحركة الدائمة" للروبوتات

2023-10-30 03:01:27

المصدر الأصلي: مجلس الابتكار العلمي والتكنولوجي اليومي

مصدر الصورة: تم إنشاؤه بواسطة الذكاء الاصطناعي غير محدود

مع الطلب الهائل على البيانات من الذكاء الاصطناعي ، استنفدت موارد البيانات تقريبا ، لذلك بدأت الشركات في إيجاد "طريقة جديدة" للحصول على البيانات - "إنشاء" البيانات بأنفسهم. ** ومع ذلك ، تم استخدام معظم البيانات التركيبية السابقة للتدريب الذكاء الاصطناعي نموذج كبير ، وهذه المرة ، أنشأت Nvidia "مخزن بيانات" لتدريب الروبوت **.

في ورقة بحثية جديدة بين NVIDIA وجامعة تكساس في أوستن ، تم وصف نظام يسمى "MimicGen" يمكنه تلقائيا إنشاء مجموعات بيانات تدريب الروبوت على نطاق واسع مع عدد قليل فقط من العروض التوضيحية البشرية. وقال جيم فان، وهو عالم بارز في نفيديا، إن الشركة ستفتح كل شيء من مصادر المصدر، بما في ذلك مجموعات البيانات التي تم إنشاؤها.

ما هو حجم البيانات التي تم إنشاؤها؟ ** باستخدام 10 عروض توضيحية بشرية ، يمكن ل MimicGen إنشاء 1000 مثال توليفي ؛ من خلال 200 عرض توضيحي بشري ، تمكنت MimicGen من إنشاء 50000 بيانات تدريب مباشرة عبر 18 مهمة وبيئات محاكاة متعددة **.

ماذا عن مجموعة البيانات التي تم إنشاؤها؟

يمكن ل MimicGen "تطوير" نفس المشهد في مراحل مختلفة على أساس البيانات الأصلية:

يمكنه أيضا إنشاء مجموعات بيانات مختلفة عبر مجموعة واسعة من توزيعات إعادة تعيين المهام ، بما في ذلك تجميع العناصر وصب القهوة وتنظيف الأكواب والمزيد:

القدرة على توليد عروض توضيحية مختلفة للأذرع الروبوتية الجديدة:

هناك أيضا بيانات تدريب للمهام طويلة الأجل:

تتوفر أيضا بيانات سيناريو العالم الحقيقي:

والجدير بالذكر أن الباحثين قارنوا البيانات التي تم إنشاؤها بواسطة مجموعات بيانات مصادر مختلفة. ومع ذلك ، وجدوا أن مجموعتي النتائج متشابهتان - مما يشير إلى أن "جودة البيانات قد لا تكون بنفس الأهمية في آليات البيانات واسعة النطاق".

ليس ذلك فحسب ، بل قارن الباحثون البيانات التي تم إنشاؤها بواسطة 10 عروض توضيحية بشرية مع 200 عرض توضيحي بشري ، وكانت النتائج بالمثل لا تختلف كثيرا. لذلك ، تعترف الورقة أيضا بأن هناك حاجة إلى مزيد من البحث حول ما إذا كان المزيد من بيانات العرض التقديمي البشري سيؤدي إلى التكرار وتكاليف تسمية البيانات غير الضرورية.

لماذا أنت مهووس جدا بالبيانات الاصطناعية؟ بالإضافة إلى موارد بيانات المصدر المحدودة المذكورة في بداية المقالة ، فإن جمع البيانات مكلف للغاية ويستغرق وقتا طويلا ، ومع نظام مثل MimicGen ، من الممكن إنشاء مجموعات بيانات غنية واسعة النطاق تلقائيا بكمية صغيرة فقط من البيانات ، تغطي سيناريوهات متعددة ، وقدرات الكائن ، والأذرع الروبوتية ، والمهام طويلة الأجل أو عالية الدقة ، مما يجعلها طريقة فعالة "لزيادة قوة واقتصاد تعلم الروبوت".

"ستوفر البيانات التركيبية تريليون البيانات التالية لنماذجنا" الجائعة ". "أحد الأسباب الرئيسية وراء تأخر الروبوتات كثيرا عن المجالات الذكاء الاصطناعي الأخرى هو نقص البيانات - لا يمكنك الحصول على إشارات التحكم من الإنترنت. "

"نحن نستنفد بسرعة بيانات العالم الحقيقي عالية الجودة من الويب ، وسيكون الذكاء الاصطناعي يولد من البيانات التركيبية هو الطريق إلى الأمام."

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
1/3
1Gate ETH Staking APY 5%
3k درجة الشعبية
2Show My Alpha Points
24k درجة الشعبية
3SOL Futures Reach New High
6k درجة الشعبية
4ETH ETF Sees 12 Weeks of Inflows
4k درجة الشعبية
5Crypto Market Rebound
172k درجة الشعبية

تثبيت

خريطة الموقع