"لا يوجد فن ، كل الفيزياء! الفيزياء تجعلك سعيدًا ، أليس كذلك؟"
في الآونة الأخيرة ، في المؤتمر العالمي لرسومات الكمبيوتر SIGGRAPH 2023 ، أعلن مؤسس Nvidia والرئيس التنفيذي Huang Renxun أنه عندما قام بدمج الذكاء الاصطناعي التوليدي مع منصة المحاكاة Omniverse ، كان متحمسًا كما أعلن أن "AIGC هي لحظة iPhone".
** تختلف عن نماذج اللغات الكبيرة التي لا يمكن تطبيقها إلا على الرسومات والنصوص ، مع نظام محاكاة قائم على القوانين الفيزيائية ، يمكن استخدام الذكاء الاصطناعي التوليدي مباشرة في العالم الحقيقي. **
بالإضافة إلى Huang Renxun ، قام فريق Li Feifei بجامعة ستانفورد بالولايات المتحدة مؤخرًا بدمج نماذج كبيرة في الروبوتات ، والتي لا تتيح فقط للروبوتات التفاعل بشكل فعال مع البيئة ، ولكن أيضًا إكمال المهام المختلفة دون بيانات إضافية وتدريب.
** قال جيا كوي ، مؤسس Kuawei Intelligence والأستاذ في جامعة جنوب الصين للتكنولوجيا ، لـ Light Cone Intelligence إن "الذكاء الاصطناعي التوليدي القائم على محاكاة العالم المادي هو AI 2.0 التوليدي" سوف يلعب الذكاء المتجسد دورًا مهمًا. تأثير أكثر حتمية. **
مع تعزيز القدرات العامة ، من المتوقع أيضًا أن يكسر الذكاء الاصطناعي "لعنة" التسويق.
** عندما يتعلم الذكاء الاصطناعي التوليدي الفيزياء **
إن الجمع بين الذكاء الاصطناعي التوليدي والعالم المادي ليس بالأمر السهل ، والسلسلة التقنية المعنية طويلة جدًا.
** بادئ ذي بدء ، من الضروري إتقان القوانين الأساسية للعالم المادي من أجل تصميم العالم الحقيقي لمنصة المحاكاة. **
لا يمكن لمنصة المحاكاة محاكاة المشاهد المادية فحسب ، بل يمكنها أيضًا محاكاة تفاعل وحركة وتشوه الكائنات في العالم الحقيقي.
ستسمح إضافة الذكاء الاصطناعي التوليدي لمنصة المحاكاة بالقدرة على "المعاينة".
قال هوانغ رينكسون: "لقد عرف البشر المعرفة الجسدية منذ الطفولة ، لكن الذكاء الاصطناعي لا يعرفها."
أوضح Huang Renxun كذلك أن السماح للذكاء الاصطناعي يتعلم كيفية إدراك البيئة في العالم الافتراضي ، وفهم تأثير وعواقب السلوك الجسدي من خلال التعلم المعزز ، بحيث يمكن للذكاء الاصطناعي تحقيق أهداف محددة.
** يتطلب ذلك استخدام الذكاء الاصطناعي التوليدي للتنبؤ بعشرات الملايين أو حتى مئات الملايين من الاحتمالات في العالم المادي لتكوين بيانات تركيبية قيمة. **
على سبيل المثال ، تحتاج الذراع الروبوتية إلى استخدام "عيون" الرؤية ثلاثية الأبعاد لفهمها بدقة ، ولكن كيف تتخلص من تداخل التغييرات البيئية والتعرف على الأشياء المراد إمساكها (مثل الأجزاء الموجودة في المصنع)؟
من خلال منصة المحاكاة ، أتقننا القوانين الفيزيائية مثل "انعكاس وانكسار الضوء على كائن المشهد" ، ويمكن للذكاء الاصطناعي التوليدي التنبؤ ومحاكاة زجاجة بدرجات مختلفة من الانعكاس تحت إضاءة المشهد المختلفة ؛ تحت نفس الإضاءة ، معدن ، حالة سطح الأشياء المصنوعة من مواد مختلفة مثل البلاستيك والمنتجات الخشبية ؛ كومة من المسامير ، جميع الحالات المتناثرة الممكنة ...
** مرة أخرى ، يجب تشغيل جميع البيانات على منصة المحاكاة باستخدام الذكاء الاصطناعي. **
هذه الخطوة هي تدريب النموذج البصري الكبير ثلاثي الأبعاد. تختلف النماذج ثلاثية الأبعاد المرئية الكبيرة عن النماذج اللغوية الكبيرة ، وهي ضرورية لفهم الخصائص التركيبية للمشاهد المرئية والاستدلال عليها ، وتحتاج إلى التعامل مع العلاقات المعقدة بين الأشياء والمواقف والتغييرات في البيئة الحقيقية.
** أخيرًا ، يجب توصيله بأجهزة ذكية مثل الذراع الآلية ، حتى يتمكن من تعلم التشغيل الذكي. **
يمكن ملاحظة أن السلسلة التقنية الكاملة للجمع بين الذكاء الاصطناعي التوليدي والعالم المادي لا تشمل فقط الفيزياء والرسومات ورؤية الكمبيوتر والروبوتات متعددة التخصصات ، ولكن أيضًا التوائم الرقمية والتعلم الهندسي العميق وحسابات الحركية والذكاء الهجين والذكاء الأجهزة وغيرها من التقنيات المتطورة متعددة الأبعاد.
في المقابل ، فإن سلسلة الصناعة بأكملها معقدة نسبيًا أيضًا ، من البيانات إلى النماذج ، ثم من النماذج إلى النشر.
في هذه الروابط ، توجد عقدة مختلفة تمامًا عن مسار الذكاء الاصطناعي السابق ، وهي "توليد البيانات الاصطناعية".
سيؤدي استخدام البيانات التي تم توليفها بواسطة الذكاء الاصطناعي التوليفي استنادًا إلى القوانين الفيزيائية لتدريب النماذج الكبيرة إلى إحداث ثورة كبيرة في الصناعة المادية.
** بدون صورة حقيقية **
** تدريب نموذج بصري ثلاثي الأبعاد كبير **
لماذا لا تدرب النماذج الكبيرة مباشرة على بيانات حقيقية؟
في الوقت الحاضر ، تستخدم معظم الأذرع الروبوتية القائمة على الرؤية ثلاثية الأبعاد في الصناعة بيانات حقيقية لتدريب الخوارزمية لأنظمة التحكم الخاصة بها. نظرًا لقضايا مثل الخصوصية التجارية ، يصعب الحصول على هذه البيانات الحقيقية في البيانات العامة ، ويتم جمعها بشكل أساسي من قبل الشركات نفسها.
** ومع ذلك ، فإن البيانات الحقيقية التي يتم جمعها ذاتيًا ، أولاً وقبل كل شيء ، أداء التكلفة منخفض جدًا من حيث "الكفاءة والتكلفة" ، وهما المؤشران الرئيسيان للعملية. **
وذلك لأن سيناريوهات التطبيق الطرفي مجزأة ، ولا يمكن استخدام البيانات عالميًا على الإطلاق. لجمع بيانات حقيقية ، تحتاج الشركات إلى مجموعة "سجادة" لكل صناعة وكل مصنع وكل مشهد. علاوة على ذلك ، لا يمكن استخدام البيانات التي تم جمعها بشكل مباشر ، ويلزم إجراء سلسلة من المعالجة.
في هذه العملية ، هناك حتى "مفارقة الذكاء الاصطناعي".
"جمع البيانات الحقيقية ، أكثر من نصف تكلفة تقنية الذكاء الاصطناعي هي تكلفة البيانات ، وغالبًا ما تكون معالجة جمع البيانات ، والتنظيف ، ووضع العلامات ، والتعزيز نتيجة لتراكم كبير في القوى العاملة." وقد أشار بعض المحللين ، جوهر الذكاء الاصطناعي هو أن يحل محل الذكاء الاصطناعي. "المفارقة هي أن مثل هذا الذكاء الاصطناعي له خصائص صناعية كثيفة العمالة واضحة."
ماذا عن البيانات التركيبية؟
** "باستخدام البيانات الحقيقية المتراكمة في خمس أو ست سنوات وآلاف الحالات ، يمكن إكمالها في غضون أيام قليلة وأسابيع قليلة من خلال البيانات التركيبية." قال جيا كوي لمجلة Light Cone Intelligence التي تُقارن بالتجميع اليدوي وتوسيم البيانات ، تكلفة البيانات التركيبية يمكن تحقيق تخفيض في عدة أوامر من حيث الحجم. **
** أهم شيء هو أنه من حيث تأثير التدريب ، يمكن أن تكون البيانات التركيبية أفضل من البيانات الحقيقية. **
نظرًا لأنه يتم تصنيعها استنادًا إلى القوانين الفيزيائية ، فإن البيانات التركيبية تولد مع تعليقات توضيحية دقيقة تمامًا ، مما يعني أن تعلم الذكاء الاصطناعي فعال للغاية.
بالإضافة إلى ذلك ، فإن "شمولية" البيانات التركيبية لا مثيل لها بالبيانات الحقيقية. قال جيا كوي: "يمكن للذكاء الاصطناعي التوليدي 2.0 إنشاء عوالم لا حصر لها ، ويمكن أن يجعل هذا العالم يتطور بسرعة."
** عندما يتعلق الأمر بصناعة الرؤية ثلاثية الأبعاد ، فإن الذراع الآلية تشبه "يد الله" ، التي يمكنها التحكم في كل شيء في الماضي والمستقبل. **
وأكد جيا كوي "بالطبع ، لا يمكن أن يكون هذا خارج قوانين العالم المادي".
"في الوقت الحالي ، يمكننا إكمال تدريب النموذج المرئي ثلاثي الأبعاد للذراع الروبوتية لعمليات المشهد المعقدة دون استخدام صورة حقيقية." أخبر جيا كوي شركة Lightcone Intelligence أن العملية المرنة للذراع الروبوتية يمكن توجيهها من خلال النموذج المدرب بالكامل باستخدام البيانات ، والتي يمكن أن تحقق قبضة مستقرة أكثر من 99.9٪ في الموقع.
ولهذا السبب على وجه التحديد ، تسمى ** البيانات التركيبية "آلة حركة البيانات الدائمة" للنماذج الكبيرة. **
في الوقت الحالي ، بالإضافة إلى مجال الرؤية ثلاثية الأبعاد ، تحاول العديد من المجالات أيضًا استخدام البيانات التركيبية بسبب مشاكل مثل نقص البيانات العامة والضوضاء العالية. ومع ذلك ، هناك أيضًا شكوك قوية حول البيانات التركيبية ، قائلة إنه إذا لم يتم تصحيحها بعناية واستخدامها على نطاق واسع أثناء التدريب ، فسيؤدي ذلك إلى تعطل النموذج والتسبب في عيوب لا رجعة فيها.
من منظور التطور التكنولوجي ، لن تكون البيانات التركيبية هي الحل الوحيد للنماذج الكبيرة.
ومع ذلك ، أشار جيا كوي إلى أنه "قبل إيجاد طريقة أفضل ، فإن البيانات التركيبية هي أفضل طريقة لحل المشكلات العملية في الوقت الحالي. إذا كانت البيانات الحقيقية التي جمعها البشر لا تزال مستخدمة ، في العديد من المجالات بما في ذلك الرؤية ثلاثية الأبعاد ، والذكاء الاصطناعي العام ) المخابرات) لن يكون ممكنًا أبدًا ".
** كسر "لعنة" تسويق الذكاء الاصطناعي **
في مجال رؤية الآلة ، يكون الطلب على البيانات التركيبية أقوى ، وستكون القيمة التي يمكن أن يفتحها الذكاء الاصطناعي 2.0 أكبر.
كطريقة إدراك مهمة جدًا للرؤية الآلية ، فإن الرؤية ثلاثية الأبعاد لديها حاجة ملحة للبيانات التركيبية.
"ابحث عن الاختلاف" بين مجموعة من الأجزاء المتشابهة ، وقم بتغيير مادة ولون الكائن ، وتحتاج إلى ضبط المعلمات. "قال ممارس رؤية ثلاثية الأبعاد أن الاحتياجات المختلفة للحقول المختلفة تجعل مشهد الهبوط مجزأًا للغاية. قم بإنهاء مشروع واحد ثم أعد تخصيص مشروع آخر.
هذا يعني أنه من الصعب على المؤسسات تشكيل منتجات موحدة من خلال التركيز على حل واحد أو أكثر من متطلبات المشروع. من المستحيل أيضًا الدخول إلى السوق وتوسيعه ومتابعة نطاق الربح من خلال التكرار السريع.
** من الصعب تقليل التكلفة الهامشية ، الأمر الذي سيحول شركة تكنولوجيا إلى شركة مشروع ويؤدي في النهاية إلى خفضها. **
الشر في التفاصيل.
ما مدى هشاشة الإدراك البصري ثلاثي الأبعاد التقليدي؟ وصف Jia Kui لـ Light Cone Intelligence ، "أثناء عملية الإمساك بالذراع الروبوتية ، إذا مر شخص ما وقام بتغيير الضوء ، فقد تفشل المهمة."
يحدث هذا بسبب مبدأ التصوير الخاص بالكاميرا ثلاثية الأبعاد للأجهزة ، حيث يتأثر تصوير الكاميرا ثلاثية الأبعاد بسهولة بالبيئة وشكل الكائن والمادة واللون ووسط التشتت وما إلى ذلك ، ومن الصعب حل هذه المشكلة في وقت قصير.
"قد يستغرق الأمر مائة خطوة لحل مشكلة ما ، ولكن الجهد في الخطوة الأخيرة قد يكون نفس مجموع الخطوات الـ 99 السابقة." قال يانغ فان ، المؤسس المشارك لـ SenseTime ، ذات مرة أن معظم طاقة تحتاج المؤسسة إلى التعامل مع الأجزاء الصغيرة مشكلة الذيل الطويل.
ولكن الآن ، ** "يمكن للذكاء الاصطناعي التوليدي 2.0 مع تعدد الاستخدامات القوي أن يحل مشكلة الذيل الطويل ، وهو أمر مهم جدًا لتوحيد المنتجات". قال جيا كوي. **
مقارنةً بنموذج التطوير التقليدي المخصص للصناعة ، استنادًا إلى الذكاء الاصطناعي 2.0 التوليدي ، يمكن للمؤسسات استخدام النموذج العام واسع النطاق لتحقيق تطوير وحدات المنتج ، وتحقيق النشر خارج الصندوق ، ثم تحقيق التوسع المباشر في نفس الصناعة ، ويمكن للصناعات المختلفة أيضًا إعادة الاستخدام الفعال. سيتم حل مشكلة تسويق صناعة الرؤية ثلاثية الأبعاد بسهولة.
في الوقت نفسه ، انخفضت أيضًا تكلفة البيانات والتطوير والنشر والأجهزة وتوسيع الصناعة انخفاضًا حادًا في كل رابط.
في ظل التحفيز التوليدي للذكاء الاصطناعي 2.0 ، بمجرد أن تنفجر الرؤية ثلاثية الأبعاد ، فهذا يعني أن المشاهد الرأسية التي تعتمد بشكل كبير على تقنية الرؤية ثلاثية الأبعاد مثل الأذرع الروبوتية والروبوتات والمركبات غير المأهولة والميتافرس سوف تتسارع لتناول عوائد الذكاء الاصطناعي.
أكدت الكثير من البيانات هذه النقطة.في مجالات مثل وضع العلامات على البيانات والبيانات الاصطناعية والروبوتات الصناعية ورؤية الماكينة ، ينمو حجم السوق العالمي بسرعة عالية ، خاصة أن معدل النمو السنوي المركب للبيانات التركيبية يتجاوز حتى 30٪ .
وراء هذا في الواقع القيمة الإستراتيجية للذكاء الاصطناعي 2.0 التوليدي ، والذي تم تقديره بشكل كبير من قبل التكنولوجيا والعديد من عمالقة التصنيع.
من شركات التصنيع الراسخة مثل Siemens و Ford ، إلى عمالقة التكنولوجيا مثل Nvidia و Tesla و Google والنجوم الناشئة مثل Waabi ، بدأوا جميعًا العمل في العديد من المجالات مثل الصناعة والروبوتات والقيادة بدون طيار والرعاية الطبية ، والتجزئة.استكشف الإمكانيات الأكبر للذكاء الاصطناعي التوليدي 2.0.
في الوقت نفسه ، تم حشد حماس رأس المال بشكل كبير. وفقًا لإحصاءات غير مكتملة ، في السنوات الأخيرة ، تراكم التمويل الأجنبي المرتبط بالبيانات الاصطناعية ما يقرب من 800 مليون دولار أمريكي.
في الصين ، جذبت الشركات المرتبطة بالبيانات التركيبية انتباه رأس المال أيضًا. في يونيو 2022 ، أعلنت Kuowei Smart الانتهاء من جولة التمويل التمهيدية ، بمبلغ تمويل بعشرات الملايين من اليوانات ، وتمويل تراكمي يقارب 100 مليون يوان في أقل من عام منذ إنشائها ؛ في يوليو هذا في العام ، أعلنت شركة Guanglun Smart أيضًا عن الانتهاء من جولة الملاك + التمويل ، والمبلغ التراكمي للتمويل هو عشرات الملايين من اليوانات.
** يمكن القول أنه من القدرة على تأليف الشعر إلى تعلم الفيزياء ، فإن الذكاء الاصطناعي 2.0 التوليدي يفتح مستقبلًا كبيرًا للرقمنة الصناعية. **
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
AIGC يلقي "السحر المادي" ، والرؤية ثلاثية الأبعاد تخترق "حد الدقة"
المصدر الأصلي: Light Cone Intelligence
المؤلف: ياو يو
"لا يوجد فن ، كل الفيزياء! الفيزياء تجعلك سعيدًا ، أليس كذلك؟"
في الآونة الأخيرة ، في المؤتمر العالمي لرسومات الكمبيوتر SIGGRAPH 2023 ، أعلن مؤسس Nvidia والرئيس التنفيذي Huang Renxun أنه عندما قام بدمج الذكاء الاصطناعي التوليدي مع منصة المحاكاة Omniverse ، كان متحمسًا كما أعلن أن "AIGC هي لحظة iPhone".
** تختلف عن نماذج اللغات الكبيرة التي لا يمكن تطبيقها إلا على الرسومات والنصوص ، مع نظام محاكاة قائم على القوانين الفيزيائية ، يمكن استخدام الذكاء الاصطناعي التوليدي مباشرة في العالم الحقيقي. **
مع تعزيز القدرات العامة ، من المتوقع أيضًا أن يكسر الذكاء الاصطناعي "لعنة" التسويق.
** عندما يتعلم الذكاء الاصطناعي التوليدي الفيزياء **
إن الجمع بين الذكاء الاصطناعي التوليدي والعالم المادي ليس بالأمر السهل ، والسلسلة التقنية المعنية طويلة جدًا.
** بادئ ذي بدء ، من الضروري إتقان القوانين الأساسية للعالم المادي من أجل تصميم العالم الحقيقي لمنصة المحاكاة. **
لا يمكن لمنصة المحاكاة محاكاة المشاهد المادية فحسب ، بل يمكنها أيضًا محاكاة تفاعل وحركة وتشوه الكائنات في العالم الحقيقي.
ستسمح إضافة الذكاء الاصطناعي التوليدي لمنصة المحاكاة بالقدرة على "المعاينة".
قال هوانغ رينكسون: "لقد عرف البشر المعرفة الجسدية منذ الطفولة ، لكن الذكاء الاصطناعي لا يعرفها."
أوضح Huang Renxun كذلك أن السماح للذكاء الاصطناعي يتعلم كيفية إدراك البيئة في العالم الافتراضي ، وفهم تأثير وعواقب السلوك الجسدي من خلال التعلم المعزز ، بحيث يمكن للذكاء الاصطناعي تحقيق أهداف محددة.
** يتطلب ذلك استخدام الذكاء الاصطناعي التوليدي للتنبؤ بعشرات الملايين أو حتى مئات الملايين من الاحتمالات في العالم المادي لتكوين بيانات تركيبية قيمة. **
على سبيل المثال ، تحتاج الذراع الروبوتية إلى استخدام "عيون" الرؤية ثلاثية الأبعاد لفهمها بدقة ، ولكن كيف تتخلص من تداخل التغييرات البيئية والتعرف على الأشياء المراد إمساكها (مثل الأجزاء الموجودة في المصنع)؟
من خلال منصة المحاكاة ، أتقننا القوانين الفيزيائية مثل "انعكاس وانكسار الضوء على كائن المشهد" ، ويمكن للذكاء الاصطناعي التوليدي التنبؤ ومحاكاة زجاجة بدرجات مختلفة من الانعكاس تحت إضاءة المشهد المختلفة ؛ تحت نفس الإضاءة ، معدن ، حالة سطح الأشياء المصنوعة من مواد مختلفة مثل البلاستيك والمنتجات الخشبية ؛ كومة من المسامير ، جميع الحالات المتناثرة الممكنة ...
هذه الخطوة هي تدريب النموذج البصري الكبير ثلاثي الأبعاد. تختلف النماذج ثلاثية الأبعاد المرئية الكبيرة عن النماذج اللغوية الكبيرة ، وهي ضرورية لفهم الخصائص التركيبية للمشاهد المرئية والاستدلال عليها ، وتحتاج إلى التعامل مع العلاقات المعقدة بين الأشياء والمواقف والتغييرات في البيئة الحقيقية.
يمكن ملاحظة أن السلسلة التقنية الكاملة للجمع بين الذكاء الاصطناعي التوليدي والعالم المادي لا تشمل فقط الفيزياء والرسومات ورؤية الكمبيوتر والروبوتات متعددة التخصصات ، ولكن أيضًا التوائم الرقمية والتعلم الهندسي العميق وحسابات الحركية والذكاء الهجين والذكاء الأجهزة وغيرها من التقنيات المتطورة متعددة الأبعاد.
في المقابل ، فإن سلسلة الصناعة بأكملها معقدة نسبيًا أيضًا ، من البيانات إلى النماذج ، ثم من النماذج إلى النشر.
سيؤدي استخدام البيانات التي تم توليفها بواسطة الذكاء الاصطناعي التوليفي استنادًا إلى القوانين الفيزيائية لتدريب النماذج الكبيرة إلى إحداث ثورة كبيرة في الصناعة المادية.
** بدون صورة حقيقية **
** تدريب نموذج بصري ثلاثي الأبعاد كبير **
لماذا لا تدرب النماذج الكبيرة مباشرة على بيانات حقيقية؟
في الوقت الحاضر ، تستخدم معظم الأذرع الروبوتية القائمة على الرؤية ثلاثية الأبعاد في الصناعة بيانات حقيقية لتدريب الخوارزمية لأنظمة التحكم الخاصة بها. نظرًا لقضايا مثل الخصوصية التجارية ، يصعب الحصول على هذه البيانات الحقيقية في البيانات العامة ، ويتم جمعها بشكل أساسي من قبل الشركات نفسها.
** ومع ذلك ، فإن البيانات الحقيقية التي يتم جمعها ذاتيًا ، أولاً وقبل كل شيء ، أداء التكلفة منخفض جدًا من حيث "الكفاءة والتكلفة" ، وهما المؤشران الرئيسيان للعملية. **
وذلك لأن سيناريوهات التطبيق الطرفي مجزأة ، ولا يمكن استخدام البيانات عالميًا على الإطلاق. لجمع بيانات حقيقية ، تحتاج الشركات إلى مجموعة "سجادة" لكل صناعة وكل مصنع وكل مشهد. علاوة على ذلك ، لا يمكن استخدام البيانات التي تم جمعها بشكل مباشر ، ويلزم إجراء سلسلة من المعالجة.
في هذه العملية ، هناك حتى "مفارقة الذكاء الاصطناعي".
"جمع البيانات الحقيقية ، أكثر من نصف تكلفة تقنية الذكاء الاصطناعي هي تكلفة البيانات ، وغالبًا ما تكون معالجة جمع البيانات ، والتنظيف ، ووضع العلامات ، والتعزيز نتيجة لتراكم كبير في القوى العاملة." وقد أشار بعض المحللين ، جوهر الذكاء الاصطناعي هو أن يحل محل الذكاء الاصطناعي. "المفارقة هي أن مثل هذا الذكاء الاصطناعي له خصائص صناعية كثيفة العمالة واضحة."
ماذا عن البيانات التركيبية؟
** "باستخدام البيانات الحقيقية المتراكمة في خمس أو ست سنوات وآلاف الحالات ، يمكن إكمالها في غضون أيام قليلة وأسابيع قليلة من خلال البيانات التركيبية." قال جيا كوي لمجلة Light Cone Intelligence التي تُقارن بالتجميع اليدوي وتوسيم البيانات ، تكلفة البيانات التركيبية يمكن تحقيق تخفيض في عدة أوامر من حيث الحجم. **
** أهم شيء هو أنه من حيث تأثير التدريب ، يمكن أن تكون البيانات التركيبية أفضل من البيانات الحقيقية. **
نظرًا لأنه يتم تصنيعها استنادًا إلى القوانين الفيزيائية ، فإن البيانات التركيبية تولد مع تعليقات توضيحية دقيقة تمامًا ، مما يعني أن تعلم الذكاء الاصطناعي فعال للغاية.
بالإضافة إلى ذلك ، فإن "شمولية" البيانات التركيبية لا مثيل لها بالبيانات الحقيقية. قال جيا كوي: "يمكن للذكاء الاصطناعي التوليدي 2.0 إنشاء عوالم لا حصر لها ، ويمكن أن يجعل هذا العالم يتطور بسرعة."
** عندما يتعلق الأمر بصناعة الرؤية ثلاثية الأبعاد ، فإن الذراع الآلية تشبه "يد الله" ، التي يمكنها التحكم في كل شيء في الماضي والمستقبل. **
وأكد جيا كوي "بالطبع ، لا يمكن أن يكون هذا خارج قوانين العالم المادي".
ولهذا السبب على وجه التحديد ، تسمى ** البيانات التركيبية "آلة حركة البيانات الدائمة" للنماذج الكبيرة. **
في الوقت الحالي ، بالإضافة إلى مجال الرؤية ثلاثية الأبعاد ، تحاول العديد من المجالات أيضًا استخدام البيانات التركيبية بسبب مشاكل مثل نقص البيانات العامة والضوضاء العالية. ومع ذلك ، هناك أيضًا شكوك قوية حول البيانات التركيبية ، قائلة إنه إذا لم يتم تصحيحها بعناية واستخدامها على نطاق واسع أثناء التدريب ، فسيؤدي ذلك إلى تعطل النموذج والتسبب في عيوب لا رجعة فيها.
من منظور التطور التكنولوجي ، لن تكون البيانات التركيبية هي الحل الوحيد للنماذج الكبيرة.
ومع ذلك ، أشار جيا كوي إلى أنه "قبل إيجاد طريقة أفضل ، فإن البيانات التركيبية هي أفضل طريقة لحل المشكلات العملية في الوقت الحالي. إذا كانت البيانات الحقيقية التي جمعها البشر لا تزال مستخدمة ، في العديد من المجالات بما في ذلك الرؤية ثلاثية الأبعاد ، والذكاء الاصطناعي العام ) المخابرات) لن يكون ممكنًا أبدًا ".
** كسر "لعنة" تسويق الذكاء الاصطناعي **
في مجال رؤية الآلة ، يكون الطلب على البيانات التركيبية أقوى ، وستكون القيمة التي يمكن أن يفتحها الذكاء الاصطناعي 2.0 أكبر.
كطريقة إدراك مهمة جدًا للرؤية الآلية ، فإن الرؤية ثلاثية الأبعاد لديها حاجة ملحة للبيانات التركيبية.
"ابحث عن الاختلاف" بين مجموعة من الأجزاء المتشابهة ، وقم بتغيير مادة ولون الكائن ، وتحتاج إلى ضبط المعلمات. "قال ممارس رؤية ثلاثية الأبعاد أن الاحتياجات المختلفة للحقول المختلفة تجعل مشهد الهبوط مجزأًا للغاية. قم بإنهاء مشروع واحد ثم أعد تخصيص مشروع آخر.
** من الصعب تقليل التكلفة الهامشية ، الأمر الذي سيحول شركة تكنولوجيا إلى شركة مشروع ويؤدي في النهاية إلى خفضها. **
الشر في التفاصيل.
ما مدى هشاشة الإدراك البصري ثلاثي الأبعاد التقليدي؟ وصف Jia Kui لـ Light Cone Intelligence ، "أثناء عملية الإمساك بالذراع الروبوتية ، إذا مر شخص ما وقام بتغيير الضوء ، فقد تفشل المهمة."
يحدث هذا بسبب مبدأ التصوير الخاص بالكاميرا ثلاثية الأبعاد للأجهزة ، حيث يتأثر تصوير الكاميرا ثلاثية الأبعاد بسهولة بالبيئة وشكل الكائن والمادة واللون ووسط التشتت وما إلى ذلك ، ومن الصعب حل هذه المشكلة في وقت قصير.
"قد يستغرق الأمر مائة خطوة لحل مشكلة ما ، ولكن الجهد في الخطوة الأخيرة قد يكون نفس مجموع الخطوات الـ 99 السابقة." قال يانغ فان ، المؤسس المشارك لـ SenseTime ، ذات مرة أن معظم طاقة تحتاج المؤسسة إلى التعامل مع الأجزاء الصغيرة مشكلة الذيل الطويل.
ولكن الآن ، ** "يمكن للذكاء الاصطناعي التوليدي 2.0 مع تعدد الاستخدامات القوي أن يحل مشكلة الذيل الطويل ، وهو أمر مهم جدًا لتوحيد المنتجات". قال جيا كوي. **
في الوقت نفسه ، انخفضت أيضًا تكلفة البيانات والتطوير والنشر والأجهزة وتوسيع الصناعة انخفاضًا حادًا في كل رابط.
في ظل التحفيز التوليدي للذكاء الاصطناعي 2.0 ، بمجرد أن تنفجر الرؤية ثلاثية الأبعاد ، فهذا يعني أن المشاهد الرأسية التي تعتمد بشكل كبير على تقنية الرؤية ثلاثية الأبعاد مثل الأذرع الروبوتية والروبوتات والمركبات غير المأهولة والميتافرس سوف تتسارع لتناول عوائد الذكاء الاصطناعي.
من شركات التصنيع الراسخة مثل Siemens و Ford ، إلى عمالقة التكنولوجيا مثل Nvidia و Tesla و Google والنجوم الناشئة مثل Waabi ، بدأوا جميعًا العمل في العديد من المجالات مثل الصناعة والروبوتات والقيادة بدون طيار والرعاية الطبية ، والتجزئة.استكشف الإمكانيات الأكبر للذكاء الاصطناعي التوليدي 2.0.
في الوقت نفسه ، تم حشد حماس رأس المال بشكل كبير. وفقًا لإحصاءات غير مكتملة ، في السنوات الأخيرة ، تراكم التمويل الأجنبي المرتبط بالبيانات الاصطناعية ما يقرب من 800 مليون دولار أمريكي.
في الصين ، جذبت الشركات المرتبطة بالبيانات التركيبية انتباه رأس المال أيضًا. في يونيو 2022 ، أعلنت Kuowei Smart الانتهاء من جولة التمويل التمهيدية ، بمبلغ تمويل بعشرات الملايين من اليوانات ، وتمويل تراكمي يقارب 100 مليون يوان في أقل من عام منذ إنشائها ؛ في يوليو هذا في العام ، أعلنت شركة Guanglun Smart أيضًا عن الانتهاء من جولة الملاك + التمويل ، والمبلغ التراكمي للتمويل هو عشرات الملايين من اليوانات.
** يمكن القول أنه من القدرة على تأليف الشعر إلى تعلم الفيزياء ، فإن الذكاء الاصطناعي 2.0 التوليدي يفتح مستقبلًا كبيرًا للرقمنة الصناعية. **