نقاش كبير حول القهوة AIGC: كيفية ركوب الرياح والأمواج في طفرة الذكاء الاصطناعي

المصدر: Lei Feng Net

المؤلف: Dong Zibo Wang Yue

العنوان الأصلي: "AIGC: في ظل الانتفاضة ، أين الحدود؟丨 GAIR 2023

من رسم الصور إلى كتابة القصائد ، ومن كتابة الإعلانات إلى صنع الطاولة ، ومن PPT إلى كتابة الأكواد ، إذا قال أحدهم إن الذكاء الاصطناعي يمكنه القيام بكل هذه المهام منذ أكثر من عشرة أشهر ، فإن قلة من الناس سيصدقون ذلك.

ومع ذلك ، فإن سرعة التطور التكنولوجي دائمًا ما تكون متفجرة ، فقبل انتهاء عام 2023 ، اجتاحت موجة الذكاء الاصطناعي التوليدية الدائرة التكنولوجية بأكملها ، مما جعل الناس مفتونين بها ويتدفقون عليها.

في مؤتمر GAIR العالمي السابع للذكاء الاصطناعي والروبوتات برعاية مشتركة من معهد GAIR للأبحاث ، Leifeng.com ، دار نشر العلوم والتكنولوجيا العالمية ، ومجموعة Kotler Consulting Group ، اجتمعت جميع الأسماء الكبيرة في مجال AIGC في فندق Orchard في سنغافورة لتقديم يشارك العالم معلوماتهم المباشرة وأحدث معارفهم حول الذكاء الاصطناعي التوليدي.

المتحدثون الذين شاركوا في GAIR AIGC والمنتدى الفرعي للمحتوى التوليدي هم:

بان شينغانغ ، أستاذ مساعد ، كلية علوم وهندسة الحاسوب ، جامعة نانيانغ التكنولوجية Congxing Cai ، مؤسس موقع Joinrealm.ai مؤسس مجتمع Help & Grow في سنغافورة ، وانغ تونغ Lizhi Group CTO ، دينغ نينغ عالم أبحاث أول ، جامعة نانيانغ التكنولوجية ؛ مؤسس شركة Deepir Inc. ، Wu Pengcheng مدير مركز خوارزمية نشر الألعاب في Tencent Overseas ، Lang Jun

في المسار السريع للذكاء الاصطناعي الحالي ، كيف نحافظ على صفاء الذهن وصقل الابتكارات في التكنولوجيا والمنتجات ونماذج الأعمال؟ ما هي رؤى الضيوف في الاجتماع ، حتى يتمكنوا من ركوب الرياح والأمواج في اندلاع الذكاء الاصطناعي التوليدي؟

** جامعة نانيانغ التكنولوجية Pan Xingang: اسحب النقاط الرئيسية للمحتوى المرئي وأفلتها ، ولم نستخدم نموذج الانتشار **

عندما يتعلق الأمر بـ AIGC ، في المسار الحالي ، سيفكر الجميع دائمًا في MidJourney ، والتي تم تصنيفها بدرجة عالية في الخارج ، والدعم الفني الذي يقف وراءها - نموذج الانتشار.

ومع ذلك ، فقد تخلى بان شينغانغ ، الأستاذ المساعد في كلية علوم وهندسة الحاسب الآلي بجامعة نانيانغ التكنولوجية ، والذي درس في السابق تحت إشراف الأستاذ تانغ شياو في هونغ كونغ ، بشكل حاسم عن نموذج الانتشار في أحدث تعديل له باستخدام السحب والإفلات للمفتاح. نقاط المحتوى المرئي ". يتم استخدام تقنية أكثر" قديمة "- شبكة المواجهة التوليدية (GAN).

يرى الكثير من الناس القدرة القوية للذكاء الاصطناعي على إنشاء الصور ، ويعتقدون أن عصر AIGC قد حان ؛ لكن Pan Xingang وجد أن "إنشاء الصور" غالبًا ليس الخطوة الأخيرة في العملية الإبداعية للمستخدم.

التعديلات اللاحقة على الصورة - خاصة عناصر الصورة التي تم إنشاؤها بواسطة الذكاء الاصطناعي غالبًا ما تكون مليئة بعدم اليقين.لتلبية احتياجات المستخدمين ، من الضروري السماح للمستخدم بضبط كل عنصر في الصورة في مرحلة لاحقة.

على سبيل المثال ، أنتج الذكاء الاصطناعي أسدًا واقعيًا للغاية ، فإذا أراد المستخدمون قلب رأس الأسد ، أو تحريك موضعه ، أو حتى تغيير تعبير الأسد ، فمن الصعب القيام بذلك في شكل المنتج الحالي.

تبدو هذه العمليات بسيطة ، لكنها تدور حول التحكم الدقيق في الخصائص المكانية للأشياء ، ولا تزال تواجه تحديات تقنية ضخمة.

في الماضي ، كانت هناك طريقة لاتباع فكرة مخطط فنسنت ، لتعديل الصورة وفقًا لإرشادات النص - على سبيل المثال ، "تحريك أنف الأسد إلى اليمين بمقدار 30 بكسل".

ولكن هناك أيضًا مشكلات في هذا الحل:

من ناحية أخرى ، يجب أن يتمتع النموذج النصي بفهم قوي بما فيه الكفاية للسمات المكانية للكائنات من أجل تلبية احتياجات التحرير المختلفة وأساليب المستخدمين وجعل التفاعل أكثر سهولة ؛

من ناحية أخرى ، بالنسبة لنموذج اللغة ، من الصعب فهم طول الصورة وحجمها بدقة ، مما يسبب أيضًا الكثير من المتاعب لتحرير المحتوى المرئي.

على مستوى التفاعل ، بالنسبة للمستخدمين ، فإن الطريقة الأكثر سهولة وسهولة في الاستخدام هي بلا شك تفاعل السحب والإفلات ؛ بينما على مستوى التنفيذ التقني ، يحتاج المستخدمون فقط إلى تحديد نقطة جذب حمراء ونقطة هدف زرقاء ، و AI will يتم نقل الجزء الدلالي من الصورة المقابل للنقطة الحمراء إلى موضع النقطة الزرقاء لتحقيق تأثير تحرير السمات المكانية للصورة.

في الماضي ، طور بعض الأشخاص وظائف مماثلة ، ولكن عادةً ما تحتاج الصورة المراد تحريرها إلى أن تكون متشابكة ، وهناك افتراضات معينة حول ارتفاع الكائن - الصورة المحررة هي مجرد تشويه ثنائي الأبعاد للصورة الأصلية ، هناك لا يمكن إنشاء محتوى جديد.

يجب أن يكون دقيقًا ويولد المحتوى.لم تستخدم Pan Xingang نموذج الانتشار الأكثر سخونة حاليًا عند إجراء البحث التقني والحكم ، ولكنها اختارت تقنية شبكة المواجهة التوليدية. بادئ ذي بدء ، مساحة الصورة الموصوفة بواسطة GAN مستمرة للغاية ، وأكثر استمرارية بكثير من نموذج الانتشار ؛ ثانيًا ، المساحة الكامنة لجهة اتصال GAN مناسبة جدًا لتحرير السمات.

مع مزيد من التطوير لأبحاث فريق Pan Xingang ، فقد دعموا التحرير متعدد النقاط على الأساس الأصلي ، والذي يمكن أن يغير وضع الأشياء في الصورة ، أو إعادة تصميم شكل السيارة ، أو تغيير منظور السيارة ، لذلك أن القطة تفتح عينًا واحدة وتغلق عينًا ، وتغير تسريحة شعر الصورة أو تعبيرها أو الموقف أو طول الملابس ، بحيث يمكن للمستخدمين تحرير الصورة بشكل أكثر ملاءمة ، وحتى إكمال إنشاء محتوى الفيديو بهذه الطريقة.

في الوقت الحالي ، تم فتح هذا العمل على GitHub وحصل على 32000 نجمة.

في المستقبل ، يمثل الجمع بين نموذج GAN ونموذج الانتشار رؤية Pan Xingang للعمل الجاري - ليس فقط قدرة توليد نموذج الانتشار ، ولكن أيضًا مزايا GAN في تحرير الصور ، وقد يكون من الممكن أيضًا تطبيق هذه القدرات بالنسبة للفيديو والمحتوى ثلاثي الأبعاد ورباعي الأبعاد ، سيكون AIGC المستقبلي أكثر ذكاءً وأسهل في الاستخدام.

** Joinrealm.ai Congxing Cai: أنشئ شبكة اجتماعية قائمة على AIGC **

يحلم Congxing Cai من موقع Joinrealm.ai بأن يكون شبكة اجتماعية لـ AIGC.

انضم إلى Snapchat في عام 2016 تقريبًا وكان مسؤولاً عن تطوير منتجات مقاطع الفيديو القصيرة في الشركة.لقد شهد Cai Congxing فترة تطوير فائقة السرعة لصناعة الفيديو القصير. وبعد أن أصبح TikTok منتجًا استثنائيًا في الخارج دون أي نزاع ، كان لدى Cai Congxing أفكار أخرى:

"نشعر أنه على مسار محتوى الفيديو القصير المثمر ، تحرك الجميع بالفعل في اتجاه معين ؛ وفي المستقبل ، في مجال إنشاء الفيديو ، ستحقق الصناعة بالتأكيد تقدمًا جديدًا."

لذلك أسس Congxing Cai وأصدقاؤه موقع Joinrealm.ai.

يعتقد Cai Congxing أن AIGC هو مفهوم واسع ومجرّد بشكل خاص ، وأن اتجاه Joinrealm.ai هو أساسًا في الوسط بين "توفير API مباشرة" و "إكمال ابتكار التفاعل بين الإنسان والحاسوب" - استكشاف نموذج الأعمال من إنشاء المحتوى.

"لماذا يعد وضع إنشاء المحتوى مهمًا؟ بناءً على ملاحظتنا لمقاطع الفيديو القصيرة في السنوات العشر الماضية ، فإن التغيير الكبير يرجع في الواقع إلى ظهور الكاميرات الذكية. إن شعبية الكاميرات الذكية ، إلى حد كبير ، ليست كذلك فقط بدلاً من منح الجميع هاتفًا محمولاً ، فقد وفرت للعالم مليارات من البنية التحتية للجوّال ".

من "الكلمة" إلى "القصة" هو المفتاح الأساسي لريادة الأعمال في Joinrealm.ai - بمساعدة الذكاء الاصطناعي ، يمكن للمستخدمين تقديم المحتوى في أذهانهم كصور ، تمامًا مثل "كاميرا التفكير".

لتحقيق هذا التأثير ، اكتشف Cai Congxing في استكشاف Joinrealm.ai أنه لا يزال هناك العديد من المشكلات التي يتعين حلها:

بادئ ذي بدء ، لا تزال هناك اختلافات مع اللغة الطبيعية - في التحليل النهائي ، لا تزال لغة برمجة يصعب على الجمهور فهمها بشكل حدسي. لا يزال يتعين على المستخدمين المرور بالعديد من خطوات "try-fail-try" لإنشاء المحتوى الذي يريدونه ؛

ثانيًا ، لا يزال النموذج الأساسي غير قادر على تلبية احتياجات مستخدمي AIGC بشكل كامل اليوم ، وبأخذ الانتشار المستقر كمثال ، ربما تكون نسبة المستخدمين الجدد الذين يرغبون في مشاركة المحتوى الذي تم إنشاؤه أقل من 20٪ اليوم ؛

يعد الافتقار إلى المفاهيم التي يمكن تحسينها من قبل المستخدمين أول مشكلة رئيسية تواجه AIGC في الوقت الحالي.من الصعب على المستخدمين التحكم في توليد الذكاء الاصطناعي من خلال مجموعة من المفاهيم المحددة ، كما أنه من الصعب التحكم بمفاهيمهم الخاصة. "رواية القصص" ؛

أخيرًا ، هو توازن الكفاءة بين نتائج توليد الصور والتكلفة.كيفية إنشاء محتوى عالي الجودة بنطاق سعري أقل هي أيضًا مشكلة لا يمكن تجاهلها من قبل AIGC في الوقت الحالي.

من أجل مواجهة هذه التحديات ، التقى Cai Congxing وفريقه بما يقرب من مائة من منشئي الذكاء الاصطناعي المؤثرين ووجدوا أن معظم أساليب الإنتاج الخاصة بهم فريدة ونادرًا ما تكون متشابهة ، ويستخدمون جميعًا عددًا كبيرًا من الأدوات للتصحيح والتعديل بشكل مستمر.

في النهاية ، قرر موقع Joinrealm.ai إكمال الترقية في ثلاث نقاط رئيسية بعد البحث والحكم:

الأول هو سلسلة الأدوات ، التي تجعل تجربة المستخدم أفضل من خلال استكمال تحسين واجهة المستخدم ؛

والثاني هو السماح للمستخدمين ببناء الضبط الدقيق الخاص بهم. على سبيل المثال ، باستخدام وصف "I" ، يمكن للمنتج إنشاء الصورة التي يريدونها بشكل أكثر دقة بناءً على صورة المستخدم الخاصة.

والثالث هو بناء مجتمع بنفسك ، بحيث يمكن للمستخدمين الحصول على مزيد من التدريس والإلهام في المجتمع.

** مناقشة مائدة مستديرة: AIGC "الانطلاق إلى العالمية" **

عمل وانج تونج ، مؤسس مجتمع Help & Grow في سنغافورة ، كمنسق للمناقشة وناقش الأمر مع Cai Congxing ، مؤسس شركة Joinrealm.ai ، و Ding Ning ، كبير موظفي التكنولوجيا في Lychee Group ، و Wu Pengcheng ، كبير الباحثين في جامعة Nanyang Technological University ومؤسس شركة Deepir Inc. ، ولانغ جون ، مدير مركز خوارزمية نشر الألعاب في تينسنت لما وراء البحار الموضوع الساخن الحالي لـ AIGC والمحتوى التوليدي.

هل من الأسهل أن يهبط نموذج AIGC التجاري في حقل To B أو في حقل To C؟ تصور الضيوف موطئ قدم المستقبل بناءً على تجربتهم الخاصة.

يعتقد Lang Jun أن To B ليس من السهل القيام به ، لأن الحل يحتاج إلى أن يتم تجريده وصقله بناءً على حالات فعلية مختلفة متعددة.من حيث To C ، يمكن أن يساعد العديد من لاعبي اللعبة على الاندماج بسرعة في اللعبة عند تشغيل اللعبة. لعبة. عند العمل على الخوارزمية داخليًا ، سيحكم Lang Jun والفريق أيضًا باستمرار على نوع النموذج الذي يمكن أن يعمق مشهد هبوط AIGC بشكل أفضل.

قال Wu Pengcheng أن لكل من To B و To C فرصًا ، ولكن يجب أن تكون شركة To C. لقد جمع بين كاميرا Miaoya ، ونظارات Apple VR ، والبث المباشر الرقمي للإنسان وغيرها من الشركات التي حققت إنجازات على مستوى ToC هذا العام ، مؤكداً أن AIGC To C ستولد العديد من التطبيقات المثيرة للاهتمام.

يعتقد Ding Ning أن تسويق AIGC لا يزال في مرحلة مبكرة ، وعلى الرغم من وجود بعض الشركات التي أخذت زمام المبادرة في تحقيق الإنجازات ، إلا أن معظمها لا يزال في الطريق. وشدد بشكل خاص على أنه بالنسبة لرواد الأعمال في مجال التكنولوجيا ، لا ينبغي لهم فقط الانغماس في لمسة التكنولوجيا ، ولكن يجب عليهم أيضًا مراعاة احتياجات المستخدمين ونقاط الألم لديهم بشكل أكبر. فيما يتعلق بتنفيذ To B و To C ، قال إن To B لديها سوق كبير وتحتاج إلى إمكانات وموارد ، بينما To C لديها منافسة كبيرة وتتطلب إحساسًا قويًا بالسوق والقدرة على تشغيل المجتمع. واعدة في المستقبل.

فيما يتعلق بسفر AIGC إلى الخارج والعولمة ، تبادل العديد من الضيوف تجاربهم.

لاحظ لانغ جون أن الفريق المحلي يتمتع بميزة موهبة كثيفة للغاية ، وقنوات فعالة لمشاركة المعرفة ، واهتمام قوي بصناعة الإنترنت ، وفي الواقع ، لا توجد موارد كثيرة لهذا التخصيص في الخارج. وشدد على أن AIGC ليس لديها حاليًا نموذج عمل ناضج بشكل خاص ، لذا فإن أي شخص لديه قدرة أفضل على الجمع بين الموارد من المرجح أن "ينفد".

يعتقد Ding Ning أنه عندما تسافر AIGC إلى الخارج ، يجب عليها أولاً الخروج وخفض رقمها. ليس بالضرورة أن تحقق مستوى معينًا من المنتج. وهو يدرك أنه من الصعب النجاح في السوق مرة واحدة في غضون 2 إلى 3 سنين. وأضاف أنه من المهم جدا احترام السوق الخارجية ، فهناك اختلافات كبيرة في الثقافة واللغة والقوانين واللوائح ، ومن الضروري أن يكون هناك فهم واضح للسوق المحلي.

يعتقد Wu Pengcheng أن هناك فرصة كبيرة لـ AIGC للذهاب إلى الخارج. فمن ناحية ، يمكن استخدام التكنولوجيا الصينية في الخارج ؛ من ناحية أخرى ، الدول الأجنبية لديها أيضًا احتياجات محلية. قيمة. في الوقت نفسه ، يجب أيضًا اعتبار أن الذهاب إلى البحر ليس سوى الخطوة الأولى ، ومن الضروري أيضًا التفكير في كيفية السفر إلى الخارج بشكل أفضل.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت