من توليف الفيديو إلى تحرير الموسيقى التصويرية ، يتم تنفيذ كل شيء بواسطة AI: ظهر المقطع الدعائي لأول فيلم خيال علمي بالذكاء الاصطناعي "Genesis" بشكل صادم
في اليومين الماضيين ، انتشر مقطع دعائي لفيلم خيال علمي بعنوان "Trailer: Genesis" ("Genesis") ، ومدته أقل من دقيقة ، على وسائل التواصل الاجتماعي.
القفز للمشاهدة
هل هو خيال علمي جدا؟ ما هو أكثر من "الخيال العلمي" هو أنه ** من توليف الصور والفيديو والموسيقى إلى التحرير ، كل شيء يتم بواسطة AI **.
يسرد المنتج Nicolas Neubert أدوات الذكاء الاصطناعي المقابلة ، حيث يعالج ** Midjourney الصور ويعالج Runway مقاطع الفيديو ويعالج Pixabay الموسيقى ويحرر CapCut مقاطع الفيديو **.
Midjourney هي قطعة أثرية مألوفة للرسم بالذكاء الاصطناعي ، وقد تم تحديثها إلى الإصدار 5.2. Runway هي أداة إنتاج فيديو تعتمد على الذكاء الاصطناعي ، والجيل 2 متاح حاليًا للتجربة المجانية. أداة التحرير CapCut مجانية للجميع ، ولكن يمكنك أيضًا اختيار التعديل في Adobe Premier أو Final Cut Pro.
* تويتر @ iamneubert *
من المعلوم أن Neubert قضى 7 ساعات ، وأنتج Midjourney 316 مطالبة ، وقام بتكبير 128 صورة ، وأنتج Runway 310 مقطع فيديو ، وفيديو مع نص ، وتم استخدام 44 مقطع فيديو في المقطع الدعائي.
اليوم ، كتب Neubert حتى مقالًا طويلًا ، يشرح بالتفصيل عملية إنتاج "Genesis" ، بما في ذلك العملية المحددة وكيفية استخدام أدوات الذكاء الاصطناعي المذكورة أعلاه. دعونا نلقي نظرة عليهم واحدة تلو الأخرى.
وعن فكرة الفيلم ، قال إن فكرة ثيمته البائسة جاءت من عدة أفلام شاهدها ، وكتب قصة مبنية عليها.
** الخطوة الأولى في الإنتاج الرسمي هي بناء العالم والقصة **.
بالنسبة لقصة سفر التكوين للمقطورة ، أراد Neubert زيادة التوتر خطوة بخطوة. لذلك يتم تحديد المراحل الثلاث التالية:
إعداد المشهد
إدخال التهديدات
ذروة في CTA
على وجه التحديد ، عمل Neubert على المسودة الأولى لنسخة المقطع الدعائي ، والتي تضمنت "Share It All و Live the Consequences و Call Humanity to Action".
بعد أن حدد بالتالي النغمة العامة ، شرع في إنشاء مشاهد حول هذه الموضوعات. قام Neubert بالتمرير عبر العديد من المقاطع البشرية والخيال العلمي حول موضوعات البيئات والتكنولوجيا العسكرية والقتال ، واستخلص قصة منها جميعًا.
ولإضافة بعض العمق أيضًا ، أضاف لقطات لثلاثة أطفال مع تمائم متوهجة ، ملمحًا إلى قصة أعمق.
** الخطوة الثانية هي إنشاء صور متتالية في Midjourney **.
انتبه بشكل خاص للتلميح () هنا. قام Neubert بتحسين إشارات التثبيت التي حصل عليها في المنشورات السابقة لإنشاء قالب حتى يتمكن من إعادة استخدامه لكل لقطة في المقطورة. النموذج كما يلي:
\ _ \ _ \ _ \ _ \ _ \ _ \ _ \ _ \ _ \ _ \ _ ، حرب النجوم ، على غرار مشاهد الحشد المفصلة ، الطبيعة الترابية ، البط البري والأصفر ، frostpunk ، المشاهد الداخلية ، cinestill 50d - ar 21 : 9 - النمط الأصلي
لكل مشهد ، كان يملأ الفراغات بالمشهد الذي يريده ، مع التأكد من أن الرموز الأخرى تحافظ على أقصى استمرارية للموضوع واللون والإضاءة.
بالإضافة إلى ذلك ، يؤدي استخدام ميزة التغييرات القوية (القوية) إلى تسهيل إنشاء مشاهد مختلفة مع الاحتفاظ بلوحة الألوان السابقة. يمكن تحويل مشهد محاربة إلى مشهد مواطن عادي ، أو متسلل إلكتروني ، أو قتال دون توليد مطالبات جديدة.
** الخطوة الثالثة هي إنشاء صورة متحركة في Runway **.
وجد Neubert أن هذه الخطوة هي الأسهل. أثناء الإعداد ، يحاول دائمًا تنشيط وضع Upscaled. ومع ذلك ، غالبًا ما يواجه هذا الوضع مشاكل مع الوجوه ، لذلك بالنسبة للقطات الشخصية ، يستخدم عادةً جودة قياسية.
تجدر الإشارة إلى أنه بدلاً من استخدام مجموعة من المطالبات النصية ومطالبات الصور ، قام بسحب الصورة وإسقاطها وإعادة إنشائها حتى حصل على النتيجة التي كان راضيًا عنها.
** الخطوة الأخيرة هي التحرير اللاحق في CapCut **.
بينما يولد Midjourney و Runway إنتاجًا ، يبدأ Neubert بوضع المشاهد الرئيسية التي يعرف أنها ستلعب دورًا كبيرًا. بقدر ما يذهب المقطورة ، يعتقد أن اللقطات الخارجية ستكون الافتتاحية.
ثم ابدأ في تخطيط النص. من الممكن ألا توجد مقاطع في المخطط الزمني عندما يتم وضع النص وفقًا للموسيقى. في أقل من ساعة ، قام بتجميع المحتوى وفقًا للجدول الزمني وثبت الموقع. يعد هذا أمرًا رائعًا لإنشاء الصور حيث تحتاج إلى نقطة ثابتة إضافية لحساب المشاهد التي لا تزال مفقودة.
تصبح الخطوات المحددة بسيطة للغاية ، قم بإنشاء مقاطع ← اسحبها إلى CapCut ← ضعها على الخط الزمني ، وقم بتجميع القصة ببطء. كما قام أيضًا بمطابقة ألوان 2 أو 3 حزم تحرير لجعلها تبدو أشبه بمجموعات أفلام كبيرة.
المهارة الوحيدة المطلوبة لاستخدام CapCut هي مزامنة المقاطع بسرعة. عندما يظهر "BWAAA" في الموسيقى ، فإنه يحاول دائمًا ربط الحدث داخل المقطع أو ترتيب المقاطع التالية. هذا يجعل التسلسل بأكمله يبدو أكثر غامرة.
بالإضافة إلى ذلك ، فكر نيوبيرت في كيفية دمج الكثير من الحركة في المقطع. هنا يستخدم حيلتين لإضافة الحركة.
الحيلة الأولى: يأخذ Runway صورة ويحسب الأجزاء التي يجب تحريكها بناءً على النموذج. قام بعكس هندسة هذه الفكرة ، محاولًا إخراج الصور في Midjourney التي اقترحت الحركة. هذا يعني أنه يمكن إضافة ضبابية الحركة إلى لقطات أو صور ثابتة لرؤوس متحركة أو يمكن التقاط صور لأشخاص.
النصيحة الثانية: عندما تقوم بتحليل فيديو Runway ، ستجد أنه في المقطع الذي تبلغ مدته 4 ثوانٍ ، غالبًا ما يتغير المشهد بشكل كبير. لذلك في مشهد المقطورة ، استخدم فقط 4 ثوانٍ كاملة مرتين. جميع المقاطع الأخرى يتراوح طولها بين 0.5 و 2 ثانية وتسريع المقاطع بعامل 1.5-3. والسبب في ذلك هو أنك كمشاهد ترى مقطعًا قصيرًا فقط وبالتالي ترى المزيد من الحركة في المشهد ، مما يؤدي بشكل أساسي إلى إعادة توجيه هذا الجزء بسرعة.
بعد بعض العمليات ، ما قدمناه أخيرًا للجميع هو مقطورة "جينيسيس" الصادمة في البداية. تلقى المقطع الدعائي أيضًا تقييمات رائعة ، حيث قال البعض إنه كان أفضل مقطع فيديو شاهدوه حتى الآن.
في الواقع ، بعد أن أصبح Runway Gen-2 متاحًا للتجربة المجانية ، فتح العديد من مستخدمي الإنترنت عقولهم ودمجوها مع Midjourney ليبدعوا بجرأة.
** Midjourney + Runway: مزيج سحري من أدوات إنشاء الذكاء الاصطناعي **
فيما يلي بعض حالات استخدام الأجيال الأخرى لمشاركتها معك.
كما أن فهم المدرج لتفاصيل حركات الشخصية دقيق نسبيًا. في فيديو مستخدم الإنترنت Shencheng ، يمكن ملاحظة أن تفاصيل عيون الشخصيات تجعل الفيديو الديناميكي أكثر حيوية ، ويمكن القول أيضًا أنها تضيف القليل من "مهارات التمثيل".
مصدر:
بعد تحرك الصورة تكون حركات الرجل والحصان في الليل طبيعية جدًا ، وهناك مساحة أكبر لتخيل الشخصيات وحتى إجراءات المتابعة.
مصدر:
يبدو الجمع بين Midjourney و Runway لا يقهر ، ويمكن أن يصور إحساسًا مناسبًا للقصة في الإجراءات الرئيسية للشخصيات.
* تويتر:ai \ _insight1 *
هناك أيضًا بعض الاختلافات الأكثر ثراءً وإبداعًا في تحقيق النتائج.
* تويتر @ kkuldar *
* تويتر: @ Akashi30eth *
يستخدم بعض مستخدمي الإنترنت أيضًا سلسلة من أدوات الذكاء الاصطناعي لإنشاء مقاطع فيديو ، ولكن يبدو أن النتائج غير مرضية.
يستخدم مستخدم Twitternickfloats ChatGPT لكتابة البرامج النصية ، و Midjourney لإنشاء الصور ، و Runway لإنشاء مقاطع الفيديو ، و Triniti لإنشاء الموسيقى ، و Eleven Labs AI للدبلجة ، ويتم دمج المقاطع معًا ببساطة دون تعديلات أخرى.
* نص مكتوب بواسطة ChatGPT *
سجل مستخدمو الإنترنت العملية الكاملة للإنتاج الخاص بهم ، وأرادوا معرفة المدة التي سيستغرقها استخدام الذكاء الاصطناعي لعمل إعلانات تجارية قصيرة.
علق مستخدم الإنترنت هذا على نتائج هذا الفيلم القصير بـ "الإعلان مقرف". في هذا الإعلان ، تكون حركات الشخصيات صلبة ، والعلاقة المنطقية للصورة ليست قوية ، ومن الصعب إبراز الموضوع الذي يتم التعبير عنه ككل. يبدو أن تعاون منظمة العفو الدولية ليس له مفاجآت ، ولكن المزيد من "المخاوف".
بالمقارنة مع "جينيسيس" ، فإن هذا الفيلم التجاري القصير يبلغ نصف طوله ، لكنه يستغرق القليل من الوقت. واحدة من أكبر الاختلافات في تفاصيل المشاركة البشرية. يفتقر إلى الموضوعات المدروسة بعناية ، والتعديلات المتماسكة ، والاهتمام بالتفاصيل.
إذا كان يُسمح فقط للذكاء الاصطناعي بالمشاركة ، أو فقط لإنتاج أعمال تعتمد على توليد الذكاء الاصطناعي ، فمن الواضح أنه من غير الممكن إنتاج نتائج عالية الجودة. إن تطبيقها وتعديلها من قبل البشر هو الذي يبدو أنه يكشف عن القيمة الحقيقية لهذه الأدوات.
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
من توليف الفيديو إلى تحرير الموسيقى التصويرية ، يتم تنفيذ كل شيء بواسطة AI: ظهر المقطع الدعائي لأول فيلم خيال علمي بالذكاء الاصطناعي "Genesis" بشكل صادم
المصدر: قلب الآلة
المؤلف: ** Du Wei، Zewen **
في اليومين الماضيين ، انتشر مقطع دعائي لفيلم خيال علمي بعنوان "Trailer: Genesis" ("Genesis") ، ومدته أقل من دقيقة ، على وسائل التواصل الاجتماعي.
القفز للمشاهدة
هل هو خيال علمي جدا؟ ما هو أكثر من "الخيال العلمي" هو أنه ** من توليف الصور والفيديو والموسيقى إلى التحرير ، كل شيء يتم بواسطة AI **.
يسرد المنتج Nicolas Neubert أدوات الذكاء الاصطناعي المقابلة ، حيث يعالج ** Midjourney الصور ويعالج Runway مقاطع الفيديو ويعالج Pixabay الموسيقى ويحرر CapCut مقاطع الفيديو **.
Midjourney هي قطعة أثرية مألوفة للرسم بالذكاء الاصطناعي ، وقد تم تحديثها إلى الإصدار 5.2. Runway هي أداة إنتاج فيديو تعتمد على الذكاء الاصطناعي ، والجيل 2 متاح حاليًا للتجربة المجانية. أداة التحرير CapCut مجانية للجميع ، ولكن يمكنك أيضًا اختيار التعديل في Adobe Premier أو Final Cut Pro.
من المعلوم أن Neubert قضى 7 ساعات ، وأنتج Midjourney 316 مطالبة ، وقام بتكبير 128 صورة ، وأنتج Runway 310 مقطع فيديو ، وفيديو مع نص ، وتم استخدام 44 مقطع فيديو في المقطع الدعائي.
اليوم ، كتب Neubert حتى مقالًا طويلًا ، يشرح بالتفصيل عملية إنتاج "Genesis" ، بما في ذلك العملية المحددة وكيفية استخدام أدوات الذكاء الاصطناعي المذكورة أعلاه. دعونا نلقي نظرة عليهم واحدة تلو الأخرى.
** الخطوة الأولى في الإنتاج الرسمي هي بناء العالم والقصة **.
بالنسبة لقصة سفر التكوين للمقطورة ، أراد Neubert زيادة التوتر خطوة بخطوة. لذلك يتم تحديد المراحل الثلاث التالية:
على وجه التحديد ، عمل Neubert على المسودة الأولى لنسخة المقطع الدعائي ، والتي تضمنت "Share It All و Live the Consequences و Call Humanity to Action".
بعد أن حدد بالتالي النغمة العامة ، شرع في إنشاء مشاهد حول هذه الموضوعات. قام Neubert بالتمرير عبر العديد من المقاطع البشرية والخيال العلمي حول موضوعات البيئات والتكنولوجيا العسكرية والقتال ، واستخلص قصة منها جميعًا.
ولإضافة بعض العمق أيضًا ، أضاف لقطات لثلاثة أطفال مع تمائم متوهجة ، ملمحًا إلى قصة أعمق.
انتبه بشكل خاص للتلميح () هنا. قام Neubert بتحسين إشارات التثبيت التي حصل عليها في المنشورات السابقة لإنشاء قالب حتى يتمكن من إعادة استخدامه لكل لقطة في المقطورة. النموذج كما يلي:
لكل مشهد ، كان يملأ الفراغات بالمشهد الذي يريده ، مع التأكد من أن الرموز الأخرى تحافظ على أقصى استمرارية للموضوع واللون والإضاءة.
بالإضافة إلى ذلك ، يؤدي استخدام ميزة التغييرات القوية (القوية) إلى تسهيل إنشاء مشاهد مختلفة مع الاحتفاظ بلوحة الألوان السابقة. يمكن تحويل مشهد محاربة إلى مشهد مواطن عادي ، أو متسلل إلكتروني ، أو قتال دون توليد مطالبات جديدة.
وجد Neubert أن هذه الخطوة هي الأسهل. أثناء الإعداد ، يحاول دائمًا تنشيط وضع Upscaled. ومع ذلك ، غالبًا ما يواجه هذا الوضع مشاكل مع الوجوه ، لذلك بالنسبة للقطات الشخصية ، يستخدم عادةً جودة قياسية.
تجدر الإشارة إلى أنه بدلاً من استخدام مجموعة من المطالبات النصية ومطالبات الصور ، قام بسحب الصورة وإسقاطها وإعادة إنشائها حتى حصل على النتيجة التي كان راضيًا عنها.
** الخطوة الأخيرة هي التحرير اللاحق في CapCut **.
بينما يولد Midjourney و Runway إنتاجًا ، يبدأ Neubert بوضع المشاهد الرئيسية التي يعرف أنها ستلعب دورًا كبيرًا. بقدر ما يذهب المقطورة ، يعتقد أن اللقطات الخارجية ستكون الافتتاحية.
ثم ابدأ في تخطيط النص. من الممكن ألا توجد مقاطع في المخطط الزمني عندما يتم وضع النص وفقًا للموسيقى. في أقل من ساعة ، قام بتجميع المحتوى وفقًا للجدول الزمني وثبت الموقع. يعد هذا أمرًا رائعًا لإنشاء الصور حيث تحتاج إلى نقطة ثابتة إضافية لحساب المشاهد التي لا تزال مفقودة.
تصبح الخطوات المحددة بسيطة للغاية ، قم بإنشاء مقاطع ← اسحبها إلى CapCut ← ضعها على الخط الزمني ، وقم بتجميع القصة ببطء. كما قام أيضًا بمطابقة ألوان 2 أو 3 حزم تحرير لجعلها تبدو أشبه بمجموعات أفلام كبيرة.
المهارة الوحيدة المطلوبة لاستخدام CapCut هي مزامنة المقاطع بسرعة. عندما يظهر "BWAAA" في الموسيقى ، فإنه يحاول دائمًا ربط الحدث داخل المقطع أو ترتيب المقاطع التالية. هذا يجعل التسلسل بأكمله يبدو أكثر غامرة.
بالإضافة إلى ذلك ، فكر نيوبيرت في كيفية دمج الكثير من الحركة في المقطع. هنا يستخدم حيلتين لإضافة الحركة.
النصيحة الثانية: عندما تقوم بتحليل فيديو Runway ، ستجد أنه في المقطع الذي تبلغ مدته 4 ثوانٍ ، غالبًا ما يتغير المشهد بشكل كبير. لذلك في مشهد المقطورة ، استخدم فقط 4 ثوانٍ كاملة مرتين. جميع المقاطع الأخرى يتراوح طولها بين 0.5 و 2 ثانية وتسريع المقاطع بعامل 1.5-3. والسبب في ذلك هو أنك كمشاهد ترى مقطعًا قصيرًا فقط وبالتالي ترى المزيد من الحركة في المشهد ، مما يؤدي بشكل أساسي إلى إعادة توجيه هذا الجزء بسرعة.
بعد بعض العمليات ، ما قدمناه أخيرًا للجميع هو مقطورة "جينيسيس" الصادمة في البداية. تلقى المقطع الدعائي أيضًا تقييمات رائعة ، حيث قال البعض إنه كان أفضل مقطع فيديو شاهدوه حتى الآن.
** Midjourney + Runway: مزيج سحري من أدوات إنشاء الذكاء الاصطناعي **
فيما يلي بعض حالات استخدام الأجيال الأخرى لمشاركتها معك.
كما أن فهم المدرج لتفاصيل حركات الشخصية دقيق نسبيًا. في فيديو مستخدم الإنترنت Shencheng ، يمكن ملاحظة أن تفاصيل عيون الشخصيات تجعل الفيديو الديناميكي أكثر حيوية ، ويمكن القول أيضًا أنها تضيف القليل من "مهارات التمثيل".
بعد تحرك الصورة تكون حركات الرجل والحصان في الليل طبيعية جدًا ، وهناك مساحة أكبر لتخيل الشخصيات وحتى إجراءات المتابعة.
يبدو الجمع بين Midjourney و Runway لا يقهر ، ويمكن أن يصور إحساسًا مناسبًا للقصة في الإجراءات الرئيسية للشخصيات.
هناك أيضًا بعض الاختلافات الأكثر ثراءً وإبداعًا في تحقيق النتائج.
يستخدم بعض مستخدمي الإنترنت أيضًا سلسلة من أدوات الذكاء الاصطناعي لإنشاء مقاطع فيديو ، ولكن يبدو أن النتائج غير مرضية.
يستخدم مستخدم Twitternickfloats ChatGPT لكتابة البرامج النصية ، و Midjourney لإنشاء الصور ، و Runway لإنشاء مقاطع الفيديو ، و Triniti لإنشاء الموسيقى ، و Eleven Labs AI للدبلجة ، ويتم دمج المقاطع معًا ببساطة دون تعديلات أخرى.
سجل مستخدمو الإنترنت العملية الكاملة للإنتاج الخاص بهم ، وأرادوا معرفة المدة التي سيستغرقها استخدام الذكاء الاصطناعي لعمل إعلانات تجارية قصيرة.
بالمقارنة مع "جينيسيس" ، فإن هذا الفيلم التجاري القصير يبلغ نصف طوله ، لكنه يستغرق القليل من الوقت. واحدة من أكبر الاختلافات في تفاصيل المشاركة البشرية. يفتقر إلى الموضوعات المدروسة بعناية ، والتعديلات المتماسكة ، والاهتمام بالتفاصيل.
إذا كان يُسمح فقط للذكاء الاصطناعي بالمشاركة ، أو فقط لإنتاج أعمال تعتمد على توليد الذكاء الاصطناعي ، فمن الواضح أنه من غير الممكن إنتاج نتائج عالية الجودة. إن تطبيقها وتعديلها من قبل البشر هو الذي يبدو أنه يكشف عن القيمة الحقيقية لهذه الأدوات.