إن لعبة Super Large Cup Stable Diffusion متوفرة مجانًا! "أقوى نموذج مفتوح لرسم فنسنت" ، الكلمات السريعة هي أيضًا أبسط

المصدر: Qubit

أقوى نسخة من Stable Diffusion هنا!

الآن ، تم إصدار ** SDXL 1.0 رسميًا ** ، ويمكنك تجربته عبر الإنترنت مجانًا.

من حيث التأثير ، سواء كان فيلمًا حقيقيًا:

سريالية باندا شرب البيرة:

أو كاريكاتير السايبربانك ، كلاهما لطيف للغاية ~

وفقًا لـ Stability AI ، ينتج SDXL 1.0 ** ألوانًا أكثر وضوحًا ودقة ** ، مع تحسينات في التباين والضوء والظلال ، ويمكن أن ينتج صورًا ** 1 ميجا بكسل ** (1024 × 1024).

كما أنه يدعم التحرير اللاحق للصور التي تم إنشاؤها مباشرة على صفحة الويب.

(تنبعث منه رائحة القتال مع Midjourney و Firefly)

مستخدمو الإنترنت لا يسعهم إلا أن يجربوها ~

مقارنةً بالانتشار المستقر الأساسي ، ينتج SDXL 1.0 نتائج أكثر دقة وواقعية.

وقال المسؤول إن الكلمات السريعة يمكن أن تكون أبسط من ذي قبل.

وذلك لأن معلمات النموذج الأساسي لـ SDXL 1.0 وصلت إلى ** 3.5 مليار ** والقدرة على الفهم أقوى.

بالمقارنة مع الإصدار الأساسي من Stable Diffusion ، يبلغ عدد المعلمات حوالي مليار فقط.

ونتيجة لذلك ، أصبح SDXL 1.0 أيضًا أحد أكبر ** نماذج الصور المفتوحة ** الحالية. حتى أن المسؤول قال بشكل مباشر إن هذا هو أفضل نموذج للصورة المفتوحة في العالم.

ليس هناك الكثير ليقوله ، فلنبدأ ~

** طباعة المسك على الخزف الأزرق والأبيض **

يعد SDXL 1.0 مناسبًا جدًا في التشغيل ، ويمكنك الإدخال مباشرة ، ويمكنك أيضًا التحقق من معلمات النمط والحجم من الأسفل.

الإعداد الافتراضي هو إنشاء 4 صور في المرة الواحدة. إذا لم تكن راضيًا ، يمكنك النقر فوق "علامة الجمع" أدناه للسماح لها بمواصلة الرسم.

وفقًا للمقدمة الرسمية ، بما أن الإصدار 1.0 من SDXL يمكنه إنتاج روائع ، فلا داعي لإضافة كلمة "تحفة" سريعة.

دعها تولد صورة على الطريقة اليابانية ، وأسلوب الرسم مناسب جدًا ، وتكون معالجة الضوء والظل أكثر طبيعية.

تسعينيات القرن الماضي ، صور متحركة منخفضة الدقة لزوجين يمشيان بعيدًا في الشارع ليلا

أو صورة منظر طبيعي؟ يمكن أن تكون خاطئة أيضًا.

حتى دع المسك يقف في فناء صيني ، وينظر إلى السماء ...

إيلون ماسك في قصر صيني قديم

أو هل اشتريت أبل؟

في "WWDC" ، رفع جهاز iPhone الجديد ليُظهر للناس ، محاطًا بالمراسلين والمعجبين (doge).

Elon Musk يطرح iPhone الجديد في WWDC

بالإضافة إلى أخبار البصل عن هذه الخيول القديمة ، فإن تأثير أعمال أسلوب الرسم جيد أيضًا.

الشكل الموجود على اليسار هو نمط حبر Qi Baishi ، بينما النمط الموجود على اليمين عبارة عن رسم كاريكاتوري.

左 إيلون ماسك يلقي خطابًا برسم بالحبر بأسلوب تشي بايشي إلى اليمين: إيلون ماسك فكاهي

بالإضافة إلى الرسم ، يمكنك أيضًا وضع الخيول القديمة في اليوان تشينغهوا.

مسك Elon على شكل بورسلين أزرق وأبيض من أسرة يوان

"قصص الخيول القديمة" الموضحة أعلاه سهلة الاستخدام نسبيًا.

ولكن من الناحية العملية ، فإن المنشعب لا يمتد بسبب الكلمات السريعة البسيطة ، وهو ما أكده أيضًا البيان الرسمي.

لكننا ما زلنا نريد أن نرى ، كيف سيبدو إذا استخدمنا واحدة أكثر تعقيدًا وصقلًا؟

وجدنا صورة نادرة لخيول عجوز يعمل كعامل إصلاح سيارات في الاتحاد السوفيتي أنشأه Midjourney ، وأعدنا إدخالها إلى MJ لجعلها واحدة جديدة.

أنشأ MJ ما يلي ، والذي استخدمناه لاختبار SDXL:

Elon Musk (这里 MJ 生成 的 是 رجل) يقف في غرفة العمل ، بأسلوب جماليات الآلات الصناعية ، deutscher werkbund ، صور مرتبة بشكل موحد ، السوفيت ، النيلي الفاتح والبرونز الداكن ، التصوير الفوتوغرافي الأمريكي الجديد بالألوان ، ملامح الوجه التفصيلية

النمط تمامًا كما توقعنا ، والتفاصيل ليست سيئة.

هناك صورة أخرى معقدة مثل النهاية ، والتي يتم إنشاؤها أيضًا بواسطة MJ بناءً على الأعمال السابقة ثم يتم تغذيتها إلى SDXL.

مسك إيلون يأكل الطعام مع عيدان تناول الطعام ، بأسلوب بيتر كولسون ، المعالجة المتقاطعة / المعالجة ، التصوير الفوتوغرافي للثقب ، تقليم الأعشاب ، جيمس تيسو ، ترانسافانجارديا ، قياس البقعة

يوجد على اليسار عمل SDXL ، وعلى اليمين الإصدار الأصلي من MJ ، يمكنك مقارنته.

تدعم الكلمات السريعة اللغة الصينية أيضًا ، ولكن يبدو أن النتائج ستميل إلى الأسلوب الوطني ، وقد تتأثر الدقة أيضًا.

على سبيل المثال ، بعد إدخال عبارة "نمر على شاطئ البحر" ، يتم تقديم فتاة من الطراز القومي عن طريق الخطأ.

لقد رأى الجميع التأثير ، فما مدى سرعة إنشاء SDXL للصور؟

بالنسبة للمستخدمين المجانيين ، يتم قضاء الوقت بشكل أساسي في الانتظار في قائمة الانتظار ، ولكنه لن ينتظر وقتًا طويلاً.

في 5.5 ثانية ، تم تقليل قائمة الانتظار من 160 إلى 99.

بالإضافة إلى إنشاء الصور ، يوفر SDXL أيضًا العديد من وظائف التحرير اللاحق.

على وجه التحديد ، يتضمن إزالة الخلفية ومعالجة التفاصيل وتوسيع الإطار وما إلى ذلك.

تتوفر هذه الوظائف بالفعل على منصة Clipdrop حيث يوجد SDXL ، ويمكن لـ SDXL نقل الصور التي تم إنشاؤها إلى الوحدة المقابلة بنقرة واحدة.

هنا نختار وظيفة إزالة الخلفية لإظهارها ، ويمكن ملاحظة أنه لا توجد عيوب تقريبًا في تفاصيل الحواف.

في الوقت الحالي ، لا تزال حصة الاستخدام المجاني لـ SDXL مرتفعة نسبيًا. بعد تسجيل الدخول ، يمكن لكل حساب إنشاء 400 بطاقة يوميًا (تحتاج إلى الانتظار).

الدفعة الشهرية هي 9 دولارات شهريًا ، والدفع السنوي يعادل 7 دولارات (حوالي 50 يوانًا) شهريًا ، بما في ذلك 1500 حصص SDXL يوميًا ، ولا داعي للوقوف في قائمة الانتظار.

ومع ذلك ، يبدو أن الأسعار في مناطق مختلفة مختلفة ، على سبيل المثال ، الدفعة السنوية في الأرجنتين هي 742 بيزو (حوالي 19.4 يوان أو 2.7 دولار أمريكي) في الشهر.

أيضًا ، نظرًا لأن الإصدار المدفوع هو في الواقع اشتراك Pro في منصة Clipdrop ، يتم أيضًا تضمين ميزات أخرى للنظام الأساسي.

بالإضافة إلى حسابات Pro ، هناك إصدارات API متاحة للمطورين (مع إمكانية الوصول إلى Stability AI و Amazon وما إلى ذلك).

** "الحد الأقصى للكأس" في نموذج الصورة المفتوحة **

في أحدث مدونة ، يقدم Stability AI مزيدًا من التفاصيل الفنية لـ SDXL 1.0.

أولاً ، يفتح النموذج آفاقًا جديدة في كل من الحجم والعمارة.

يستخدم بشكل مبتكر نموذجًا أساسيًا + نموذجًا للتكرير.

أحجام المعلمتين هي ** 3.5 مليار ** و ** 6.6 مليار ** على التوالي.

وهذا أيضًا يجعل SDXL 1.0 أحد ** أكبر نماذج الرسوميات المفتوحة ** المتاحة اليوم.

قال عماد مستقي ، مؤسس Stability AI ، إن عددًا أكبر من المعلمات يمكن أن يسمح للنموذج بفهم المزيد من المفاهيم وتعليمه أشياء أعمق.

في الوقت نفسه ، تم إجراء تحسين RLHF أيضًا في إصدار SDXL 0.9.

هذا هو السبب في أن SDXL 1.0 يدعم الآن المطالبات القصيرة ، ويمكنه التمييز بين المربع الأحمر والمربع الأحمر.

في عملية التوليف المحددة ، في الخطوة الأولى ، يولد النموذج الأساسي ضوضاء كامنة ، ثم يقوم النموذج المكرر بتقليل الضوضاء.

يمكن أيضًا استخدام النموذج الأساسي كوحدة نمطية مستقلة.

يمكن أن ينتج عن الجمع بين هذين النموذجين صور ذات جودة أفضل دون استهلاك المزيد من موارد الحوسبة.

وفقًا للمقدمة الرسمية ، يمكن تشغيل SDXL 1.0 على وحدة معالجة الرسومات (GPU) على مستوى المستهلك مع ذاكرة VRAM سعة 8 جيجابايت ، أو على السحابة.

بالإضافة إلى ذلك ، تم تحسين SDXL 1.0 أيضًا في الضبط الدقيق ، ويمكنه إنشاء LoRAs المخصصة أو نقاط التفتيش.

يقوم فريق Stability AI الآن أيضًا ببناء جيل جديد من عناصر التحكم المنظمة والمصممة والمشتركة الخاصة بمهمة محددة ، مع T2I / ControlNet خصيصًا لـ SDXL.

ومع ذلك ، لا تزال هذه الوظائف في مرحلة الاختبار التجريبي ، ويمكنك الانتباه إلى التحديثات الرسمية في المستقبل.

باختصار ، مخططات فنسنت هي عملية تكرارية تدريجية ، والهدف من SDXL 1.0 هو تسهيل هذه العملية.

قال موستاك إنه الآن هناك حاجة إلى 5-10 صور فقط لضبط النموذج بسرعة.

يمكن أيضًا أن نرى من ملاحظات المستخدمين أن SDXL 1.0 أكثر إرضاءً من الانتشار المستقر.

في الواقع ، منذ أبريل من هذا العام ، أصدرت Stability AI أول إصدار تجريبي من SDXL.

بدأ الاختبار الداخلي في يونيو ، وتم إطلاق الإصدار 0.9 منذ بعض الوقت ، وفي ذلك الوقت ، تم الإعلان عن إصدار مفتوح ، وهو أحدث إصدار 1.0 ، في يوليو. في الوقت الحالي ، تم إصدار أوزان الكود ذات الصلة على GitHub.

وقال الشخص المسؤول عن التعلم الآلي للذكاء الاصطناعي Stability AI أنه بالمقارنة مع SDXL 0.9 ، فإن الإصدار 1.0 يقلل من الطلب على قوة الحوسبة.

إذا كنت مهتمًا بأحذية الأطفال ، فجرّبها ~

دخول المحاكمة:

جيثب :

ارتباط مرجعي: [1] [2] [3]

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت