لا تخجل أداة التصوير التوليدي التي لم يتم طرحها من العُري والدماء ، وقد لفتت انتباه MidJourney.
الصور التي تم إنشاؤها باستخدام الذكاء الاصطناعي
اختبرت شركة OpenAI بشكل خاص إصدارًا جديدًا من نموذج التصوير التوليدي للذكاء الاصطناعي (AI) على مدار الأشهر القليلة الماضية ، وتظهر العينات المبكرة التي سربها مستخدم YouTube MattVidPro أن النموذج يتفوق على مولدات الصور السابقة.
قال مات في معاينة منشورة على YouTube: "مثير للغاية ، إنه يذهل عقول أي شيء رأيناه من قبل ، إنه مجنون. لا يستطيع Midjourney المنافسة على هذا المستوى ، ولا أعتقد حتى أن Midjourney الإصدار السادس يمكنه المنافسة في هذا مستوى."
لا تتوقع تجربته في أي وقت قريب. الوصول محدود للغاية.
من المحتمل أن يكون النموذج الذي لم يتم طرحه هو نسخة مطورة من DALL-E 2 ويتم اختباره عبر معاينة مدعوة داخل ChatGPT-4. قال مات إن حوالي 400 شخص فقط حول العالم يمكنهم الوصول إلى منشئ الصور OpenAI الجديد هذا.
على الرغم من أن عينات الصور محدودة ، إلا أن المهارات المتقدمة للذكاء الاصطناعي موضحة. ينتج صورًا حادة عن طريق محاكاة الإضاءة وانعكاسات الصور الحقيقية ، ويعيد النموذج إنتاج تفاصيل الرسام وصولاً إلى ضربات الفرشاة المرئية. كما أنه يعيد إنشاء الأسماء التجارية بشكل مثالي مثل "Snickers" وشعارات العلامات التجارية المعروفة مثل Subway على المنتجات التي تم إنشاؤها ، ويحقق تهجئة جيدة جدًا في النص المعروض.
مثال على صورة تم إنشاؤها بواسطة برنامج OpenAI's text-to-image. المصدر: مات فيدبرو
بينما يكافح منشئو الصور الحاليون لتحقيق أيدي متماسكة ، تُظهر هذه الأمثلة أيديًا واقعية ومتناسبة بشكل صحيح مع خلفيات أكثر إقناعًا من أنظمة الذكاء الاصطناعي المنافسة.
يبدو أن شركة OpenAI أزالت مرشحات الأمان الخاصة بها لاختبار الإمكانات الكاملة للنموذج. يقول المستخدمون إنه لا يتردد في إثارة العنف والعُري. ومع ذلك ، نظرًا لموقف OpenAI من محتوى NSFW ، فمن غير المرجح أن يتم إصدار نسخة عامة رسمية وفقًا لمثل هذه المعايير.
لاحظ مات ، "إنه OpenAI ، لذا يمكنك المراهنة على أنهم سيغلقونه كما فعلوا مع كل شيء قبل الإصدار."
انتقد بعض الخبراء شركة OpenAI "لتبسيطها" نماذجها لتجنب الجدل المحتمل. حتى أن بعض الدراسات أظهرت أن ChatGPT المدربة على OpenAI لديها تحيز سياسي قوي في نتاجها.
ومع ذلك ، فإن الجودة المتسقة الموضحة في العينات تمثل قفزة إلى الأمام ، وتؤكد جهود OpenAI المستمرة لتحسين قدرات الذكاء الاصطناعي التوليدي. قد تكشف الشركة عن المزيد من تقدمها في وقت لاحق من هذا العام ، خاصةً إذا كان مجال التعرف على الصور وإنشاءها يساهم في متانة منتجها النجمي: GPT متعدد الوسائط يمكنه فهم النصوص والصور والمسودات في موجه واحد —4.
في الوقت الحالي ، لا تزال التقنية مقتصرة على إصدار تجريبي مغلق مع عدد قليل جدًا من المستخدمين.
مع استمرار تحسين النماذج ، أصبحت الخطوط الفاصلة بين ما هو مصطنع وحقيقي أكثر ضبابية. في حين أن هذا يثير الكثير ، فإن المخاوف بشأن إساءة الاستخدام ستستمر ، ويظل بناء هذه التكنولوجيا بمسؤولية يمثل تحديًا ملحًا.
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
غير خاضعة للرقابة و "مجنون": نظرة داخل مولد الصور السرية لـ OpenAI
لا تخجل أداة التصوير التوليدي التي لم يتم طرحها من العُري والدماء ، وقد لفتت انتباه MidJourney.
الصور التي تم إنشاؤها باستخدام الذكاء الاصطناعي
اختبرت شركة OpenAI بشكل خاص إصدارًا جديدًا من نموذج التصوير التوليدي للذكاء الاصطناعي (AI) على مدار الأشهر القليلة الماضية ، وتظهر العينات المبكرة التي سربها مستخدم YouTube MattVidPro أن النموذج يتفوق على مولدات الصور السابقة.
قال مات في معاينة منشورة على YouTube: "مثير للغاية ، إنه يذهل عقول أي شيء رأيناه من قبل ، إنه مجنون. لا يستطيع Midjourney المنافسة على هذا المستوى ، ولا أعتقد حتى أن Midjourney الإصدار السادس يمكنه المنافسة في هذا مستوى."
لا تتوقع تجربته في أي وقت قريب. الوصول محدود للغاية.
من المحتمل أن يكون النموذج الذي لم يتم طرحه هو نسخة مطورة من DALL-E 2 ويتم اختباره عبر معاينة مدعوة داخل ChatGPT-4. قال مات إن حوالي 400 شخص فقط حول العالم يمكنهم الوصول إلى منشئ الصور OpenAI الجديد هذا.
على الرغم من أن عينات الصور محدودة ، إلا أن المهارات المتقدمة للذكاء الاصطناعي موضحة. ينتج صورًا حادة عن طريق محاكاة الإضاءة وانعكاسات الصور الحقيقية ، ويعيد النموذج إنتاج تفاصيل الرسام وصولاً إلى ضربات الفرشاة المرئية. كما أنه يعيد إنشاء الأسماء التجارية بشكل مثالي مثل "Snickers" وشعارات العلامات التجارية المعروفة مثل Subway على المنتجات التي تم إنشاؤها ، ويحقق تهجئة جيدة جدًا في النص المعروض.
مثال على صورة تم إنشاؤها بواسطة برنامج OpenAI's text-to-image. المصدر: مات فيدبرو
بينما يكافح منشئو الصور الحاليون لتحقيق أيدي متماسكة ، تُظهر هذه الأمثلة أيديًا واقعية ومتناسبة بشكل صحيح مع خلفيات أكثر إقناعًا من أنظمة الذكاء الاصطناعي المنافسة.
يبدو أن شركة OpenAI أزالت مرشحات الأمان الخاصة بها لاختبار الإمكانات الكاملة للنموذج. يقول المستخدمون إنه لا يتردد في إثارة العنف والعُري. ومع ذلك ، نظرًا لموقف OpenAI من محتوى NSFW ، فمن غير المرجح أن يتم إصدار نسخة عامة رسمية وفقًا لمثل هذه المعايير.
لاحظ مات ، "إنه OpenAI ، لذا يمكنك المراهنة على أنهم سيغلقونه كما فعلوا مع كل شيء قبل الإصدار."
انتقد بعض الخبراء شركة OpenAI "لتبسيطها" نماذجها لتجنب الجدل المحتمل. حتى أن بعض الدراسات أظهرت أن ChatGPT المدربة على OpenAI لديها تحيز سياسي قوي في نتاجها.
ومع ذلك ، فإن الجودة المتسقة الموضحة في العينات تمثل قفزة إلى الأمام ، وتؤكد جهود OpenAI المستمرة لتحسين قدرات الذكاء الاصطناعي التوليدي. قد تكشف الشركة عن المزيد من تقدمها في وقت لاحق من هذا العام ، خاصةً إذا كان مجال التعرف على الصور وإنشاءها يساهم في متانة منتجها النجمي: GPT متعدد الوسائط يمكنه فهم النصوص والصور والمسودات في موجه واحد —4.
في الوقت الحالي ، لا تزال التقنية مقتصرة على إصدار تجريبي مغلق مع عدد قليل جدًا من المستخدمين.
مع استمرار تحسين النماذج ، أصبحت الخطوط الفاصلة بين ما هو مصطنع وحقيقي أكثر ضبابية. في حين أن هذا يثير الكثير ، فإن المخاوف بشأن إساءة الاستخدام ستستمر ، ويظل بناء هذه التكنولوجيا بمسؤولية يمثل تحديًا ملحًا.