Неопублікований інструмент генеративної обробки зображень не цурається оголеного тіла та крові, і він привернув увагу MidJourney.
Зображення, створені за допомогою ШІ
Протягом останніх кількох місяців OpenAI приватно тестував нову версію своєї моделі створення зображень генеративного штучного інтелекту (ШІ), і перші зразки, оприлюднені користувачем YouTube MattVidPro, показують, що модель перевершує попередні генератори зображень.
У попередньому перегляді, опублікованому на YouTube, Метт сказав: «Дуже захоплююче, це вражає все, що ми бачили раніше, це божевілля. Midjourney не може конкурувати на такому рівні, я навіть не думаю, що Midjourney 6th edition може конкурувати на цьому рівень».
Однак не сподівайтеся спробувати це найближчим часом. Доступ надзвичайно обмежений.
Невипущена модель, ймовірно, є оновленою версією DALL-E 2 і тестується за допомогою попереднього перегляду в ChatGPT-4. Лише близько 400 людей у всьому світі мають доступ до цього нового генератора зображень OpenAI, сказав Метт.
Хоча зразки зображень обмежені, демонструються передові навички штучного інтелекту. Він створює чіткі зображення, імітуючи освітлення та відблиски справжніх фотографій, а модель відтворює художні деталі аж до видимих мазків. Він також чудово відтворює назви брендів, як-от «Snickers», і логотипи відомих брендів, як-от Subway, на згенерованих продуктах, а також досягає досить гарного написання у відтвореному тексті.
Приклад зображення, створеного за допомогою технології OpenAI. Джерело: Matt VidPro
У той час як сучасні генератори зображень намагаються досягти узгоджених рук, ці приклади показують реалістичні та правильно пропорційні руки з більш переконливим фоном, ніж конкуруючі системи ШІ.
OpenAI, очевидно, видалив свої фільтри безпеки, щоб перевірити весь потенціал моделі. Користувачі кажуть, що він без вагань створює сцени насильства та оголеного тіла. Однак, враховуючи позицію OpenAI щодо вмісту NSFW, дуже малоймовірно, що офіційна публічна версія буде випущена відповідно до таких стандартів.
Метт зауважив: «Це OpenAI, тож можна посперечатися, що вони збираються закрити його, як робили з усім до випуску».
Деякі експерти критикували OpenAI за «спрощення» своїх моделей, щоб уникнути потенційних суперечок. Деякі дослідження навіть показали, що навчений OpenAI ChatGPT має сильну політичну упередженість у своїх результатах.
Тим не менш, постійна якість, показана у зразках, є кроком вперед, і це підкреслює постійні зусилля OpenAI щодо вдосконалення можливостей генеративного ШІ. Пізніше цього року компанія може оприлюднити більше про свій прогрес, особливо якщо сфера розпізнавання та генерування зображень сприятиме надійності її зіркового продукту: мультимодального GPT, який може розпізнавати текст, зображення та чернетки в одній команді — 4.
Наразі технологія все ще обмежена закритою бета-версією з дуже невеликою кількістю користувачів.
Оскільки моделі продовжують вдосконалюватися, межі між штучним і справжнім стають все більш розмитими. Хоча це хвилює багатьох, занепокоєння з приводу неправильного використання залишаться, і відповідальне створення цієї технології залишається актуальною проблемою.
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Без цензури та «божевільний»: погляд усередину секретного генератора зображень OpenAI
Неопублікований інструмент генеративної обробки зображень не цурається оголеного тіла та крові, і він привернув увагу MidJourney.
Зображення, створені за допомогою ШІ
Протягом останніх кількох місяців OpenAI приватно тестував нову версію своєї моделі створення зображень генеративного штучного інтелекту (ШІ), і перші зразки, оприлюднені користувачем YouTube MattVidPro, показують, що модель перевершує попередні генератори зображень.
У попередньому перегляді, опублікованому на YouTube, Метт сказав: «Дуже захоплююче, це вражає все, що ми бачили раніше, це божевілля. Midjourney не може конкурувати на такому рівні, я навіть не думаю, що Midjourney 6th edition може конкурувати на цьому рівень».
Однак не сподівайтеся спробувати це найближчим часом. Доступ надзвичайно обмежений.
Невипущена модель, ймовірно, є оновленою версією DALL-E 2 і тестується за допомогою попереднього перегляду в ChatGPT-4. Лише близько 400 людей у всьому світі мають доступ до цього нового генератора зображень OpenAI, сказав Метт.
Хоча зразки зображень обмежені, демонструються передові навички штучного інтелекту. Він створює чіткі зображення, імітуючи освітлення та відблиски справжніх фотографій, а модель відтворює художні деталі аж до видимих мазків. Він також чудово відтворює назви брендів, як-от «Snickers», і логотипи відомих брендів, як-от Subway, на згенерованих продуктах, а також досягає досить гарного написання у відтвореному тексті.
Приклад зображення, створеного за допомогою технології OpenAI. Джерело: Matt VidPro
У той час як сучасні генератори зображень намагаються досягти узгоджених рук, ці приклади показують реалістичні та правильно пропорційні руки з більш переконливим фоном, ніж конкуруючі системи ШІ.
OpenAI, очевидно, видалив свої фільтри безпеки, щоб перевірити весь потенціал моделі. Користувачі кажуть, що він без вагань створює сцени насильства та оголеного тіла. Однак, враховуючи позицію OpenAI щодо вмісту NSFW, дуже малоймовірно, що офіційна публічна версія буде випущена відповідно до таких стандартів.
Метт зауважив: «Це OpenAI, тож можна посперечатися, що вони збираються закрити його, як робили з усім до випуску».
Деякі експерти критикували OpenAI за «спрощення» своїх моделей, щоб уникнути потенційних суперечок. Деякі дослідження навіть показали, що навчений OpenAI ChatGPT має сильну політичну упередженість у своїх результатах.
Тим не менш, постійна якість, показана у зразках, є кроком вперед, і це підкреслює постійні зусилля OpenAI щодо вдосконалення можливостей генеративного ШІ. Пізніше цього року компанія може оприлюднити більше про свій прогрес, особливо якщо сфера розпізнавання та генерування зображень сприятиме надійності її зіркового продукту: мультимодального GPT, який може розпізнавати текст, зображення та чернетки в одній команді — 4.
Наразі технологія все ще обмежена закритою бета-версією з дуже невеликою кількістю користувачів.
Оскільки моделі продовжують вдосконалюватися, межі між штучним і справжнім стають все більш розмитими. Хоча це хвилює багатьох, занепокоєння з приводу неправильного використання залишаться, і відповідальне створення цієї технології залишається актуальною проблемою.