Alat pencitraan generatif yang belum dirilis tidak menghindar dari ketelanjangan dan darah kental, dan itu menarik perhatian MidJourney.
Gambar dibuat dengan AI
OpenAI telah secara pribadi menguji versi baru model pencitraan kecerdasan buatan (AI) generatifnya selama beberapa bulan terakhir, dan sampel awal yang dibocorkan oleh pengguna YouTube MattVidPro menunjukkan model tersebut mengungguli generator gambar sebelumnya.
Matt berkata dalam pratinjau yang diposting di YouTube: "Sangat mengasyikkan, itu mengejutkan apa pun yang telah kita lihat sebelumnya, ini gila. Midjourney tidak dapat bersaing di level ini, saya bahkan tidak berpikir edisi ke-6 Midjourney dapat Bersaing di level ini tingkat."
Namun, jangan berharap untuk mencobanya dalam waktu dekat. Akses sangat terbatas.
Model yang belum dirilis kemungkinan merupakan versi upgrade dari DALL-E 2 dan sedang diuji melalui pratinjau yang diundang dalam ChatGPT-4. Hanya sekitar 400 orang di seluruh dunia yang memiliki akses ke generator gambar OpenAI baru ini, kata Matt.
Meskipun sampel gambar terbatas, keterampilan lanjutan kecerdasan buatan diperlihatkan. Ini menghasilkan gambar yang tajam dengan meniru pencahayaan dan pantulan foto asli, dan model mereproduksi detail yang sangat indah hingga sapuan kuas yang terlihat. Itu juga dengan sempurna membuat ulang nama merek seperti "Snickers" dan logo merek terkenal seperti Subway pada produk yang dihasilkan, dan mencapai ejaan yang cukup bagus dalam teks yang diberikan.
Contoh gambar yang dihasilkan oleh text-to-image OpenAI. Sumber: Matt VidPro
Sementara pembuat gambar saat ini berjuang untuk mencapai tangan yang koheren, contoh ini menunjukkan tangan yang realistis dan proporsional dengan latar belakang yang lebih meyakinkan daripada sistem AI pesaing.
OpenAI rupanya menghapus filter keamanannya untuk menguji potensi penuh model tersebut. Pengguna mengatakan tidak ragu untuk menghasilkan kekerasan dan ketelanjangan. Namun, mengingat sikap OpenAI pada konten NSFW, sangat tidak mungkin versi publik resmi akan dirilis sesuai dengan standar tersebut.
Matt mengamati, "Ini OpenAI, jadi Anda bisa bertaruh mereka akan mematikannya seperti yang mereka lakukan sebelum rilis."
Beberapa ahli mengkritik OpenAI karena "menyederhanakan" modelnya untuk menghindari potensi kontroversi. Beberapa penelitian bahkan menunjukkan bahwa ChatGPT yang dilatih OpenAI memiliki bias politik yang kuat dalam keluarannya.
Namun, kualitas konsisten yang ditunjukkan dalam sampel merupakan lompatan maju, dan ini menggarisbawahi upaya berkelanjutan OpenAI untuk meningkatkan kemampuan AI generatif. Perusahaan dapat mengungkapkan lebih banyak kemajuannya akhir tahun ini, terutama jika bidang pengenalan dan pembuatan gambar berkontribusi pada kekokohan produk unggulannya: GPT multimodal yang dapat memahami teks, gambar, dan draf dalam satu prompt— 4.
Untuk saat ini, teknologi tersebut masih sebatas closed beta dengan jumlah pengguna yang sangat sedikit.
Saat model terus berkembang, garis antara yang buatan dan yang nyata menjadi semakin kabur. Meskipun ini menggairahkan banyak orang, kekhawatiran tentang penyalahgunaan akan tetap ada, dan membangun teknologi ini secara bertanggung jawab tetap menjadi tantangan yang mendesak.
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Tanpa sensor dan 'Gila': Melihat ke Dalam Pembuat Gambar Rahasia OpenAI
Alat pencitraan generatif yang belum dirilis tidak menghindar dari ketelanjangan dan darah kental, dan itu menarik perhatian MidJourney.
Gambar dibuat dengan AI
OpenAI telah secara pribadi menguji versi baru model pencitraan kecerdasan buatan (AI) generatifnya selama beberapa bulan terakhir, dan sampel awal yang dibocorkan oleh pengguna YouTube MattVidPro menunjukkan model tersebut mengungguli generator gambar sebelumnya.
Matt berkata dalam pratinjau yang diposting di YouTube: "Sangat mengasyikkan, itu mengejutkan apa pun yang telah kita lihat sebelumnya, ini gila. Midjourney tidak dapat bersaing di level ini, saya bahkan tidak berpikir edisi ke-6 Midjourney dapat Bersaing di level ini tingkat."
Namun, jangan berharap untuk mencobanya dalam waktu dekat. Akses sangat terbatas.
Model yang belum dirilis kemungkinan merupakan versi upgrade dari DALL-E 2 dan sedang diuji melalui pratinjau yang diundang dalam ChatGPT-4. Hanya sekitar 400 orang di seluruh dunia yang memiliki akses ke generator gambar OpenAI baru ini, kata Matt.
Meskipun sampel gambar terbatas, keterampilan lanjutan kecerdasan buatan diperlihatkan. Ini menghasilkan gambar yang tajam dengan meniru pencahayaan dan pantulan foto asli, dan model mereproduksi detail yang sangat indah hingga sapuan kuas yang terlihat. Itu juga dengan sempurna membuat ulang nama merek seperti "Snickers" dan logo merek terkenal seperti Subway pada produk yang dihasilkan, dan mencapai ejaan yang cukup bagus dalam teks yang diberikan.
Contoh gambar yang dihasilkan oleh text-to-image OpenAI. Sumber: Matt VidPro
Sementara pembuat gambar saat ini berjuang untuk mencapai tangan yang koheren, contoh ini menunjukkan tangan yang realistis dan proporsional dengan latar belakang yang lebih meyakinkan daripada sistem AI pesaing.
OpenAI rupanya menghapus filter keamanannya untuk menguji potensi penuh model tersebut. Pengguna mengatakan tidak ragu untuk menghasilkan kekerasan dan ketelanjangan. Namun, mengingat sikap OpenAI pada konten NSFW, sangat tidak mungkin versi publik resmi akan dirilis sesuai dengan standar tersebut.
Matt mengamati, "Ini OpenAI, jadi Anda bisa bertaruh mereka akan mematikannya seperti yang mereka lakukan sebelum rilis."
Beberapa ahli mengkritik OpenAI karena "menyederhanakan" modelnya untuk menghindari potensi kontroversi. Beberapa penelitian bahkan menunjukkan bahwa ChatGPT yang dilatih OpenAI memiliki bias politik yang kuat dalam keluarannya.
Namun, kualitas konsisten yang ditunjukkan dalam sampel merupakan lompatan maju, dan ini menggarisbawahi upaya berkelanjutan OpenAI untuk meningkatkan kemampuan AI generatif. Perusahaan dapat mengungkapkan lebih banyak kemajuannya akhir tahun ini, terutama jika bidang pengenalan dan pembuatan gambar berkontribusi pada kekokohan produk unggulannya: GPT multimodal yang dapat memahami teks, gambar, dan draf dalam satu prompt— 4.
Untuk saat ini, teknologi tersebut masih sebatas closed beta dengan jumlah pengguna yang sangat sedikit.
Saat model terus berkembang, garis antara yang buatan dan yang nyata menjadi semakin kabur. Meskipun ini menggairahkan banyak orang, kekhawatiran tentang penyalahgunaan akan tetap ada, dan membangun teknologi ini secara bertanggung jawab tetap menjadi tantangan yang mendesak.