Baru saja SDXL 1.0 resmi dirilis, dan Anda bisa mencobanya secara online secara gratis.
Dalam hal efek, apakah itu blockbuster kehidupan nyata:
Bir Minum Panda Surreal:
Atau komik cyberpunk, keduanya sangat bagus~
Menurut Stability AI, SDXL 1.0 menghasilkan warna yang lebih hidup dan akurat, dengan peningkatan kontras, cahaya, dan bayangan, serta dapat menghasilkan gambar 1 megapiksel (1024×1024).
Ini juga mendukung pasca-pengeditan gambar yang dihasilkan langsung di halaman web.
(Baunya seperti perkelahian dengan Midjourney dan Firefly)
Netizen mau tidak mau mencobanya~
Dibandingkan dengan Difusi Stabil dasar, SDXL 1.0 memberikan hasil yang lebih akurat dan realistis.
Dan pejabat tersebut mengatakan bahwa kata-kata cepatnya bisa lebih sederhana dari sebelumnya.
Ini karena parameter model dasar SDXL 1.0 telah mencapai 3,5 miliar, dan kemampuan pemahamannya lebih kuat.
Dibandingkan dengan versi dasar Difusi Stabil, jumlah parameter hanya sekitar 1 miliar.
Hasilnya, SDXL 1.0 juga menjadi salah satu model gambar terbuka terbesar saat ini. Pejabat itu bahkan secara langsung mengatakan bahwa ini adalah model open image terbaik di dunia.
Tidak banyak bicara, mari kita mulai ~
Cetak Musk pada porselen biru dan putih
SDXL 1.0 sangat nyaman dalam pengoperasian, Anda dapat langsung memasukkan, dan Anda juga dapat memeriksa parameter gaya dan ukuran dari bawah.
Standarnya adalah menghasilkan 4 gambar sekaligus. Jika Anda tidak puas, Anda dapat mengklik "tanda tambah" di bawah untuk membiarkannya terus menggambar.
Menurut pengenalan resmi, sekarang SDXL 1.0 dapat menghasilkan mahakarya, tidak perlu menambahkan kata prompt "mahakarya".
Biar menghasilkan gambar ala Jepang, gaya lukisannya sangat cocok, dan pengolahan cahaya dan bayangan lebih natural.
Pasangan screengrab resolusi rendah anime 1990-an berjalan pergi di jalan pada malam hari
Atau foto pemandangan? Itu juga bisa salah.
Bahkan biarkan Musk berdiri di halaman Cina, menatap langit ...
Elon Musk di istana Tiongkok kuno
Atau apakah Anda membeli Apple?
Di "WWDC", dia mengangkat iPhone baru untuk menunjukkan kepada orang-orang, dikelilingi oleh reporter dan penggemar (doge).
Elon Musk merilis iPhone baru di WWDC
Selain berita bawang dari kuda-kuda tua ini, efek karya gaya lukisan juga bagus.
Yang di kiri adalah gaya tinta Qi Baishi, sedangkan yang di kanan adalah karikatur.
Selain melukis, Anda juga bisa memasukkan kuda tua ke dalam Yuan Qinghua kami.
Elon musk dalam bentuk Yuan Dynasty Blue and White Porcelain
"Cerita kuda tua" yang ditunjukkan di atas relatif mudah digunakan.
Namun dari efeknya, selangkangan tidak meregang karena kata-kata prompt yang sederhana, yang juga ditegaskan oleh pernyataan resmi.
Tapi kami masih ingin melihat, seperti apa jadinya jika kami menggunakan yang lebih kompleks dan halus?
Kami menemukan foto langka seekor kuda tua yang bekerja sebagai pekerja bengkel mobil di Uni Soviet yang dibuat oleh Midjourney, dan mengembalikannya ke MJ untuk membuatnya menjadi yang baru.
MJ menghasilkan yang berikut ini, yang kami gunakan untuk menguji SDXL:
Elon Musk(这里MJ生成的是seorang pria) berdiri di ruang kerja, dalam gaya estetika mesin industri, deutscher werkbund, gambar yang dipentaskan secara seragam, soviet, nila muda dan perunggu gelap, fotografi warna Amerika baru, fitur wajah terperinci
Gayanya persis seperti yang kami harapkan, dan detailnya lumayan.
Ada gambar rumit lainnya sebagai penutup, yang juga dihasilkan oleh MJ berdasarkan karya-karya sebelumnya dan kemudian diumpankan ke SDXL.
elon musk memakan makanan dengan sumpit, ala peter coulson, pemrosesan silang/olahan, fotografi lubang jarum, ramuan trimpe, james tissot, transavanguardia, pengukuran titik
Di sebelah kiri adalah karya SDXL, dan di sebelah kanan adalah versi asli MJ, Anda bisa membandingkannya.
Kata-kata yang cepat juga mendukung bahasa Mandarin, tetapi tampaknya hasilnya cenderung ke gaya nasional, dan keakuratannya juga dapat terpengaruh.
Misalnya, setelah memasukkan "harimau di tepi pantai", seorang gadis bergaya nasional secara tidak sengaja diberikan.
Setiap orang telah melihat efeknya, jadi seberapa cepat SDXL menghasilkan gambar?
Untuk pengguna gratis, sebagian besar waktu dihabiskan untuk mengantri, tetapi tidak akan menunggu terlalu lama.
Dalam 5,5 detik, antrian berkurang dari 160 menjadi 99.
Selain menghasilkan gambar, SDXL juga menyediakan banyak fungsi pasca-pengeditan.
Secara khusus, ini termasuk penghapusan latar belakang, pemrosesan detail, pembesaran bingkai, dll.
Fungsi-fungsi ini sudah tersedia di platform Clipdrop tempat SDXL berada, dan SDXL dapat mentransfer gambar yang dihasilkan ke modul yang sesuai dengan satu klik.
Di sini kami memilih fungsi penghapusan latar belakang untuk menunjukkannya, terlihat hampir tidak ada cacat pada detail tepinya.
Saat ini kuota gratis penggunaan SDXL masih terbilang tinggi, setelah login setiap akun dapat menghasilkan 400 kartu per hari (perlu antre).
Pembayaran bulanan adalah $9 per bulan, dan pembayaran tahunan setara dengan $7 (sekitar 50 RMB) per bulan, termasuk 1.500 kuota SDXL per hari, dan tidak perlu mengantre.
Namun, harga di berbagai daerah tampaknya berbeda, misalnya pembayaran tahunan di Argentina adalah 742 peso (sekitar 19,4 yuan atau 2,7 dolar AS) per bulan.
Selain itu, karena versi berbayar sebenarnya adalah langganan Pro ke platform Clipdrop, fitur lain dari platform ini juga disertakan.
Selain akun Pro, ada versi API yang tersedia untuk pengembang (dengan akses ke Stability AI, Amazon, dll.).
** "Piala Maksimum" dalam Model Gambar Terbuka**
Di blog terbaru, Stability AI memperkenalkan lebih banyak detail teknis dari SDXL 1.0.
Pertama, model ini membuka jalan baru baik dalam skala maupun arsitektur.
Ini secara inovatif menggunakan model dasar + model penyulingan.
Ukuran parameter keduanya masing-masing adalah 3,5 miliar dan 6,6 miliar.
Ini juga menjadikan SDXL 1.0 salah satu model grafis terbuka terbesar yang tersedia saat ini.
Emad Mostaque, pendiri Stability AI, mengatakan bahwa jumlah parameter yang lebih banyak memungkinkan model untuk memahami lebih banyak konsep dan mengajarkannya lebih dalam.
Pada saat yang sama, peningkatan RLHF juga dilakukan pada versi SDXL 0.9.
Inilah mengapa SDXL 1.0 sekarang mendukung petunjuk singkat, dan dapat membedakan antara Kotak Merah dan Kotak Merah.
Dalam proses sintesis spesifik, pada langkah pertama, model dasar menghasilkan noise laten, dan kemudian model yang disempurnakan melakukan denoising.
Model dasar juga dapat digunakan sebagai modul independen.
Kombinasi kedua model ini dapat menghasilkan kualitas gambar yang lebih baik tanpa menghabiskan lebih banyak sumber daya komputasi.
Menurut pengantar resminya, SDXL 1.0 dapat berjalan pada GPU kelas konsumen dengan VRAM 8GB, atau di cloud.
Selain itu, SDXL 1.0 juga telah ditingkatkan dalam penyempurnaan, dan dapat menghasilkan LoRA atau pos pemeriksaan khusus.
Tim AI Stabilitas juga sekarang membangun generasi baru kontrol terstruktur, gaya, dan gabungan khusus tugas, dengan T2I/ControlNet khusus untuk SDXL.
Namun, fungsi-fungsi ini masih dalam tahap pengujian beta, dan Anda dapat memperhatikan pembaruan resmi di masa mendatang.
Singkatnya, diagram Vincent adalah proses iteratif bertahap, dan tujuan SDXL 1.0 adalah membuat proses ini lebih mudah.
Mostak mengatakan bahwa sekarang hanya diperlukan 5-10 gambar untuk menyempurnakan model dengan cepat.
Terlihat juga dari umpan balik pengguna bahwa SDXL 1.0 lebih memuaskan daripada Difusi Stabil.
Bahkan, sejak April tahun ini, Stability AI telah merilis SDXL versi beta paling awal.
Pengujian internal dimulai pada bulan Juni, dan versi 0.9 dirilis beberapa waktu lalu, pada saat itu diumumkan bahwa versi terbuka, versi terbaru 1.0, akan dirilis pada bulan Juli. Saat ini, bobot kode yang relevan telah dipublikasikan di GitHub.
Dan orang yang bertanggung jawab atas pembelajaran mesin Stabilitas AI mengatakan bahwa dibandingkan dengan SDXL 0.9, versi 1.0 mengurangi permintaan daya komputasi.
Jika Anda tertarik dengan sepatu anak-anak, cobalah~
Entri percobaan:
GitHub:
Tautan referensi:
[1]
[2]
[3]
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Difusi Stabil Piala Super Besar ada di sini gratis! "Model buka grafik Vincent terkuat", kata-kata cepatnya juga lebih sederhana
Sumber: Qubit
Versi terkuat dari Difusi Stabil ada di sini!
Dalam hal efek, apakah itu blockbuster kehidupan nyata:
Ini juga mendukung pasca-pengeditan gambar yang dihasilkan langsung di halaman web.
(Baunya seperti perkelahian dengan Midjourney dan Firefly)
Dibandingkan dengan Difusi Stabil dasar, SDXL 1.0 memberikan hasil yang lebih akurat dan realistis.
Ini karena parameter model dasar SDXL 1.0 telah mencapai 3,5 miliar, dan kemampuan pemahamannya lebih kuat.
Dibandingkan dengan versi dasar Difusi Stabil, jumlah parameter hanya sekitar 1 miliar.
Hasilnya, SDXL 1.0 juga menjadi salah satu model gambar terbuka terbesar saat ini. Pejabat itu bahkan secara langsung mengatakan bahwa ini adalah model open image terbaik di dunia.
Cetak Musk pada porselen biru dan putih
SDXL 1.0 sangat nyaman dalam pengoperasian, Anda dapat langsung memasukkan, dan Anda juga dapat memeriksa parameter gaya dan ukuran dari bawah.
Biar menghasilkan gambar ala Jepang, gaya lukisannya sangat cocok, dan pengolahan cahaya dan bayangan lebih natural.
Di "WWDC", dia mengangkat iPhone baru untuk menunjukkan kepada orang-orang, dikelilingi oleh reporter dan penggemar (doge).
Yang di kiri adalah gaya tinta Qi Baishi, sedangkan yang di kanan adalah karikatur.
Namun dari efeknya, selangkangan tidak meregang karena kata-kata prompt yang sederhana, yang juga ditegaskan oleh pernyataan resmi.
Kami menemukan foto langka seekor kuda tua yang bekerja sebagai pekerja bengkel mobil di Uni Soviet yang dibuat oleh Midjourney, dan mengembalikannya ke MJ untuk membuatnya menjadi yang baru.
Ada gambar rumit lainnya sebagai penutup, yang juga dihasilkan oleh MJ berdasarkan karya-karya sebelumnya dan kemudian diumpankan ke SDXL.
Di sebelah kiri adalah karya SDXL, dan di sebelah kanan adalah versi asli MJ, Anda bisa membandingkannya.
Misalnya, setelah memasukkan "harimau di tepi pantai", seorang gadis bergaya nasional secara tidak sengaja diberikan.
Untuk pengguna gratis, sebagian besar waktu dihabiskan untuk mengantri, tetapi tidak akan menunggu terlalu lama.
Dalam 5,5 detik, antrian berkurang dari 160 menjadi 99.
Secara khusus, ini termasuk penghapusan latar belakang, pemrosesan detail, pembesaran bingkai, dll.
Di sini kami memilih fungsi penghapusan latar belakang untuk menunjukkannya, terlihat hampir tidak ada cacat pada detail tepinya.
Pembayaran bulanan adalah $9 per bulan, dan pembayaran tahunan setara dengan $7 (sekitar 50 RMB) per bulan, termasuk 1.500 kuota SDXL per hari, dan tidak perlu mengantre.
Selain akun Pro, ada versi API yang tersedia untuk pengembang (dengan akses ke Stability AI, Amazon, dll.).
** "Piala Maksimum" dalam Model Gambar Terbuka**
Di blog terbaru, Stability AI memperkenalkan lebih banyak detail teknis dari SDXL 1.0.
Pertama, model ini membuka jalan baru baik dalam skala maupun arsitektur.
Ini secara inovatif menggunakan model dasar + model penyulingan.
Ukuran parameter keduanya masing-masing adalah 3,5 miliar dan 6,6 miliar.
Emad Mostaque, pendiri Stability AI, mengatakan bahwa jumlah parameter yang lebih banyak memungkinkan model untuk memahami lebih banyak konsep dan mengajarkannya lebih dalam.
Pada saat yang sama, peningkatan RLHF juga dilakukan pada versi SDXL 0.9.
Inilah mengapa SDXL 1.0 sekarang mendukung petunjuk singkat, dan dapat membedakan antara Kotak Merah dan Kotak Merah.
Model dasar juga dapat digunakan sebagai modul independen.
Kombinasi kedua model ini dapat menghasilkan kualitas gambar yang lebih baik tanpa menghabiskan lebih banyak sumber daya komputasi.
Menurut pengantar resminya, SDXL 1.0 dapat berjalan pada GPU kelas konsumen dengan VRAM 8GB, atau di cloud.
Selain itu, SDXL 1.0 juga telah ditingkatkan dalam penyempurnaan, dan dapat menghasilkan LoRA atau pos pemeriksaan khusus.
Tim AI Stabilitas juga sekarang membangun generasi baru kontrol terstruktur, gaya, dan gabungan khusus tugas, dengan T2I/ControlNet khusus untuk SDXL.
Namun, fungsi-fungsi ini masih dalam tahap pengujian beta, dan Anda dapat memperhatikan pembaruan resmi di masa mendatang.
Mostak mengatakan bahwa sekarang hanya diperlukan 5-10 gambar untuk menyempurnakan model dengan cepat.
Terlihat juga dari umpan balik pengguna bahwa SDXL 1.0 lebih memuaskan daripada Difusi Stabil.
Pengujian internal dimulai pada bulan Juni, dan versi 0.9 dirilis beberapa waktu lalu, pada saat itu diumumkan bahwa versi terbuka, versi terbaru 1.0, akan dirilis pada bulan Juli. Saat ini, bobot kode yang relevan telah dipublikasikan di GitHub.
Dan orang yang bertanggung jawab atas pembelajaran mesin Stabilitas AI mengatakan bahwa dibandingkan dengan SDXL 0.9, versi 1.0 mengurangi permintaan daya komputasi.
Jika Anda tertarik dengan sepatu anak-anak, cobalah~
Entri percobaan:
GitHub:
Tautan referensi: [1] [2] [3]