Süper Büyük Kap Stabil Difüzyon burada ücretsiz! "En güçlü Vincent grafiği açık modeli", komut istemi sözcükleri de daha basittir

Kaynak: Qubit

Stable Difusion'ın en güçlü versiyonu burada!

Şu anda SDXL 1.0 resmi olarak yayınlandı ve çevrimiçi olarak ücretsiz olarak deneyebilirsiniz.

Etki açısından, gerçek hayattan bir gişe rekorları kıran olup olmadığı:

Bira İçen Gerçeküstü Panda:

Ya da siberpunk çizgi romanları, ikisi de çok güzel~

Stability AI'ye göre SDXL 1.0 kontrast, ışık ve gölgelerde geliştirmelerle daha canlı ve doğru renkler üretir ve 1 megapiksel görüntüler (1024×1024) üretebilir.

Ayrıca, oluşturulan görüntülerin doğrudan web sayfasında sonradan düzenlenmesini de destekler.

(Midjourney ve Firefly ile kavga gibi kokuyor)

Netizenler denemekten kendilerini alamıyorlar~

Temel Kararlı Difüzyon ile karşılaştırıldığında, SDXL 1.0 daha doğru ve gerçekçi sonuçlar üretir.

Ve yetkili, hızlı kelimelerin eskisinden daha basit olabileceğini söyledi.

Bunun nedeni, SDXL 1.0'ın temel model parametrelerinin 3,5 milyar'a ulaşması ve anlama yeteneğinin daha güçlü olmasıdır.

Stable Difusion'ın temel sürümüyle karşılaştırıldığında, parametre sayısı yalnızca yaklaşık 1 milyardır.

Sonuç olarak, SDXL 1.0 aynı zamanda mevcut en büyük açık görüntü modellerinden biri haline geldi. Yetkili, doğrudan bunun dünyadaki en iyi açık görüntü modeli olduğunu bile söyledi.

Söyleyecek fazla bir şey yok, hadi başlayalım~

Mavi ve beyaz porselen üzerine misk baskısı

SDXL 1.0 kullanımda çok uygundur, doğrudan giriş yapabilirsiniz ve alttan stil ve boyut parametrelerini de kontrol edebilirsiniz.

Varsayılan, bir seferde 4 resim oluşturmaktır.Memnun kalmazsanız, çizmeye devam etmesi için aşağıdaki "artı işaretine" tıklayabilirsiniz.

Resmi tanıtıma göre, artık SDXL 1.0 başyapıtlar üretebildiğine göre, "şaheser" istemi kelimesini eklemeye gerek yok.

Japon tarzı bir görüntü oluştursun, resim tarzı çok uygun ve ışık ve gölgenin işlenmesi daha doğal.

1990'ların anime düşük çözünürlüklü ekran görüntüsü, geceleri sokakta yürüyen çift

Yoksa manzara fotoğrafı mı? Ayrıca yanlış olabilir.

Hatta Musk'ın bir Çin avlusunda durup gökyüzüne bakmasına izin verin...

Eski bir Çin sarayında Elon Musk

Yoksa Apple mı aldınız?

"WWDC"de, muhabirler ve hayranlarla (doge) çevrili insanlara göstermek için yeni iPhone'u kaldırdı.

Elon Musk, WWDC'de yeni iPhone'u piyasaya sürüyor

Bu yaşlı atların soğan haberlerinin yanı sıra resim tarzı çalışmaların da etkisi güzel.

Soldaki, Qi Baishi'nin mürekkep stili, sağdaki ise bir karikatür.

左:Elon Musk bir konuşma yapıyor, mürekkeple boyama, Qi Baishi stili Sağda: Elon Musk çizgi romanı

Boyamaya ek olarak, Yuan Qinghua'mıza yaşlı atlar da koyabilirsiniz.

Yuan Hanedanı Mavi ve Beyaz Porselen şeklinde Elon miski

Yukarıda gösterilen "eski at hikayeleri"nin kullanımı nispeten basittir.

Ancak etkiden, resmi açıklama ile de onaylanan basit istemli sözler nedeniyle kasık gerilmez.

Ama yine de görmek istiyoruz, daha karmaşık ve rafine bir tane kullansaydık nasıl görünürdü?

Midjourney tarafından yaratılan, Sovyetler Birliği'nde oto tamir işçisi olarak çalışan eski bir atın nadir bir fotoğrafını bulduk ve onu yenisi yapması için MJ'e yeniden besledik.

MJ, SDXL'i test etmek için kullandığımız aşağıdakileri oluşturdu:

Elon Musk(这里MJ生成的是bir adam) bir çalışma odasında endüstriyel makine estetiği tarzında, deutscher werkbund, tek tip sahnelenmiş görüntüler, sovyet, açık çivit ve koyu bronz, yeni amerikan renkli fotoğrafçılık, ayrıntılı yüz özellikleri

Tarz tam olarak beklediğimiz gibi ve detaylar fena değil.

Bitiş olarak yine MJ tarafından önceki çalışmalara dayanarak oluşturulan ve ardından SDXL'e beslenen karmaşık bir resim daha var.

elon musk yemek çubuklarıyla yemek yerken, peter coulson tarzında, çapraz işleme/işlenmiş, iğne deliği fotoğrafçılığı, herb trimpe, james tissot, transavanguardia, spot ölçüm

Solda SDXL'in çalışması, sağda MJ'in orijinal hali var, karşılaştırabilirsiniz.

Hızlı kelimeler Çince'yi de destekliyor, ancak sonuçların ulusal stile eğilimli olacağı ve doğruluğun da etkilenebileceği görülüyor.

Örneğin, "bir kaplan deniz kenarında" yazdıktan sonra, yanlışlıkla ulusal tarzda bir kız verilir.

Etkiyi herkes gördü, peki SDXL resimleri ne kadar hızlı üretiyor?

Ücretsiz kullanıcılar için, zaman çoğunlukla kuyrukta harcanır, ancak çok fazla beklemez.

5.5 saniyede sıra 160'tan 99'a düşürüldü.

SDXL, görüntü oluşturmanın yanı sıra birçok son düzenleme işlevi de sağlar.

Spesifik olarak, arka plan kaldırma, ayrıntı işleme, çerçeve büyütme vb. içerir.

Bu işlevler zaten SDXL'in bulunduğu Clipdrop platformunda mevcuttur ve SDXL, oluşturulan resimleri tek bir tıklama ile ilgili modüle aktarabilir.

Burada göstermek için arka plan kaldırma işlevini seçiyoruz, kenar detaylarında neredeyse hiç kusur olmadığı görülüyor.

Şu anda, SDXL'in ücretsiz kullanım kotası hala nispeten yüksektir.Giriş yaptıktan sonra, her hesap günde 400 kart üretebilir (sıraya girmesi gerekir).

Aylık ödeme aylık 9 ABD dolarıdır ve yıllık ödeme, günlük 1.500 SDXL kotası dahil olmak üzere aylık 7 ABD dolarına (yaklaşık 50 RMB) eşittir ve sıraya girmeye gerek yoktur.

Ancak, farklı bölgelerdeki fiyatlar farklı görünüyor, örneğin Arjantin'de yıllık ödeme aylık 742 peso (yaklaşık 19,4 yuan veya 2,7 ABD doları).

Ayrıca ücretli sürüm aslında Clipdrop platformuna Pro abonelik olduğu için platformun diğer özelliklerine de yer verilmiş.

Pro hesaplara ek olarak, geliştiriciler için API sürümleri mevcuttur (Stability AI, Amazon vb. erişimi olan).

** Açık Resim Modelinde "Maksimum Kupa"**

En son blogda Stability AI, SDXL 1.0'ın daha fazla teknik detayını sunuyor.

Birincisi, model hem ölçek hem de mimaride çığır açıyor.

Yenilikçi bir şekilde bir temel model + bir arıtıcı model kullanır.

İkisinin parametre boyutları sırasıyla 3,5 milyar ve 6,6 milyar şeklindedir.

Bu aynı zamanda SDXL 1.0'ı bugün mevcut olan en büyük açık grafik modellerinden biri yapar.

Stability AI'nin kurucusu Emad Mostaque, daha fazla sayıda parametrenin modelin daha fazla kavramı anlamasına ve ona daha derin şeyler öğretmesine izin verebileceğini söyledi.

Aynı zamanda SDXL 0.9 versiyonunda RLHF geliştirmesi de yapılmıştır.

Bu nedenle SDXL 1.0 artık kısa istemleri destekliyor ve Kızıl Meydan ile Kızıl Kare arasında ayrım yapabiliyor.

Spesifik sentez sürecinde, ilk adımda, temel model gizli gürültülü üretir ve ardından rafine model gürültü giderme işlemini gerçekleştirir.

Temel model bağımsız bir modül olarak da kullanılabilir.

Bu iki modelin kombinasyonu, daha fazla bilgi işlem kaynağı tüketmeden daha kaliteli görüntüler üretebilir.

Resmi tanıtıma göre SDXL 1.0, 8 GB VRAM'e sahip tüketici sınıfı bir GPU'da veya bulutta çalışabilir.

Ek olarak, SDXL 1.0 ince ayar açısından da geliştirilmiştir ve özel LoRA'lar veya kontrol noktaları oluşturabilir.

Stability AI ekibi ayrıca, özellikle SDXL için T2I/ControlNet ile göreve özel yapılandırılmış, stillendirilmiş ve birleştirilmiş yeni nesil kontroller inşa ediyor.

Ancak bu işlevler henüz beta test aşamasında ve ilerleyen zamanlarda resmi güncellemelere dikkat edebilirsiniz.

Özetle, Vincent diyagramları kademeli yinelemeli bir süreçtir ve SDXL 1.0'ın amacı bu süreci kolaylaştırmaktır.

Mostak, modelde hızlı bir şekilde ince ayar yapmak için artık yalnızca 5-10 fotoğrafın gerekli olduğunu söyledi.

Kullanıcı geri bildirimlerinden SDXL 1.0'ın Stable Diffusion'dan daha tatmin edici olduğu da görülebilir.

Aslında, bu yılın Nisan ayından bu yana, Stability AI, SDXL'in en eski beta sürümünü yayınladı.

Dahili testler Haziran ayında başladı ve 0.9 sürümü bir süre önce yayınlandı.O sırada, Temmuz ayında en son sürüm 1.0 olan açık bir sürümün yayınlanacağı duyurulmuştu. Şu anda, ilgili kod ağırlıkları GitHub'da yayınlandı.

Stability AI makine öğreniminden sorumlu kişi, SDXL 0.9 ile karşılaştırıldığında sürüm 1.0'ın bilgi işlem gücüne olan talebi azalttığını söyledi.

Çocuk ayakkabılarıyla ilgileniyorsanız, gidip onları deneyin~

Deneme girişi:

GitHub:

Referans bağlantısı: [1] [2] [3]

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)