Super Large Cup Stable Diffusion est ici gratuitement! "Le modèle ouvert de graphe de Vincent le plus fort", les mots d'invite sont également plus simples

巴比特_

2023-07-27 05:53:15

Source : Qubit

La version la plus puissante de Stable Diffusion est là !

SDXL 1.0 est officiellement sorti, et vous pouvez l'essayer en ligne gratuitement.

En termes d'effet, s'il s'agit d'un blockbuster réel :

Panda surréaliste buvant de la bière :

Ou des bandes dessinées cyberpunk, les deux sont très sympas ~

Selon Stability AI, SDXL 1.0 produit des couleurs plus vives et plus précises, avec des améliorations du contraste, de la lumière et des ombres, et peut produire des images de 1 mégapixel (1024×1024).

Il prend également en charge la post-édition des images générées directement sur la page Web.

(Ça sent la bagarre avec Midjourney et Firefly)

Les internautes ne peuvent s'empêcher de l'essayer ~

Par rapport à la diffusion stable de base, SDXL 1.0 produit des résultats plus précis et réalistes.

Et le responsable a déclaré que les mots rapides peuvent être plus simples qu'auparavant.

En effet, les paramètres de base du modèle SDXL 1.0 ont atteint ** 3,5 milliards ** et la capacité de compréhension est plus forte.

Par rapport à la version de base de Stable Diffusion, le nombre de paramètres n'est que d'environ 1 milliard.

En conséquence, SDXL 1.0 est également devenu l'un des modèles d'image ouverts ** les plus importants ** actuels. Le responsable a même directement déclaré qu'il s'agissait du meilleur modèle d'image ouverte au monde.

Pas grand chose à dire, commençons ~

Impression Musk sur porcelaine bleue et blanche

SDXL 1.0 est très pratique à utiliser, vous pouvez entrer directement et vous pouvez également vérifier les paramètres de style et de taille à partir du bas.

La valeur par défaut est de générer 4 images à la fois. Si vous n'êtes pas satisfait, vous pouvez cliquer sur le "signe plus" ci-dessous pour le laisser continuer à dessiner.

Selon l'introduction officielle, maintenant que SDXL 1.0 peut générer des chefs-d'œuvre, il n'est pas nécessaire d'ajouter le mot d'invite "chef-d'œuvre".

Laissez-le générer une image de style japonais, le style de peinture est très approprié et le traitement de la lumière et de l'ombre est plus naturel.

Couple de capture d'écran d'anime basse résolution des années 1990 s'éloignant dans la rue la nuit

Ou une photo de paysage ? Cela peut aussi être faux.

Laissez même Musk se tenir debout dans une cour chinoise, regardant le ciel...

Elon Musk dans un ancien palais chinois

Ou avez-vous acheté Apple?

Sur "WWDC", il a brandi le nouvel iPhone pour montrer aux gens, entouré de journalistes et de fans (doge).

Elon Musk lance un nouvel iPhone à la WWDC

En plus des nouvelles d'oignon de ces vieux chevaux, l'effet des œuvres de style peinture est également bon.

Celui de gauche est le style d'encre de Qi Baishi, tandis que celui de droite est une caricature.

左：Elon Musk prononçant un discours, peinture à l'encre, style Qi Baishi À droite : bande dessinée d'Elon Musk

En plus de la peinture, vous pouvez également mettre de vieux chevaux dans notre Yuan Qinghua.

Musc Elon en forme de porcelaine bleue et blanche de la dynastie Yuan

Les "vieilles histoires de chevaux" présentées ci-dessus sont relativement simples à utiliser.

Mais à partir de l'effet, l'entrejambe n'est pas étiré à cause des simples mots rapides, ce qui est également confirmé par le communiqué officiel.

Mais nous voulons toujours voir, à quoi cela ressemblerait-il si nous en utilisions un plus complexe et raffiné ?

Nous avons trouvé une photo rare d'un vieux cheval travaillant comme réparateur automobile en Union soviétique créée par Midjourney, et l'avons redonnée à MJ pour en faire une nouvelle.

MJ a généré ce qui suit, que nous avons utilisé pour tester SDXL :

Elon Musk(这里MJ生成的是un homme) debout dans une salle de travail, dans le style de l'esthétique des machines industrielles, deutscher werkbund, images mises en scène uniformément, soviétique, indigo clair et bronze foncé, nouvelle photographie couleur américaine, traits du visage détaillés

Le style est exactement comme nous l'attendions, et les détails ne sont pas mauvais.

Il y a une autre image compliquée comme fin, qui est également générée par MJ sur la base d'œuvres précédentes, puis transmise à SDXL.

elon musk mangeant de la nourriture avec des baguettes, dans le style de peter coulson, traitement croisé/traité, photographie au sténopé, garniture d'herbes, james tissot, transavanguardia, mesure ponctuelle

A gauche se trouve le travail de SDXL, et à droite se trouve la version originale de MJ, vous pouvez la comparer.

Les mots rapides prennent également en charge le chinois, mais il semble que les résultats seront enclins au style national, et la précision peut également être affectée.

Par exemple, après avoir saisi "un tigre est au bord de la mer", une fille de style national est accidentellement donnée.

Tout le monde a vu l'effet, alors à quelle vitesse SDXL génère-t-il des images ?

Pour les utilisateurs gratuits, le temps est principalement consacré à la file d'attente, mais cela n'attendra pas trop longtemps.

En 5,5 secondes, la file d'attente a été réduite de 160 à 99.

En plus de générer des images, SDXL fournit également de nombreuses fonctions de post-édition.

Plus précisément, il comprend la suppression de l'arrière-plan, le traitement des détails, l'agrandissement du cadre, etc.

Ces fonctions sont déjà disponibles sur la plateforme Clipdrop où se trouve SDXL, et SDXL peut transférer les images générées vers le module correspondant en un clic.

Ici, nous choisissons la fonction de suppression de l'arrière-plan pour le montrer. On peut voir qu'il n'y a presque pas de défauts dans les détails des bords.

À l'heure actuelle, le quota d'utilisation gratuite de SDXL est encore relativement élevé.Une fois connecté, chaque compte peut générer 400 cartes par jour (nécessité de faire la queue).

Le paiement mensuel est de 9 $ par mois et le paiement annuel équivaut à 7 $ (environ 50 RMB) par mois, y compris 1 500 quotas SDXL par jour, et il n'est pas nécessaire de faire la queue.

Cependant, les prix dans différentes régions semblent être différents.Par exemple, le paiement annuel en Argentine est de 742 pesos (environ 19,4 yuans ou 2,7 dollars américains) par mois.

De plus, comme la version payante est en fait un abonnement Pro à la plateforme Clipdrop, d'autres fonctionnalités de la plateforme sont également incluses.

En plus des comptes Pro, il existe des versions d'API disponibles pour les développeurs (avec accès à Stability AI, Amazon, etc.).

"Tasse maximale" dans le modèle d'image ouverte

Dans le dernier blog, Stability AI présente plus de détails techniques sur SDXL 1.0.

Tout d'abord, le modèle innove en termes d'échelle et d'architecture.

Il utilise de manière innovante un modèle de base + un modèle de raffineur.

Les tailles des paramètres des deux sont respectivement de 3,5 milliards et de 6,6 milliards.

Cela fait également de SDXL 1.0 l'un des ** plus grands modèles graphiques ouverts ** disponibles aujourd'hui.

Emad Mostaque, fondateur de Stability AI, a déclaré qu'un plus grand nombre de paramètres peut permettre au modèle de comprendre plus de concepts et de lui enseigner des choses plus profondes.

Dans le même temps, l'amélioration RLHF a également été effectuée dans la version SDXL 0.9.

C'est pourquoi SDXL 1.0 prend désormais en charge les invites courtes et peut faire la distinction entre le carré rouge et un carré rouge.

Dans le processus de synthèse spécifique, dans la première étape, le modèle de base génère une latente bruitée, puis le modèle raffiné effectue un débruitage.

Le modèle de base peut également être utilisé comme module indépendant.

La combinaison de ces deux modèles permet de générer des images de meilleure qualité sans consommer plus de ressources informatiques.

Selon l'introduction officielle, SDXL 1.0 peut fonctionner sur un GPU grand public avec 8 Go de VRAM, ou sur le cloud.

De plus, SDXL 1.0 a également été amélioré dans le réglage fin et peut générer des LoRA ou des points de contrôle personnalisés.

L'équipe Stability AI est également en train de construire une nouvelle génération de contrôles structurés, stylisés et combinés spécifiques à une tâche, avec T2I/ControlNet spécifiquement pour SDXL.

Cependant, ces fonctions sont encore en phase de test bêta et vous pourrez faire attention aux mises à jour officielles à l'avenir.

En résumé, les diagrammes Vincent sont un processus itératif graduel, et l'objectif de SDXL 1.0 est de faciliter ce processus.

Mostak a déclaré que désormais, seules 5 à 10 images sont nécessaires pour affiner rapidement le modèle.

Il ressort également des commentaires des utilisateurs que SDXL 1.0 est plus satisfaisant que Stable Diffusion.

En fait, depuis avril de cette année, Stability AI a publié la première version bêta de SDXL.

Les tests internes ont commencé en juin et la version 0.9 est sortie il y a quelque temps, à ce moment-là, il a été annoncé qu'une version ouverte, la dernière version 1.0, serait publiée en juillet. À l'heure actuelle, les poids de code pertinents ont été publiés sur GitHub.

Et le responsable de Stability AI machine learning a déclaré que par rapport à SDXL 0.9, la version 1.0 réduit la demande en puissance de calcul.

Si vous êtes intéressé par les chaussures pour enfants, allez les essayer ~

Entrée d'essai :

GitHub：

Lien de référence : [1] [2] [3]

Voir l'original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Récompense
J'aime
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
BTC Hits New High
74k Popularité
ETH Breaks $3,000
28k Popularité
VIP Exclusive Airdrop Carnival
9k Popularité
4Pump.Fun Debuts on Gate
4k Popularité
5Fed June Meeting Minutes
4k Popularité
6Join Gate VIP to Win MacBook
29k Popularité
7Trump Tariff Hikes
16k Popularité
8Gate xStocks Trading Share
22k Popularité
9HK Stablecoin Rules
12k Popularité
10Truth Social Crypto ETF
2k Popularité

Épingler

Super Large Cup Stable Diffusion est ici gratuitement! "Le modèle ouvert de graphe de Vincent le plus fort", les mots d'invite sont également plus simples

Impression Musk sur porcelaine bleue et blanche

** "Tasse maximale" dans le modèle d'image ouverte **

"Tasse maximale" dans le modèle d'image ouverte