Mise à jour Blockbuster丨Midjourney a lancé le « Style Adjuster », et il n’est plus difficile d’avoir un style de peinture cohérent

Texte : Carl Franzen

Source: VentureBeat

Source de l’image : Générée par Unbounded AI

En tant que l’un des générateurs d’art et de texte en image les plus populaires de l’IA, Midjourney peut générer des œuvres d’art de haute qualité basées sur des invites tapées par les utilisateurs en anglais pur, qui sont déjà apparues à la télévision et au cinéma.

Conçu par l’ancien programmeur de Magic Leap David Holz et lancé à l’été 2022, Midjourney a attiré plus de 16 millions d’utilisateurs sur les serveurs de l’application de messagerie autonome Discord et est constamment mis à jour par une petite équipe de programmeurs avec de nouvelles fonctionnalités, notamment le panoramique, les extensions et une application mobile axée sur l’anime.

Cependant, pour les entreprises, les marques et les créateurs qui cherchent à raconter une histoire cohérente dans le même style, la dernière mise à jour (appelée Style Tuner) lancée le soir du 1er novembre 2023 est sans doute la mise à jour la plus importante à ce jour. En effet, la fonctionnalité permet aux utilisateurs de générer leur propre style visuel unique et de l’appliquer à n’importe quelle image générée dans l’application, peut-être même à toutes.

Avant cette fonctionnalité, les utilisateurs devaient répéter des descriptions textuelles pour générer un style cohérent sur plusieurs images, et même cela ne garantissait pas les résultats, car Midjourney, comme la plupart des générateurs d’art IA, pouvait offrir une variété de styles et de types d’images avec des fonctionnalités illimitées.

Désormais, au lieu de s’appuyer sur leur propre langage, les utilisateurs peuvent choisir entre une variété de styles et obtenir un code à appliquer à toutes les productions futures, en les gardant dans le même style esthétique. Les utilisateurs de Midjourney ont également la possibilité de copier et coller le code ailleurs afin de pouvoir l’enregistrer et s’y référer à l’avenir, et ils peuvent même partager le code avec d’autres utilisateurs de Midjourney de leur organisation pour générer des images dans le même style. C’est un énorme défi pour les entreprises, les marques et tous ceux qui recherchent un projet de création collective dans un style unifié.

COMMENT AJUSTEUR DE STYLE MIDJOURNEY **

Allez sur le serveur Discord Midjourney, et les utilisateurs peuvent simplement taper « /tune » et suivre les invites pour déboguer le style.

Par exemple, je souhaite mettre à jour l’image d’arrière-plan de mon site Web de produits ou de services pendant les mois d’hiver pour inclure plus de neige et des espaces confortables. Eh bien, je peux taper une idée d’invite après « /tune » -- « Un robot dans un pull confortable est assis devant la cheminée et sirote un chocolat chaud dans une tasse ».

Le bot Discord de Midjourney répond alors automatiquement avec un grand message, expliquant en détail le processus d’ajustement du style et demandant à l’utilisateur s’il souhaite continuer. Notez qu’il y a des frais pour ce processus (les plans d’abonnement Midjourney commencent à 10 $ par mois, payés mensuellement ou à l’avance pour 96 $ par an) et utilisent certains des crédits GPU rapides fournis avec chaque plan (selon le niveau de plan, plus les crédits GPU rapides sont attribués avec les plans les plus chers). Ces points sont utilisés pour une génération d’image plus rapide par rapport au mode « détendu ».

Sélectionnez la direction et le mode du style et sa signification

Les informations comprennent deux menus déroulants qui permettent à l’utilisateur de sélectionner différentes options : le nombre de directions de style (16, 32, 64 ou 128) et le mode (par défaut ou brut).

Le paramètre « Direction du style » indique le nombre d’images différentes que Midjourney générera en fonction des invites de l’utilisateur, chacune montrant un style très différent. Les utilisateurs ont ensuite la possibilité de choisir leur propre style à partir de ces images ou de combiner les images résultantes pour créer un nouveau méta-style basé sur plusieurs d’entre elles.

Il est important de noter que différentes options de style et d’orientation produisent différentes quantités d’image, et chacune consomme des points GPU différents. Par exemple, 16 directions de style coûtent 0,15 crédit GPU, tandis que 128 directions de style coûtent 1,2 crédit GPU. Par conséquent, les utilisateurs doivent examiner attentivement le nombre de styles différents qu’ils souhaitent générer et s’ils veulent dépenser tous ces points.

Dans le même temps, le réglage « mode » est binaire, et l’utilisateur peut choisir entre le mode par défaut ou le mode brut, qui est lié au réalisme et au grain de la photo. Les images brutes ressemblent plus à des films ou à des reflex numériques et peuvent donc être plus réalistes, mais elles contiendront également quelques traces d’artificialité, alors que le mode par défaut et le mode de lissage ajusté ne le seront pas.

Dans la présentation de cet article, nous avons sélectionné 16 orientations de style et modes par défaut. Soit dit en passant, dans nos tests, et dans les tests rapportés par certains utilisateurs en ligne, Midjourney a donné à tort aux utilisateurs un niveau de plus que ce qu’ils demandaient, donc dans notre cas, nous avons obtenu 32 styles même si nous en avons demandé 16.

Une fois que vous avez sélectionné le mode et la direction du style, le bot Midjourney vous demandera si vous êtes sûr de vouloir continuer, et vous montrera à nouveau le nombre de points que vous utilisez, et si vous appuyez sur le bouton vert, vous pourrez continuer. L’ensemble du processus peut prendre jusqu’à 2 minutes.

Comment trouver les différents styles à choisir

Une fois que Midjourney a fini de travailler sur les options de l’ajusteur de style, le bot répond avec un message comme l’image ci-dessous : « L’ajusteur de style est prêt ! » Votre ajusteur de style personnalisé a terminé la construction. Vous pouvez désormais afficher, partager et générer des styles ici : », suivi d’une URL vers le site Web de l’expert en sinistres Midjourney (nom de domaine tuner.midjourney.com).

L’URL résultante doit se terminer par une chaîne aléatoire de lettres et de chiffres. Par mesure de sécurité, nous avons supprimé notre URL dans la capture d’écran ci-dessous.

Cliquez sur l’URL pour accéder au site Web de Midjourney dans votre navigateur.

Par la suite, l’utilisateur verra un message personnalisé, mais par défaut, de Midjourney, indiquant la langue d’invite de l’utilisateur et expliquant comment effectuer le processus d’ajustement. Cela dit, Midjourney demande aux utilisateurs de choisir entre deux options différentes avec des boutons étiquetés : « Comparer deux styles à la fois » ou « Choisissez vos favoris dans une grande grille ».

Dans le premier cas, lorsque « Comparer deux styles à la fois », Midjourney affiche une grille de 2 images par rangée de 4 images pour n’importe quel nombre d’images que vous avez précédemment sélectionnées dans les options de direction de style de Discord.

L’utilisateur peut ensuite sélectionner une grille 4×4 dans chaque ligne avec un nombre illimité de lignes, et Midjourney la stylisera en fonction de la combinaison de ces grilles. Vous pouvez savoir si un maillage est sélectionné par le contour blanc qui apparaît autour de la grille.

Si je sélectionne l’image de droite à partir de la première ligne et l’image à gauche à partir de la ligne du bas, Midjourney appliquera les deux styles d’image à une combinaison que l’utilisateur pourra appliquer à toutes les images futures. Comme le souligne Midjourney au bas de la page de sélection, la sélection de plus d’options dans chaque ligne donne un style plus « nuancé et bien organisé », tandis que la sélection de quelques options seulement donne un « style gras ».

La deuxième option est « Choisissez vos favoris dans une grande grille », où l’utilisateur ne peut sélectionner qu’une seule image parmi la grille entière de toutes les images générées en fonction du nombre de directions de style précédemment définies. Dans notre article, il y a un total de 32 images disposées dans une grille 8×4. Cette option est plus précise que l’option Comparer deux styles, mais elle crée également plus de limitations.

Dans cet article, nous allons sélectionner « Comparer deux styles à la fois », un total de 5 grilles, puis laisser l’algorithme décider du style combiné.

Appliquez le style nouvellement ajusté aux nouvelles images et invites

Quel que soit le nombre de lignes d’images qu’un utilisateur choisit comme base d’un style, Midjourney appliquera automatiquement ce style et le transformera en un shortcode de chiffres et de lettres que l’utilisateur pourra copier et coller manuellement dans toutes les invites futures. Le code apparaît à plusieurs endroits en bas de la page d’ajustement de style unique de l’utilisateur, à la fois dans la section intitulée « Votre code est : » et dans la section qui suit le code, ainsi que dans un exemple d’indice créé à partir du code original fourni par l’utilisateur, qui se trouve dans un élément chyron superposé persistant tout en bas.

L’utilisateur peut ensuite copier ces codes et les enregistrer quelque part, ou il peut copier l’intégralité de l’invite d’origine et ajouter le code dans le chyron inférieur. Les utilisateurs peuvent également appuyer sur la petite icône « Actualiser » (flèche circulaire) en bas pour refaire l’ensemble du style.

L’utilisateur devra ensuite retourner sur le serveur Discord Midjourney et coller le code après y avoir été invité, comme ceci : « Imaginez / Un robot dans un pull confortable assis devant la cheminée buvant du chocolat chaud dans une tasse - style [insérer le code de style ici] ».

Voici une grille d’images 4×4 que nous avons générée à l’aide de l’indice d’origine et du style nouvellement généré :

Nous aimons le plus le quatrième robot, nous allons donc le sélectionner, cliquer sur « U4 » et c’est tout !

Maintenant, nous pouvons appliquer le même style à la nouvelle invite en copiant-collant/ajoutant manuellement la langue « -style » à la fin de la nouvelle invite comme ceci : « Robot Family Open Gift - Style [insérez le code de style ici] ». Voici quelques-uns des résultats :

Pas mal, non ? Notez que c’est le résultat après quelques allers-retours. En outre, le code de style peut également être utilisé avec d’autres paramètres dans l’invite, y compris le rapport hauteur/taille. Voici une version 16 :9 qui utilise la même invite, mais avec les mots suivants : « Une famille de robots ouvre un cadeau -ar 16 :9 -style [insérer le code de style ici] ».

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)