Comment écrire une invite de diffusion stable impressionnante

0
158
Les Adirondacks au coucher du soleil en automne. Sauf que cette image est un faux produit en 18,5 secondes.

Stable Diffusion, un générateur d'art AI populaire, nécessite des invites de texte pour créer une image. Parfois, il fait un travail incroyable et génère exactement ce que vous voulez avec une vague invite. D'autres fois, vous obtenez des sorties sous-optimales. Voici quelques trucs et astuces pour obtenir des résultats idéaux.

Comment écrire une invite de diffusion stable

Si vous avez passé du temps avec des générateurs d'images AI, comme Stable Diffusion, DALL -E, ou MidJourney, vous aurez remarqué qu'une invite bien formulée critique. Une invite bien formulée est la différence entre transformer votre idée en une superbe image et obtenir une monstruosité étrange avec trop de doigts qui vous regardent.

RELATEDComment exécuter une diffusion stable sur votre PC pour générer des images AI

Depuis le lancement de Stable Diffusion en août 2022, les gens essaient de trouver les meilleurs moyens d'obtenir des résultats idéaux, et ils seront “formés rapidement”. ou “ingénierie rapide” pour les années à venir. C'est d'autant plus probable que les points de contrôle qui informent sur la façon dont Stable Diffusion génère des images recevront des mises à jour périodiques. L'invite idéale sera une cible mouvante dans un avenir prévisible.

CONNEXE : Les meilleurs générateurs d'images AI que vous pouvez utiliser dès maintenant

Soyez aussi précis que possible

La diffusion stable a tendance à prospérer sur des invites spécifiques, en particulier par rapport à quelque chose comme MidJourney. Vous devez lui dire exactement ce que vous voulez. Voici un exemple utilisant les animaux préférés d'Internet : Chats mignons.

Invite : “Cute Cat”, Échantillonneur = PLMS, CFG = 7, Étapes d'échantillonnage = 50

D'accord , ils sont plutôt mignons, sauf peut-être le pauvre type en haut au milieu qui a l'air d'avoir passé trop de temps à regarder dans l'abîme. Et si vous vouliez des chats gris, pas un mélange de chats ? Eh bien, vous devez le préciser. Utilisez “Chats gris mignons” comme invite à la place.

Invite : “Cute Grey Cat”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Désormais, Stable Diffusion renvoie tous les chats gris. Vous pouvez continuer à ajouter des descriptions de ce que vous voulez, y compris accessoiriser les chats dans les images.

Invite : “Chat gris mignon aux yeux bleus, portant un nœud papillon”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Ceci s'applique à tout ce que vous voulez que Stable Diffusion produise, y compris les paysages. Soyez descriptif et, au fur et à mesure que vous essayez différentes combinaisons de mots-clés, gardez une note mentale de la façon dont l'image change. Certains mots et expressions ont tendance à biaiser plus fortement une image que d'autres mots, vous devrez donc peut-être ajuster votre invite en conséquence.

Nommez des styles ou des supports artistiques spécifiques

Le besoin de spécificité ne s'arrête pas lorsque vous décrivez complètement le contenu de l'image que vous souhaitez. Vous pouvez (et devriez) également spécifier le style que vous souhaitez. Nous resterons avec notre “Chat gris mignon” demande pour cela. Disons que nous voulons des chats gris mignons, mais nous voulons aussi qu'ils ressemblent à une peinture acrylique. La première chose que vous devriez essayer est d'ajouter “peinture acrylique” comme mot-clé suivant dans votre invite, il se lirait donc : "Cute Grey Cat, peinture acrylique".

Il est généralement préférable de commencer avec le moins de mots clés pour se rapprocher de ce que vous voulez, puis d'en ajouter d'autres pour vous concentrer sur l'esthétique que vous recherchez.

Invite : “Cute Grey Cat, peinture acrylique”, Sampler = PLMS, CFG = 7, Étapes d'échantillonnage = 50

La diffusion stable reconnaît des dizaines de styles différents, allant des dessins au crayon aux modèles d'argile en passant par le rendu 3D d'Unreal Engine.

Invite : “Chat gris mignon, rendu Unreal Engine&# 8221;, Sampler = PLMS, CFG = 7, Sampling Steps = 50

Ces exemples d'invites sont extrêmement simples, mais vous pouvez utiliser des dizaines de mots-clés pour affiner vos résultats. Si vous voulez des modèles de poulet en argile bizarres et de couleur psychédélique dans un Walmart, vous devez spécifier tous ces termes.

Invite : “buste de poulet dans un walmart, modèle en argile, (couleurs psychédéliques), fondant, bizarre” Sampler = PLMS, CFG = 7, Sampling Steps = 150

Nom d'artistes spécifiques pour guider Stable Diffusion

Stable Diffusion est capable de faire plus qu'émuler des styles ou des médiums spécifiques ; il peut même imiter des artistes spécifiques si vous le souhaitez. Cet exemple utilise Pablo Picasso.

Vous devriez certainement essayer de lancer “par (nom de l'artiste)” dans vos invites si vous ne l'avez pas déjà fait. Il a tendance à produire des résultats spectaculaires. N'ayez pas peur non plus de combiner des artistes qui n'iraient pas ensemble normalement. Souvent, Stable Diffusion combinera leurs styles respectifs de manière excitante et imprévisible.

Conseil :Si vous utilisez la version graphique de Stable Diffusion pour Windows que nous vous recommandons, il existe un “Roll” à droite de la fenêtre d'invite qui lancera au hasard un artiste sur votre invite. C'est un excellent moyen de découvrir de nouveaux styles.

Posez vos mots clés

Bien sûr, le simple fait de bloquer des mots-clés dans votre invite ne vous mènera que jusqu'à présent. Que se passe-t-il si vous obtenez toutes les bonnes choses dans votre invite, mais qu'elles ne sont pas correctement proportionnées ?

Stable Diffusion prend en charge la pondération des mots-clés d'invite. En d'autres termes, vous pouvez lui dire qu'il doit vraiment faire attention à un mot-clé (ou des mots-clés) spécifique et faire moins attention aux autres. C'est pratique si vous obtenez des résultats qui correspondent un peu à ce que vous recherchez, mais pas tout à fait.

CONNEXE : Comment exécuter Diffusion stable sur votre PC pour générer des images AI

Dans la version en ligne de commande de Stable Diffusion, vous ajoutez simplement deux points suivis d'un nombre décimal au mot que vous souhaitez mettre en valeur. Les nombres décimaux sont des pourcentages, ils doivent donc totaliser 1.

Revenons à notre “Chat gris mignon” invite, imaginons qu'il produisait correctement des chats mignons, mais peu d'images de sortie comportaient des chats gris. Vous pouvez modifier l'invite pour lire : “chat mignon et gris : 0,7” à la place, et il accorderait le plus d'attention au chat gris, puis appliquerait automatiquement la différence à “mignon”. Vous pouvez également attribuer manuellement des pondérations à chaque mot de l'invite si vous souhaitez un contrôle plus précis, comme “Cute : 0,10, Gray Cat : 0,60, rendu Unreal Engine : 0,30” par exemple.

RELATED : Comment exécuter une diffusion stable localement avec une interface graphique sous Windows

La plupart des interfaces graphiques disponibles pour la diffusion stable gèrent la pondération sans vous obliger à saisir des pourcentages explicites. Vous pouvez généralement ajouter des parenthèses autour d'un terme dans votre invite pour le souligner, et des crochets pour diminuer l'importance d'un terme. Ainsi, le précédent “chat gris mignon” pourrait ressembler à “[mignon],((chat gris)).”

Remarque : Vous pouvez utiliser plusieurs parenthèses pour empiler accentuez autant que vous le souhaitez.

Trouvez l'inspiration ailleurs

Stable Diffusion et d'autres générateurs d'art IA ont connu un pic de popularité explosif. Vous pouvez trouver ce genre d'art de l'IA partout. Cela signifie qu'il y a maintenant au moins quelques millions d'images générées par les utilisateurs qui circulent sur Internet, et la plupart du temps, les gens incluent l'invite qu'ils ont utilisée pour obtenir leurs résultats.

RELATED :< /strong> Cette galerie d'art AI est encore meilleure que l'utilisation d'un générateur

Voici quelques ressources pour vous aider à stimuler votre inspiration si vous n'êtes pas sûr de ce que vous ;re cherche à créer :

Avertissement : Tous ces éléments sont potentiellement NSFW.

  • Lexique — un référentiel d'images générées à l'aide de Stable Diffusion et l'invite correspondante. Recherche par mot-clé.
  • Études de style d'artiste de diffusion stable &#8212 ; Une liste non exhaustive d'artistes que Stable Diffusion pourrait reconnaître, ainsi que des descriptions générales de leur style artistique. Il existe un système de classement pour décrire dans quelle mesure Stable Diffusion répond au nom de l'artiste dans le cadre d'une invite.
  • Études de modificateur de diffusion stable &#8212 ; une liste de modificateurs pouvant être utilisés avec Stable Diffusion, tout comme la page de l'artiste.
  • La liste des modificateurs AI Art — Une galerie de photos présentant certains des modificateurs les plus puissants que vous pouvez utiliser dans vos invites et ce qu'ils font. Ils sont triés par type de modificateur.
  • Top 500 des artistes représentés dans Stable Diffusion — Nous savons exactement quelles images ont été incluses dans l'ensemble de formation Stable Diffusion, il est donc possible de dire quels artistes ont le plus contribué à la formation de l'IA. De manière générale, plus un artiste est fortement représenté dans les données d'entraînement, mieux Stable Diffusion répondra à son nom en tant que mot-clé.
  • Le sous-reddit Stable Diffusion — Le subreddit Stable Diffusion propose un flux constant de nouvelles invites et de découvertes amusantes. Si vous êtes à la recherche d'inspiration ou de perspicacité, vous ne pouvez pas vous tromper.

Tweak Other Important Settings

Une bonne invite est la partie la plus difficile de l'utilisation de la diffusion stable, mais il existe quelques autres paramètres qui modifieront considérablement les résultats.

  • CFG : détermine la force de diffusion stable suit votre invite. Des nombres plus élevés entraînent une plus grande adhésion à l'invite, tandis que des nombres inférieurs donnent plus de liberté à l'IA. Essayez d'abord d'ajuster cela.
  • Méthode d'échantillonnage : comment l'image est affinée du bruit en formes reconnaissables. Essayez-en quelques-unes. Euler_a, k_LMS et PLMS semblent être des choix populaires.
  • Étapes d'échantillonnage : le nombre de fois qu'une image sera échantillonnée avant que vous ne receviez un résultat final. Parfois, vous obtenez de bons résultats à 30 étapes, parfois vous devez passer à 50 ou 80. Vous n'obtenez généralement pas de meilleurs résultats au-delà de 150 étapes. Commencez par moins d'étapes et montez.

Certaines de nos invites stylisées préférées

Ce sont quelques-unes de nos invites préférées car elles ont tendance à fonctionner de manière si fiable. Déposez simplement un sujet de votre choix plus quelques modificateurs. Tous les autres paramètres de diffusion stable sont restés les mêmes que les invites ci-dessus.

Remarque : En règle générale, la diffusion stable crée des couchers de soleil et des feuilles d'automne exceptionnellement bien.

(Sujet), 35 mm, net

Choisissez un sujet et cette invite renvoie de manière fiable des résultats photoréalistes de personnes, d'animaux et de paysages.

Remarque :Cet exemple d'invite incluait également “Golden Hour” pour obtenir les couleurs du coucher du soleil.

Invite : photographie de monter katahdin avec un beau lac, 35 mm, pointu, heure d'or

(Sujet), rendu 3d low poly, couleurs pastel vibrantes, tilt shift, grain de film

Entrez un sujet et vous& #8217;ll l'obtiendra dans l'“Art du rallye” esthétique.

(Sujet), (Description environnementale), cinématographique, dramatique, composition, ciel ensoleillé, brutaliste, hyper réaliste, échelle épique , sentiment d'émerveillement, hypermaximaliste, niveau de détails insensé, artstation HQ

Insérez simplement un sujet et une description de l'environnement, et cette invite fournit de superbes images d'art conceptuel de la ville avec un effet environnemental de votre choix. Voici un exemple utilisant la ville de New York comme sujet et la tempête de poussière comme description de l'environnement :

invite : new york, tempête de poussière, cinématique, dramatique, composition , ciel ensoleillé, brutaliste, hyper réaliste, échelle épique, sens de la crainte, hypermaximaliste, niveau de détails insensé, artstation HQ

Kermit Anything

Stable Diffusion produit d'excellents résultats avec Kermit. Essayez-le n'importe où.

Pourquoi est-ce ainsi que Stable Diffusion interprète “Kermit in Mordor,” et qui est la chose rouge diabolique de Kermit qui se tient derrière notre fidèle héros ? Aucune idée.

N'oubliez pas, n'ayez pas peur de supprimer ce que vous pensez être un terme clé de votre invite. Certains mots, comme “magnifique,” influencera fortement l'apparence d'une image, même si elle n'a pas de signification précise. Au fur et à mesure que vous passerez plus de temps avec Stable Diffusion, vous développerez une idée de la façon dont il réagit à certains mots, et vous découvrirez rapidement qu'écrire une bonne invite est un art en soi.

LIRE LA SUITE

  • &rsaquo ; Comment installer la mise à jour 2022 de Windows 11 (22H2)
  • › Comment vérifier la version de PowerShell sous Windows 11
  • › Comment débloquer Spotify
  • &rsaquo ; Comment prendre des instantanés dans VLC
  • &rsaquo ; Comment mettre à jour PowerShell sous Windows 11
  • › La mise à jour 2022 de Windows 11 est là, bientôt les onglets de l'explorateur de fichiers