Hur man skriver en fantastisk stabil diffusionsprompt

0
111
Adirondacks vid solnedgången under hösten. Förutom att den här bilden är en förfalskning som produceras på 18,5 sekunder.

Stable Diffusion, en populär AI-konstgenerator, kräver textuppmaningar för att skapa en bild. Ibland gör den ett fantastiskt jobb och genererar precis vad du vill ha med en vag uppmaning. Andra gånger får du suboptimala utgångar. Här är några tips och tricks för att få perfekta resultat.

Hur man skriver en stabil diffusionsprompt

Om du har spenderat någon tid alls med AI-bildgeneratorer, som Stable Diffusion, DALL-E eller MidJourney, har du märkt att en välformulerad uppmaning kritisk. En välformulerad uppmaning är skillnaden mellan att förvandla din idé till en fantastisk bild och att få en otrolig dalgång med alldeles för många fingrar som stirrar tillbaka på dig.

RELATEDHur man kör stabil diffusion på din dator för att generera AI-bilder

Människor har försökt hitta de bästa sätten att få perfekta resultat sedan Stable Diffusion lanserades i augusti 2022, och de kommer att “smida snabbt” eller “prompt engineering” i flera år framöver. Det är särskilt troligt eftersom kontrollpunkterna som informerar om hur stabil diffusion genererar bilder kommer att få periodiska uppdateringar. Den idealiska uppmaningen kommer att vara ett rörligt mål under överskådlig framtid.

RELATERAT: De bästa AI-bildgeneratorerna du kan använda just nu

Var så specifik som du kan

Stabil diffusion tenderar att frodas på specifika uppmaningar, speciellt jämfört med något som MidJourney. Du måste berätta exakt vad du vill. Här är ett exempel som använder internets favoritdjur: Söta katter.

Prompt: “Söt katt”, Sampler = PLMS, CFG = 7, Samplingssteg = 50< /figure>

Okej, de är ganska söta, förutom kanske den stackars i övre mitten som ser ut att ha spenderat för mycket tid på att stirra ner i avgrunden. Men tänk om du ville ha grå katter, inte en blandning av katter? Tja, du måste specificera det. Använd “Söta grå katter” som din uppmaning istället.

Prompt: “Söt grå katt”, Sampler = PLMS, CFG = 7, Samplingssteg = 50

Nu returnerar stabil diffusion alla grå katter. Du kan fortsätta att lägga till beskrivningar av vad du vill, inklusive tillbehör till katterna på bilderna.

Uppmaning: “Söt grå katt med blå ögon, klädd i fluga”, Sampler = PLMS, CFG = 7, Samplingssteg = 50

Detta gäller allt du vill att Stabil Diffusion ska producera, inklusive landskap. Var beskrivande, och när du provar olika kombinationer av sökord, håll en mental anteckning om hur bilden förändras. Vissa ord och fraser tenderar att vara mer partiska för en bild än andra ord, så du kan behöva justera din uppmaning därefter.

Namn specifika konststilar eller medier

Behovet av specificitet slutar inte när du fullständigt beskriver innehållet i bilden du vill ha. Du kan (och bör) också ange vilken stil du vill ha. Vi håller fast vid vår “söta grå katt” fråga om detta. Låt oss säga att vi vill ha några söta grå katter, men vi vill också att de ska se ut som om de är en akrylmålning. Det första du bör prova är att lägga till “akrylmålning” som nästa nyckelord i din prompt, så den skulle lyda: “Söt grå katt, akrylmålning.”

Det är generellt sett bäst att börja med så få sökord för att komma nära det du vill ha och sedan lägga till fler i den estetik du letar efter.

Prompt: “Söt grå katt, akrylmålning”, Sampler = PLMS, CFG = 7, Samplingssteg = 50

Stabil diffusion känner igen dussintals olika stilar, allt från blyertsteckningar till lermodeller till 3d-rendering från Unreal Engine.

Prompt: “Söt Grey Cat, Unreal Engine-rendering”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

De här exemplen är extremt enkla, men du kan använda dussintals nyckelord för att finjustera dina resultat. Om du vill ha konstiga, psykedeliskt färgade lerkycklingmodeller i en Walmart måste du ange alla de här termer.

Prompt: “byst av en kyckling i en walmart, lermodell, (psykedeliska färger), smältande, konstigt& #8221; Sampler = PLMS, CFG = 7, Samplingssteg = 150

Nämn specifika artister för att vägleda stabil diffusion

Stabil diffusion kan göra mer än att emulera specifika stilar eller medier; den kan till och med efterlikna specifika artister om du vill göra det. Det här exemplet använde Pablo Picasso.

Du borde definitivt prova att kasta “by (artistnamn)” i dina meddelanden om du inte redan har gjort det. Det tenderar att ge dramatiska resultat. Var inte rädd för att kombinera artister som normalt inte skulle gå ihop heller. Ofta kombinerar Stable Diffusion sina respektive stilar på spännande och oförutsägbara sätt.

Tips:Om du använder GUI-versionen av Stable Diffusion för Windows som vi rekommenderade, finns det en “Roll” knappen till höger om promptfönstret som slumpmässigt kastar en artist på din prompt. Det är ett bra sätt att snubbla in i nya stilar.

Vikta dina sökord

Naturligtvis kommer du bara så långt att bara lägga in sökord i din prompt. Vad händer om du får alla rätt saker i din prompt, men de inte är korrekt proportionerade?

Stabil diffusion stöder viktning av snabba nyckelord. Med andra ord kan du säga att den verkligen behöver vara uppmärksam på ett specifikt sökord (eller nyckelord) och ägna mindre uppmärksamhet åt andra. Det är praktiskt om du får resultat som är ungefär vad du letar efter, men inte riktigt där.

RELATERAT: Hur man springer Stabil spridning på din dator för att generera AI-bilder

I kommandoradsversionen av Stable Diffusion lägger du bara till ett helt kolon följt av ett decimaltal till ordet du vill framhäva. Decimaltalen är procentsatser, så de måste läggas till 1.

Går tillbaka till vår “Söt grå katt” snabb, låt oss föreställa oss att den producerade söta katter korrekt, men inte särskilt många av de utgående bilderna visade grå katter. Du kan ändra uppmaningen så att den lyder: “söt, grå katt:0.7” istället, och det skulle ägna mest uppmärksamhet åt grå katt, tillämpar sedan skillnaden automatiskt på “söt.” Du kan också tilldela vikter till varje ord i prompten manuellt om du vill ha bättre kontroll, som “Söt:0.10, Grå katt:0.60, Unreal Engine rendering:0.30” till exempel.

RELATERAT: Hur man kör stabil diffusion lokalt med ett GUI på Windows

De flesta av de tillgängliga grafiska användargränssnitten för stabil diffusion hanterar viktning utan att du behöver ange explicita procentsatser. Du kan vanligtvis lägga till parenteser runt en term i din prompt för att betona den, och parenteser för att minska betydelsen av en term. Så den tidigare “söta, grå katten” kan se ut som “[söt],((grå katt)).”

Obs: Du kan använda flera parenteser för att stapla öka betoningen så mycket du vill.

Hitta inspiration någon annanstans

Stable Diffusion och andra AI-konstgeneratorer har upplevt en explosiv popularitetspik. Du kan hitta den här typen av AI-konst överallt. Det betyder att det nu finns minst ett par miljoner användargenererade bilder som svävar runt på internet, och för det mesta inkluderar människor den prompt de använde för att få sina resultat.

RELATERAT:< /strong> Detta AI-konstgalleri är ännu bättre än att använda en generator

Här är några resurser som kan hjälpa dig att inspirera dig om du inte är säker på vad du&#8217 ;re looking to create:

Varning: Alla dessa är potentiellt NSFW.

  • Lexica — ett arkiv med bilder som genererats med hjälp av stabil diffusion och motsvarande prompt. Sökbar med nyckelord.
  • Stable Diffusion Artist Style Studies — En icke uttömmande lista över artister som Stable Diffusion kan känna igen, såväl som allmänna beskrivningar av deras konstnärliga stil. Det finns ett rankningssystem för att beskriva hur väl Stable Diffusion svarar på artistens namn som en del av en prompt.
  • Studier av stabil diffusionsmodifierare — en lista över modifierare som kan användas med Stable Diffusion, precis som artistsidan.
  • AI Art Modifiers List — Ett fotogalleri som visar några av de starkaste modifierarna du kan använda i dina meddelanden och vad de gör. De är sorterade efter modifieringstyp.
  • Topp 500 artister representerade i stabil spridning — Vi vet exakt vilka bilder som ingick i träningssetet Stable Diffusion, så det är möjligt att avgöra vilka artister som bidrog mest till att träna AI:n. Generellt sett gäller att ju starkare en artist var representerad i träningsdatan, desto bättre kommer Stable Diffusion att svara på deras namn som ett nyckelord.
  • The Stable Diffusion Subreddit — The Stable Diffusion subreddit har ett konstant flöde av nya uppmaningar och roliga upptäckter. Om du letar efter inspiration eller insikt kan du inte gå fel.

Justera andra viktiga inställningar

En bra uppmaning är den svåraste delen av att använda stabil diffusion, men det finns några andra inställningar som dramatiskt kommer att förändra resultaten.

  • CFG: Bestämmer hur starkt stabil diffusion följer din uppmaning. Högre siffror resulterar i mer följsamhet till prompten, medan lägre siffror ger AI mer frihet. Försök att justera detta först.
  • Samplingsmetod: Hur bilden förfinas från brus till igenkännbara former. Prova några av dessa. Euler_a, k_LMS och PLMS verkar vara populära val.
  • Samplingssteg: Antalet gånger en bild kommer att samplas innan du får ett slutresultat. Ibland får du bra resultat vid 30 steg, ibland behöver du gå till 50 eller 80. Du brukar inte få bättre resultat över 150 steg. Börja med färre steg och gå upp.

Några av våra favoritstilade uppmaningar

Det här är några av våra favorituppmaningar eftersom de tenderar att fungera så tillförlitligt. Lägg bara in ett ämne du väljer plus några modifierare. Alla andra stabila diffusionsinställningar behölls på samma sätt som anvisningarna ovan.

Obs: Som regel skapar stabil diffusion solnedgångar och höstlöv exceptionellt bra.

(Ämne), 35 mm, skarpt

Välj ett motiv och denna prompt returnerar tillförlitligt fotorealistiska resultat av människor, djur och landskap.

Obs!Det här exemplet inkluderade också “Golden Hour” för att få solnedgångsfärgerna.

Prompt: fotografi av berget katahdin med en vacker sjö, 35 mm, skarp, gyllene timme

(Ämne), låg poly 3d-rendering, levande pastellfärger, tilt shift, filmkorn

< p>Ange ett ämne så får du det i “Art of Rally” estetisk.

(Ämne), (miljöbeskrivning), filmisk, dramatisk, komposition, solig himmel, brutalist, hyperrealistisk, episk skala, känsla av vördnad, hypermaximalistisk, galen detaljnivå, artstation HQ

Släpp bara in ett ämne och en miljöbeskrivning, så ger denna uppmaning fantastiska stadskonceptbilder med en miljö effekt av ditt val. Här är ett exempel med New York City som ämne och dammstorm som miljöbeskrivning:

prompt: new york city, damm storm, filmisk, dramatisk, komposition, solig himmel, brutalistisk, hyperrealistisk, episk skala, känsla av vördnad, hypermaximalistisk, galen detaljnivå, artstation HQ

Kermit Anything

Stabil diffusion ger fantastiska resultat med Kermit. Prova var som helst.

Varför är det så här Stable Diffusion tolkar “Kermit in Mordor,” och vem är den röda onda-Kermit-grejen som står bakom vår trofasta hjälte? Ingen aning.

Kom ihåg, var inte rädd för att ta bort det du tror kan vara ett nyckelord från din uppmaning. Vissa ord, som “snyggt,” kommer i hög grad att påverka hur en bild ser ut, även om den inte har en exakt betydelse. När du spenderar mer tid med Stable Diffusion kommer du att utveckla en känsla för hur den svarar på vissa ord, och du kommer snabbt att upptäcka att det är en konst för sig att skriva en bra uppmaning.

LÄS NÄSTA

  • › Hur man tar ögonblicksbilder i VLC
  • › Så här uppdaterar du PowerShell i Windows 11
  • › Windows 11’s 2022-uppdatering är här, filutforskaren flikar snart
  • › Så här kontrollerar du PowerShell-versionen i Windows 11
  • › Hur man avblockerar Spotify
  • › Så här installerar du Windows 11’s 2022-uppdatering (22H2)