DALL-E 2 AI di OpenAI è solo una cattiva notizia per alcuni artisti

0
41
ProStockStudio/Shutterstock.com

DALL-E 2 di OpenAI è stato uno shock per coloro che pensavano che l'intelligenza artificiale non sarebbe mai (o almeno non rapidamente) iniziano a infiltrarsi nel regno della creatività. Ma DALL-E 2 è qui per portare gli artisti&8217; lavori?

Come funziona DALL-E 2?

OpenAI

DALL-E 2 è così impressionante che sembra quasi una magia, ma gli ampi dettagli di come crea immagini così straordinarie e realistiche non sono così difficili da capire.

Ci sono due componenti principali in DALL -E 2. Il primo è GPT-3, che è probabilmente l'algoritmo di apprendimento automatico del linguaggio naturale più avanzato attualmente in circolazione. DALL-E 2 utilizza anche un altro modello OpenAI noto come CLIP (Contrastive Language-Image Pre-training).

CORRELATICos'è l'apprendimento automatico?

GPT-3 e CLIP consentono a un computer di comprendere e generare un sofisticato linguaggio naturale. Addestrando la rete neurale DALL-E con miliardi di immagini e le loro descrizioni in linguaggio naturale da (principalmente) Internet, apprende le relazioni tra i concetti.

In un certo senso, DALL-E è il contrario di un pratica comune di apprendimento automatico, in cui fornisci un'immagine e l'IA tenta di descrivere ciò che vede.

OpenAI

Pensa a quel famigerato “Not a Hotdog” app dal programma televisivo Silicon Valley. La differenza qui è che invece di chiedere all'IA se l'immagine è un hotdog o meno, stai descrivendo l'hotdog e sta generando un'immagine di hotdog completamente originale basata su tutto ciò che ha appreso su di loro .

La seconda parte importante di DALL-E è il modo in cui genera le immagini. Utilizza un metodo noto come “diffusione.” In particolare, la comprensione della descrizione di un'immagine nel linguaggio umano che è stata creata, viene trasformata in un'immagine utilizzando un modello OpenAI chiamato GLIDE. GLIDE acquisisce un'immagine composta da rumore generato in modo casuale e quindi rimuove gradualmente quel rumore fino a quando non corrisponde all'immagine come descritto nel linguaggio naturale. Ricorda in qualche modo uno scultore che inizia con un blocco di marmo e scheggia finché non rimane solo una statua.

Per una descrizione molto più tecnica e dettagliata di DALL-E 2 sotto il cofano, consiglio vivamente l'esplicativo di DALL-E 2 sul blog di deep learning di AssemblyAI.

Perché DALL-E 2 è così dirompente

ivector/Shutterstock.com

DALL-E 2 è tutt'altro che il primo software di machine learning in grado di generare immagini. Ci sono stati molti sistemi precedenti e DALL-E 2 si basa sulle lezioni apprese da quegli altri progetti. Allora perché questa volta sembra un punto di svolta dirompente?

Un motivo significativo è che le immagini realizzate da DALL-E e DALL-E 2 sono esteticamente gradevoli. Altri sistemi di generazione di immagini AI spesso creano immagini che le persone descrivono come inquietanti o come qualcosa di un sogno. È un po' come la Uncanny Valley, ma per le arti visive. DALL-E 2 crea immagini che hanno chiaramente un occhio artistico o un senso estetico alle spalle.

Quindi le immagini che crea DALL-E 2 sono paragonabili a quelle realizzate da artisti o fotografi di talento che hanno trascorso un tutta la vita sviluppando il loro senso estetico. Non è difficile immaginare qualcuno del genere guardando le immagini che DALL-E 2 può sputare in pochi secondi e sentendosi come se stessero per diventare irrilevanti.

OpenAI

Non solo il sistema è in grado di creare bellissime immagini ad alta risoluzione in pochi secondi da prompt in linguaggio naturale , ma può anche modificare e modificare tali immagini o fornire più varianti di un'immagine esistente, anche quella fornita dall'utente. Quindi questo significa che gli artisti dovrebbero impacchettare i loro cavalletti e tavolette da disegno e “imparare a programmare” invece?

DALL-E 2 significa che gli artisti cambieranno, non scompariranno

Gorodenkoff/Shutterstock.com

OpenAI è stata molto attenta a rilasciare semplicemente la sua tecnologia al mondo. Questo è sensato dal momento che c'è chiaramente molto spazio per gli abusi. Tuttavia, ora che hanno dimostrato che può essere fatto, non passerà il momento prima che i ricercatori di IA commerciali o indipendenti replichino ciò che fa DALL-E e lo renda disponibile a tutti. Anche i grandi attori nello spazio dell'apprendimento automatico hanno i loro artisti di intelligenza artificiale ad alte prestazioni che aspettano dietro le quinte, come s Imagen di Google.

Dato che il vaso di Pandora può’ Per essere chiusi, dovremo accettare che il mondo delle arti visive cambierà irrevocabilmente, ma ciò non significa che gli artisti appartengano al passato.

Un modo per vederla è che una tecnologia come questa mette il potere di generare arte nelle mani di chiunque. L'enfasi ora si sposta dalla capacità tecnica di creare immagini alla capacità di descrivere con precisione e iterare la tua visione, fino a quando ciò che vedi sullo schermo corrisponde a ciò che avevi in ​​mente. In altre parole, più persone ora avranno la capacità di esprimersi visivamente, così come più persone ora possono eseguire calcoli accurati grazie all'esistenza di calcolatrici.

Alcuni tipi di artisti potrebbero non avere più modelli di business praticabili. Se ti guadagni da vivere facendo commissioni a pagamento, è difficile competere con un programma che può fare centinaia di immagini all'ora in base alla descrizione di un cliente e può apportare modifiche a quelle immagini quasi istantaneamente. Invece, potresti voler utilizzare questi strumenti per realizzare la tua visione e poi vendere quelle immagini uniche in base alla tua sensibilità.

Il cliente ha sempre ragione

È anche importante ricordare che alla fine queste immagini sono create per il consumo umano. Noi umani abbiamo il nostro insieme di valori che vanno oltre la comodità e la superiorità tecnica. In un mondo in cui l'arte generata è abbondante e quindi relativamente economica e usa e getta, ci sarà sempre un pubblico disposto ad apprezzare (e acquistare) l'arte creata dall'uomo, semplicemente perché potrebbe essere una rarità relativa.

In in altre parole, software come DALL-E 2 potrebbero segnare la fine per gli artisti che si guadagnano da vivere sfornando opere d'arte da catena di montaggio, ma è improbabile che smorzino le prospettive per artisti che hanno qualcosa da dire e un'identità visiva unica attraverso la quale parlare.

LEGGI SUCCESSIVO

  • › Recensione del monitor INNOCN Ultrawide da 40 pollici 40C1R: un grosso problema con alcuni compromessi
  • › 10 funzioni Samsung Galaxy da utilizzare
  • › Come utilizzare iMessage su Android e Windows
  • › Che cos'è il mAh e in che modo influisce su batterie e caricabatterie?
  • › Novità di Chrome 103, ora disponibile
  • › 4 modi in cui stai danneggiando la batteria del tuo laptop