Vad är Generativ AI?

Generativ AI är en artificiell intelligensteknologi som potentiellt kan förändra hur vi interagerar med maskiner. Det är en typ av AI som kan skapa nytt innehåll som text, bilder, ljud och video baserat på dess förståelse av världen och input från användaren.

Under de senaste månaderna har appar som använder Generativ AI exploderat på marknaden. AI-fotoappen Lensa och OpenAI’s chatbot, ChatGPT, gjorde ett stort plask eftersom de gör högkvalitativ text och bilder på begäran. Nu spelar Microsoft och Google catchup. Men vad är generativ AI, och hur fungerar det?

Innehållsförteckning

Vad är generativ AI?
Typer av generativ AI och hur de fungerar
tillämpningar av generativ AI
Potentiella risker och etiska överväganden
Slutliga tankar: Välkommen till framtiden

Vad är generativ AI?

För att uttrycka det så enkelt som möjligt: Generativ AI är en AI (så kallad “artificiell intelligens”) som skapar unikt innehåll baserat på en uppmaning från en användare. Till exempel, uppmaningen att du ger Lensa att göra de där coola AI-profilbilderna ett urval av selfies. I ChatGPT’s fall kan en uppmaning vara “skriv en sonett om bagels i stil med HL Mencken.” Den resulterande texten och bilderna är helt unika och genererade av AI. Och det är inte bara text och bilder som generativ AI kan skapa. Andra AI-produkter kan skapa kusliga röståterskapningar, och det finns till och med tjänster som väntar i kulisserna som kan skapa videoinnehåll baserat på textuppmaningar.

Generativ AI kombinerar två kraftfulla AI-teknologier: maskininlärning och förmågan att skapa nytt innehåll. AI-programmerare använder maskininlärning för att bygga modeller som kan känna igen mönster och trender i befintlig data, medan innehållsgenerering möjliggör skapandet av unika föremål som en komposition eller en bild. När en AI har en tillräckligt stor provstorlek att dra från (dess träningsuppsättning) kan den återskapa i stort sett allt den kan känna igen. Och eftersom datamängden för att träna AI-modeller som ChatGPT är så stor, kan den blanda och matcha element från flera källor för att leverera något som är både unikt och igenkännbart som vad man än bad om.

Typer av generativ AI och hur de fungerar

Generativa AI-algoritmer finns i många former men delas in i tre generella kategorier: generativa motstridiga nätverk (GAN), variationsautokodare (VAE) och transformatormodeller som GPT-4. Varje typ av generativ AI-algoritm har sina fördelar och nackdelar.

RELATERAT AI är egentligen inte artificiell intelligens

GAN:er är en typ av generativ AI som använder två djuplärande neurala nätverk för att generera ny data. Det första nätverket, kallat generatorn, är tränat att skapa ny data som liknar befintligt innehåll, medan det andra nätverket, som kallas diskriminatorn, tränas för att skilja mellan verklig och genererad data. När programmerare tränar sina AI:er lär sig generatorn hur man producerar allt mer realistiska bilder som lurar diskriminatorn att tro att de är verkliga. Denna process är känd som ett “minimaxspel” eftersom varje nätverk försöker överlista det andra samtidigt som de minimerar sina egna misstag.

En potentiell nackdel med GAN är att de ibland kan producera orealistiska eller suddiga bilder. Till exempel kan en GAN som är utbildad för att skapa bilder av mänskliga ansikten ibland skapa bilder med ett extra par ögon eller en förvrängd ansiktsstruktur. Människohänder kan se ut som en ren mardröm. Det är dock fortfarande tidiga dagar för den här tekniken, och sådana här problem kommer att lösas i sinom tid.

VAE är en annan typ av generativ AI som används för att generera ny, unik data. Till skillnad från GAN:er använder VAE:er en komprimerad representation av dess indata för att generera något nytt som liknar originalet. VAE används oftast för att göra bilder och videor, men de kan också generera text. En potentiell begränsning av VAE är att deras data kanske inte är lika varierande som de som genereras av GAN eftersom VAE lär sig en mer begränsad representation av indata. Dessutom lider VAE ibland av de förvrängda bildproblem som GAN stöter på.

RELATERATÄr ChatGPT Plus värt pengarna?

Transformatormodeller som GPT-4 är en relativt nyare iteration av generativ AI som har lockat många ögonglober på grund av deras imponerande prestanda på många naturliga språkbehandlingsuppgifter. ChatGPT är det nuvarande guldstjärnexemplet på en transformatorbaserad AI-produkt. Dessa modeller är baserade på en typ av neural nätverksarkitektur som kallas en “transformator.” De är utformade för att bearbeta massiva datasekvenser, är tränade på en enorm textdatauppsättning och kan ge sammanhängande och kontextuellt relevanta svar på en uppmaning.

Fördelen med transformatormodeller är att de kan generera mångsidig och högkvalitativ text. De kan dock drabbas av fördomar och felaktigheter i träningsdata, vilket leder till olämpliga eller felaktiga utdata. Dessutom kan den enorma mängden beräkningsresurser och data som krävs för att träna och köra dessa modeller göra dem svåra och dyra för vissa applikationer.

Applikationer av generativ AI

Generativ AI används redan i en mängd populära tjänster. Det finns den tidigare nämnda chatboten ChatGPT, gjord av OpenAI och dess systerbildsgenerator DALL-E. Det finns också en mängd AI-bildredigerare, inklusive Lensa (iOS, Android), Wonder (iOS, Android) och mer. De har alla funnits ett tag. Men när ChatGPT tog fart bestämde Silicon Valley att det var dags att släppa lös den nya tekniken och tillkännagav den ena nya AI-produkten efter den andra.

RELATEDJag fick Bings Chat AI att bryta varje regel och bli galen

Precis sedan början av detta år tillkännagav både Microsoft och Google AI-förtrollningar till sina sökmotorer. Följs strax därefter av mindre sökleverantörer DuckDuck Go och Brave. Microsoft har lagt till AI-bildgenerering till Bing och Edge, samt AI-komponenter till sin kontorssvit. Till och med Opera lägger till ChatGPT till sin skrivbordswebbläsare. Dessutom har Shutterstock och Adobe kommit ut med AI-konstgeneratorer som är utbildade för kompenserade användares arbete.

Men generativ AI kan gå långt utöver bildskapare, chatbotar och sökassistenter. Proffs från alla samhällsskikt kan använda dessa verktyg i sitt arbete. Generativ AI har potentiella tillämpningar inom produktdesign, vilket gör det möjligt för företag att skapa skräddarsydda produkter skräddarsydda för varje kunds behov. Dessutom kan den användas av sjukvårdspersonal genom att hjälpa till med diagnostik och behandlingsutveckling.

Dessutom kan generativ AI skapa personligt innehåll, såsom nyhetsartiklar eller musikspellistor. Genom att analysera en användares preferenser och beteende kan generativa AI-algoritmer generera innehåll som är anpassat efter deras intressen, vilket ökar användarnas engagemang och tillfredsställelse. Generativ AI kan hjälpa till att skapa nytt innehåll för underhållningsindustrin, till exempel filmmanus eller videospelsnivåer. Möjligheten att generera unika men liknande produkter gör att företag kan skapa mer innehåll snabbare och konsekvent högre kvalitet.

Det är bara toppen av isberget när det kommer till de potentiella tillämpningarna av generativ AI. Tekniken skulle också kunna hitta användbara platser i många andra branscher och yrken. Det skulle inte vara hyperboliskt att jämföra denna teknik, när den implementeras i skala, med uppfinningen av tryckpressen eller utvecklingen av löpande band när det gäller hur det kan förändra hur vi skapar och konsumerar innehåll och utför våra jobb.

Potentiella risker och etiska överväganden

Naturligtvis, med all ny teknik kommer risken att den kommer att missbrukas eller påverka vissa grupper negativt. En av huvudproblemen kring generativ AI är att den kan tränga undan författare, konstnärer och andra kreativa typer som försörjer sig på att göra artiklar, konst, manus, böcker och mer. En annan potentiell nackdel med generativ AI är att den kan användas för att göra djupa förfalskningar av kändisar och politiker som inte går att särskilja från videor och bilder av verkliga människor och använda dem för att lura allmänheten. Och naturligtvis hänger alltid science-fiction-frågan om vad som händer om vi tillåter AI att börja fatta beslut utan ordentlig mänsklig tillsyn. Kommer den att vända sig mot sina skapare eller fatta beslut som skadar människor och tro att det kommer att hjälpa?

RELATERATNej, du kan inte skriva en riktig roman med OpenAI:s ChatGPT

Den goda nyheten är att de flesta av de etiska frågorna kring AI är ständiga problem med tekniska framsteg. Jobbförstöring följer nästan alltid framsteg inom automatisering. Men det kommer också med mer avancerade verktyg för den som håller fast vid hantverket. Författare, artister och andra kreativa har nu en potent assistent att använda för att hjälpa dem med sina yrken, inte nödvändigtvis förstöra dem. Dessutom har förfalskningen av bilder på kändisar och politiker funnits sedan de första fotoredigeringsprogrammen. Och vi har förberett oss för AI-övertagandet i filmer sedan innan den första Terminator-filmen. Och även om de är giltiga frågor och bekymmer, kommer de sannolikt att lösas på ett sätt som gynnar alla eller åtminstone hanteras på ett sätt som inte involverar massiva jobbförluster och kommande av en AI-överlord-regering.

Men ett stort knorr som många AI-produkter måste övervinna är upphovsrätten. Eftersom generativ AI tränas på en enorm datauppsättning av text, bilder, ljud och mer, utgör upphovsrättsskyddat material en distinkt del av vad generativ AI drar ifrån för att skapa nya skapelser. Naturligtvis utesluter arten av generativ AI en exakt ord-för-ord-återskapande av ett upphovsrättsskyddat verk, men allt generativ AI skapar består av bitar av upphovsrättsskyddat material. Eller åtminstone lärde sig AI hur man skriver och ritar baserat på människors verk. Detta kan leda till potentiella stämningar från författare och konstnärer som känner att deras verk har stulits för att träna AI och att de förtjänar kompensation eller kräver att AI “glömmer” vad de lärde sig av deras arbete.

Men man kan hävda att AI inte är ett skyddat arbete utan att kopiera och att maskininlärning är likvärdig med mänsklig inlärning, precis som om en författare läste en bok och blev inspirerad att skriva sin egen på liknande sätt. Det kommer förmodligen att komma till en domstolsstrid där en domare måste avgöra, “vad är skillnaden mellan en AI som lär sig av att härma och en människa som gör det?” Och det är bara toppen av isberget när det gäller att reda ut alla juridiska konsekvenser som generativ AI säkerligen kommer att ge upphov till. Nu skulle det vara ett bra tillfälle för advokater att fräscha upp sin datavetenskap.

Sluta tankar: Välkommen till framtiden

Generativ AI kan vara lika skrämmande som det är imponerande och fascinerande. Men det är här nu, och det försvinner inte. Med tanke på hur snabbt det började användas under öppningsmånaderna 2023 är det inte svårt att förutsäga att Generativ AI kommer att införlivas i mycket av ditt dagliga liv i slutet av året. Och i slutet av 2024 kan det vara svårt att minnas livet utan den här tekniken.