Was ist generative KI?

0
124
Danny Chadwick, Lensa AI

Generative AI ist eine Technologie der künstlichen Intelligenz, die möglicherweise die Art und Weise, wie wir mit Maschinen interagieren, verändern könnte. Es ist eine Art von KI, die neue Inhalte wie Text, Bilder, Audio und Video basierend auf ihrem Verständnis der Welt und den Eingaben des Benutzers erstellen kann.

In den letzten Monaten sind Apps mit generativer KI auf dem Markt explodiert. Die KI-Foto-App Lensa und der Chatbot von OpenAI, ChatGPT, sorgten für Furore, weil sie hochwertige Texte und Bilder auf Abruf erstellen. Jetzt spielen Microsoft und Google eine Aufholjagd. Aber was ist generative KI und wie funktioniert sie?

Inhaltsverzeichnis

Was ist generative KI?
Arten generativer KI und wie sie funktionieren
Anwendungen der generativen KI
Mögliche Risiken und ethische Überlegungen
Abschließende Gedanken: Willkommen in der Zukunft

Was ist generative KI?

Um es so einfach wie möglich auszudrücken: Generative AI ist eine KI (sogenannte „künstliche Intelligenz“), die einzigartige Inhalte basierend auf einer Aufforderung eines Benutzers erstellt. Zum Beispiel die Aufforderung, die Sie Lensa geben, um aus diesen coolen KI-Profilbildern eine Auswahl an Selfies zu machen. Im Fall von ChatGPT könnte eine Aufforderung lauten: „Schreibe ein Sonett über Bagels im Stil von HL Mencken.“ Die resultierenden Texte und Bilder sind völlig einzigartig und werden von der KI generiert. Und es sind nicht nur Texte und Bilder, die generative KI erstellen kann. Andere KI-Produkte können unheimliche Sprachnachbildungen erstellen, und es stehen sogar Dienste in den Startlöchern, die Videoinhalte basierend auf Texteingabeaufforderungen erstellen können.

Danny Chadwick/Review Geek

Generative KI kombiniert zwei leistungsstarke KI-Technologien: maschinelles Lernen und die Fähigkeit, neue Inhalte zu erstellen. KI-Programmierer verwenden maschinelles Lernen, um Modelle zu erstellen, die Muster und Trends in vorhandenen Daten erkennen können, während die Inhaltsgenerierung die Erstellung einzigartiger Elemente wie einer Komposition oder eines Bildes ermöglicht. Wenn eine KI über eine ausreichend große Stichprobengröße verfügt, aus der sie schöpfen kann (ihr Trainingssatz), kann sie so ziemlich alles nachbilden, was sie erkennen kann. Und da der Datensatz zum Trainieren von KI-Modellen wie ChatGPT so groß ist, kann er Elemente aus mehreren Quellen mischen und abgleichen, um etwas zu liefern, das sowohl einzigartig als auch als das erkennbar ist, wonach die Aufforderung verlangt.

Arten der generativen KI und wie sie funktionieren

Andrey_Popov/Shutterstock.com

Generative KI-Algorithmen gibt es in vielen Formen, sie fallen jedoch in drei allgemeine Kategorien: Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs) und Transformer-Modelle wie GPT-4. Jede Art von generativem KI-Algorithmus hat seine Vor- und Nachteile.

VERWANDTE KI ist nicht wirklich künstliche Intelligenz

GANs sind eine Art generativer KI, die zwei tieflernende neuronale Netze verwendet, um neue Daten zu generieren. Das erste Netzwerk, Generator genannt, wird darauf trainiert, neue Daten zu erstellen, die bestehenden Inhalten ähneln, während das zweite Netzwerk, Diskriminator genannt, darauf trainiert wird, zwischen echten und generierten Daten zu unterscheiden. Während Programmierer ihre KI trainieren, lernt der Generator, wie er immer realistischere Bilder erzeugt, die den Diskriminator glauben machen, dass sie echt sind. Dieser Vorgang wird als „Minimax-Spiel“ bezeichnet. da jedes Netzwerk versucht, das andere zu überlisten, während es seine eigenen Fehler minimiert.

Ein möglicher Nachteil von GANs ist, dass sie manchmal unrealistische oder unscharfe Bilder erzeugen können. Beispielsweise kann ein GAN, der darauf trainiert ist, Bilder von menschlichen Gesichtern zu erzeugen, manchmal Bilder mit einem zusätzlichen Augenpaar oder einer verzerrten Gesichtsstruktur erstellen. Menschliche Hände können wie ein regelrechter Alptraum aussehen. Diese Technologie steckt jedoch noch in den Anfängen, und Probleme wie diese werden zu gegebener Zeit behoben.

VAEs sind eine andere Art von generativer KI, die verwendet wird, um neue, einzigartige Daten zu generieren. Im Gegensatz zu GANs verwenden VAEs eine komprimierte Darstellung ihrer Eingabedaten, um etwas Neues zu generieren, das dem Original ähnelt. VAEs werden am häufigsten verwendet, um Bilder und Videos zu erstellen, aber sie können auch Text generieren. Eine mögliche Einschränkung von VAEs besteht darin, dass ihre Daten möglicherweise nicht so vielfältig sind wie die von GANs erzeugten, da VAEs eine eingeschränktere Darstellung der Eingabedaten lernen. Außerdem leiden VAEs manchmal unter den Problemen mit verzerrten Bildern, auf die GANs stoßen.

VERWANDTE Ist ChatGPT Plus sein Geld wert?

Transformer-Modelle wie GPT-4 sind eine relativ neuere Iteration der generativen KI, die aufgrund ihrer beeindruckenden Leistung bei vielen Aufgaben zur Verarbeitung natürlicher Sprache viele Blicke auf sich gezogen haben. ChatGPT ist das aktuelle Goldstern-Beispiel eines transformatorbasierten KI-Produkts. Diese Modelle basieren auf einer Art neuronaler Netzwerkarchitektur, die als „Transformator“ bezeichnet wird. Sie sind darauf ausgelegt, riesige Datensequenzen zu verarbeiten, werden mit einem riesigen Textdatensatz trainiert und können kohärente und kontextrelevante Antworten auf eine Aufforderung geben.

Der Vorteil von Transformer-Modellen besteht darin, dass sie vielfältige und qualitativ hochwertige Texte generieren können. Sie können jedoch unter Verzerrungen und Ungenauigkeiten in den Trainingsdaten leiden, was zu unangemessenen oder fehlerhaften Ausgaben führt. Darüber hinaus kann die enorme Menge an Rechenressourcen und Daten, die zum Trainieren und Ausführen dieser Modelle erforderlich sind, sie für einige Anwendungen schwierig und teuer machen.

Anwendungen der generativen KI

issaro prakalung/Shutterstock.com

Generative KI wird bereits in einer Vielzahl beliebter Dienste eingesetzt. Es gibt den bereits erwähnten Chatbot ChatGPT, der von OpenAI und seinem Schwester-Bildgenerator DALL-E erstellt wurde. Es gibt auch eine Reihe von KI-Bildbearbeitungsprogrammen, darunter Lensa (iOS, Android), Wonder (iOS, Android) und mehr. Die gibt es alle schon eine Weile. Aber als ChatGPT startete, entschied das Silicon Valley, dass es an der Zeit war, die neue Technologie freizusetzen, und kündigte ein neues KI-Produkt nach dem anderen an.

VERWANDTE Ich habe Bings Chat-KI dazu gebracht, jede Regel zu brechen und verrückt zu werden

Erst Anfang dieses Jahres haben Microsoft und Google beide KI-Verzauberungen für ihre Suchmaschinen angekündigt. Bald darauf folgten die kleineren Suchanbieter DuckDuck Go und Brave. Microsoft hat Bing und Edge um KI-Bilderzeugung sowie KI-Komponenten in seiner Office-Suite erweitert. Sogar Opera fügt ChatGPT zu seinem Desktop-Browser hinzu. Außerdem haben Shutterstock und Adobe KI-Kunstgeneratoren herausgebracht, die auf die Arbeit von entlohnten Benutzern trainiert wurden.

Aber generative KI kann weit über Bildersteller, Chatbots und Suchassistenten hinausgehen. Fachleute aus allen Lebensbereichen können diese Tools bei ihrer Arbeit verwenden. Generative KI hat potenzielle Anwendungen im Produktdesign und ermöglicht es Unternehmen, maßgeschneiderte Produkte zu erstellen, die auf die Bedürfnisse jedes Kunden zugeschnitten sind. Darüber hinaus kann es von medizinischem Fachpersonal verwendet werden, indem es bei der Diagnose- und Behandlungsentwicklung hilft.

Darüber hinaus kann generative KI personalisierte Inhalte wie Nachrichtenartikel oder Musik-Playlists erstellen. Durch die Analyse der Vorlieben und des Verhaltens eines Benutzers können generative KI-Algorithmen Inhalte generieren, die auf seine Interessen zugeschnitten sind, und so das Engagement und die Zufriedenheit der Benutzer steigern. Generative KI kann dabei helfen, neue Inhalte für die Unterhaltungsindustrie zu erstellen, wie z. B. Filmskripte oder Videospiellevel. Die Möglichkeit, einzigartige, aber ähnliche Produkte zu generieren, ermöglicht es Unternehmen, mehr Inhalte schneller und in gleichbleibend hoher Qualität zu erstellen.

Das ist nur die Spitze des Eisbergs, wenn es um die Anwendungsmöglichkeiten der generativen KI geht. Die Technologie könnte auch in vielen anderen Branchen und Berufen nützliche Stellen finden. Es wäre nicht übertrieben, diese Technologie, wenn sie in großem Maßstab implementiert wird, mit der Erfindung der Druckmaschine oder der Entwicklung des Fließbands zu vergleichen, um zu sehen, wie sie die Art und Weise verändern könnte, wie wir Inhalte erstellen und konsumieren und unsere Arbeit erledigen.

Potenzielle Risiken und ethische Erwägungen

enzozo/Shutterstock.com

Natürlich birgt jede neue Technologie das Risiko, dass sie missbraucht wird oder einige Gruppen negativ beeinflusst. Eine der Hauptsorgen im Zusammenhang mit der generativen KI ist, dass sie Schriftsteller, Künstler und andere kreative Typen verdrängen könnte, die ihren Lebensunterhalt damit verdienen, Artikel, Kunst, Drehbücher, Bücher und mehr zu erstellen. Ein weiterer potenzieller Nachteil der generativen KI ist, dass sie verwendet werden könnte, um tiefe Fälschungen von Prominenten und Politikern zu erstellen, die von Videos und Bildern der echten Menschen nicht zu unterscheiden wären, und sie dazu zu verwenden, die Öffentlichkeit zu täuschen. Und natürlich bleibt immer die Science-Fiction-Frage, was passiert, wenn wir der KI erlauben, ohne angemessene menschliche Aufsicht Entscheidungen zu treffen. Wird es sich gegen seine Schöpfer wenden oder Entscheidungen treffen, die Menschen schaden, in der Annahme, es würde helfen?

RELATEDNein, Sie können mit ChatGPT von OpenAI keinen echten Roman schreiben

Die gute Nachricht ist, dass die meisten ethischen Fragen rund um die KI Dauerthemen des technologischen Fortschritts sind. Die Vernichtung von Arbeitsplätzen geht fast immer mit Fortschritten in der Automatisierung einher. Aber es kommt auch mit fortgeschritteneren Werkzeugen für diejenigen, die beim Handwerk bleiben. Schriftsteller, Künstler und andere Kreative haben jetzt einen mächtigen Assistenten, den sie verwenden können, um ihnen bei ihrer Berufung zu helfen und sie nicht unbedingt zu zerstören. Außerdem gibt es die Fälschung von Bildern von Prominenten und Politikern seit den ersten Bildbearbeitungsprogrammen. Und wir haben uns schon vor dem ersten Terminator-Film auf die KI-Übernahme in Filmen vorbereitet. Und obwohl es sich um berechtigte Fragen und Bedenken handelt, werden sie wahrscheinlich auf eine Weise gelöst, die allen zugute kommt, oder zumindest so behandelt, dass sie nicht mit massiven Arbeitsplatzverlusten und dem Kommen einer KI-Overlord-Regierung einhergehen. p>

Ein großes Problem, das viele KI-Produkte überwinden müssen, ist jedoch das Urheberrecht. Da die generative KI auf einem riesigen Datensatz aus Text, Bildern, Tönen und mehr trainiert wird, macht urheberrechtlich geschütztes Material einen besonderen Teil dessen aus, was die generative KI für neue Kreationen nutzt. Zugegeben, die Natur der generativen KI schließt eine exakte wortgetreue Nachbildung eines urheberrechtlich geschützten Werks aus, aber alles, was die generative KI erstellt, besteht aus Teilen von urheberrechtlich geschütztem Material. Oder zumindest hat die KI das Schreiben und Zeichnen anhand der Werke von Menschen gelernt. Dies könnte zu potenziellen Klagen von Schriftstellern und Künstlern führen, die der Meinung sind, dass ihre Arbeit gestohlen wurde, um die KI zu trainieren, und dass sie eine Entschädigung verdienen oder verlangen, dass die KI „vergisst“; was es aus ihrer Arbeit gelernt hat.

Aber man könnte argumentieren, dass die KI keine geschützte Arbeit auswendig kopiert und dass maschinelles Lernen dem menschlichen Lernen entspricht, genau wie wenn ein Autor ein Buch liest und inspiriert wird, sein eigenes in ähnlicher Weise zu schreiben. Es wird wahrscheinlich zu einem Gerichtsstreit kommen, in dem ein Richter entscheiden muss, „was ist der Unterschied zwischen einer KI, die durch Nachahmung lernt, und einem Menschen, der es tut?“ Und das ist nur die Spitze des Eisbergs, wenn es darum geht, alle rechtlichen Implikationen zu entwirren, die die generative KI sicherlich mit sich bringen wird. Jetzt wäre ein guter Zeitpunkt für Anwälte, ihre Informatik aufzufrischen.

Abschließende Gedanken: Willkommen in der Zukunft

Generativ KI kann ebenso beängstigend wie beeindruckend und faszinierend sein. Aber es ist jetzt da und es geht nicht weg. Angesichts der Akzeptanzrate in den ersten Monaten des Jahres 2023 ist es nicht schwer vorherzusagen, dass die generative KI bis Ende des Jahres in einen Großteil Ihres täglichen Lebens integriert sein wird. Und bis Ende 2024 wird es schwierig sein, sich an ein Leben ohne diese Technologie zu erinnern.