Diese KI erstellt Videos aus Ihren Worten

0
93
Runway Research

Jedem, der Nachrichten über generative KI verfolgt, sollte klar sein, dass die neue Technologie schnell allgegenwärtig wird. Letztes Jahr eroberten KI-Bildgeneratoren die Welt im Sturm, und gegen Ende des Jahres 2022 eroberte ChatGPT die öffentliche Vorstellungskraft. Jetzt, ein paar Wochen im Jahr 2023, ist die Text-zu-Video-KI fast da.

Diese Woche kündigte das KI-Startup Runway Gen-2 an, ein multimodales KI-System, das Videos mit Clips aus anderen Videos, Bildern oder sogar nur Text generieren kann. Richtig, in Kürze werden die Benutzer in der Lage sein, alles, was sie wollen, in eine Eingabeaufforderung einzugeben und ein vollständig produziertes Video von dem zu erhalten, was sie sich in ihrer Fantasie ausgedacht haben.

Wie bei allen neuen Technologien ist sie jedoch noch nicht ganz bereit für die Hauptsendezeit. Laut Kyle Bar von Gizmodo ist die neue Video-KI von Runway zwar noch nicht öffentlich zugänglich, aber es gibt bereits einen anderen Text-zu-Video-Dienst: ModelScope erst vor wenigen Tagen veröffentlicht. Die Website ist hauptsächlich auf Chinesisch, mit einigen englischen Überschriften. Aber die Beispiele von KI-generierten Videos auf der Website sind ziemlich beeindruckend, auch wenn sie grob sind.

Einige der Beispiele auf der Website von ModelScope enthalten „darunter eine Giraffe“. eine Mikrowelle,” “ein Goldendoodle, das in einem Park an einem See spielt” “Ein Pandabär, der ein Auto fährt,” “ein Teddybär, der durch New York City läuft” und mehr. Jeder Videoclip ist nur wenige Sekunden lang, demonstriert aber deutlich die Leistungsfähigkeit der neuen Technologie. Es sei darauf hingewiesen, dass jedes Beispielvideo ein Shutterstock-Wasserzeichen enthält, wahrscheinlich weil das Unternehmen Stock-Bilder zum Trainieren seiner KI verwendet hat.

ModelScope ist jedoch nicht gerade benutzerfreundlich. Abgesehen davon, dass die Website hauptsächlich auf Chinesisch ist, müssen die Benutzer anscheinend ein wenig recherchieren (oder sich mit den Vor- und Nachteilen der generativen KI auskennen), um sie zum Laufen zu bringen. Es ist noch nicht wie ChatGPT oder New Bing. Aber die bloße Existenz dieser Technologie im Internet bedeutet, dass Text-to-Video viel früher kommt, als viele von uns dachten.

Quelle: Gizmodo