Nachdem KI-Erzeugnisse nach dem Text-zu-Bild-Prinzip schon fast alltäglich geworden sind, bekommen wir es mit Text-zu-Video zu tun. In schöner Regelmässigkeit postet jemand auf Twitter eine Reihe von Beispielen, bei denen unbewegte Memes in Videosequenzen verwandelt wurden.
Auf den ersten Blick denken wir «Wow!» Beim zweiten oder dritten Mal abspielen fällt uns auf, wie die Glaubwürdigkeit abnimmt, je länger das Video läuft und je mehr Elemente die Software dazu erfinden muss.
Doch um zu wissen, was Sache ist, sollten wir uns nicht auf die Beispiele aus dem Netz verlassen, sondern selbst Testläufe durchführen. Das habe ich versucht. Die Resultate sind durchwachsen – objektiv zwar deutlich besser bei meinem ersten Versuch vor einem Jahr. Doch es hat sich eben auch unsere Haltung verändert:
- Erstens sind unsere Ansprüche gestiegen. Allein die Tatsache, dass generative KI möglich ist, beeindruckt uns nicht mehr.
- Zweitens hat sich unser innerer KI-Detektor verbessert. Die Fehler und auch die typischen Erkennungsmerkmale für künstlich generierte Inhalte fallen uns eher auf und stören auch mehr.
Aber euch interessieren jetzt natürlich die konkreten Ergebnisse. Doch vorab noch kurz etwas zu meinem Prompt. Ich verwende wieder den von elektrischen Schafen träumenden Androiden, der als Reminiszenz an Philip K. Dick zu verstehen ist. Er zeigt schön auf, ob die Software in der Lage ist, einen Sachverhalt umzusetzen, der eine konkrete Ebene (Android im Bett) und ein abstraktes Element hat (eine Traumblase mit einem Schaf, das irgendwie elektrisch wirkt).
Und es gibt eine schöne Vergleichsmöglichkeit, da ich dieses Motiv schon früher benutzt habe (hier, hier, hier und hier). Da ich auch ein bisschen etwas gelernt habe, fällt der Prompt heute konkreter aus¹.
1) Hailuoai.com: In Ansätzen brauchbarEine der Apps, die mir via Twitter angepriesen wurde, findet sich unter hailuoai.com/video. Die Website ist chinesisch, doch mit Google Translate kommen wir weiter. Das Resultat wäre gut, wenn sich die Traumblase über dem Kopf des Androiden befände – was sich in einer Verfeinerung des Prompts natürlich angeben liessen. Dass der Android die Augen öffnet, stört ebenfalls ein bisschen. Die elektrischen Schafe sind mir nicht elektrisch genug, aber Ansätze sind zu erkennen.
https://blog.clickomania.ch/wp-content/uploads/2024/09/240905-Android-hailuoai-com-1.mp42) Canva.com: Ein Schaf-Android im SeifenblasenlandDie Online-Gestaltungsplattform Canva – vor Urzeiten hier vorgestellt – hat ein auf Runway basierendes Text-zu-Video-Tool. Ein Versuch offenbart gröbere Verständnisschwierigkeiten: Statt einer Traumblase erscheinen Seifenblasen und der Android wird mit dem Schaf zu einem süssen, aber etwas seltsamen Mischwesen verschmolzen.
https://blog.clickomania.ch/wp-content/uploads/2024/09/240905-Android-Canva-com-01.mp4Bei einem weiteren Anlauf ist dieses Video herausgekommen, dass ebenfalls nicht als gelungen betrachtet werden kann, aber euch wegen seiner Niedlichkeit nicht vorenthalten werden soll:
https://blog.clickomania.ch/wp-content/uploads/2024/09/240905-Android-Canva-com-02-2.mp43) Invideo.io: Ein 45-sekündiges GeseierDie App auf invideo.io verblüfft mich damit, dass das fertige Video 138 MB gross ist – und 45 Sekunden lang. Erzeugt wurde nicht etwa eine Sequenz, sondern eine Art Kurzfilm. Ein Sprecher erzählt von dem Androiden, der von elektrischen Schafen träumt, während iStock-Bilder aneinandergereiht werden. Das ist nicht das, was ich wollte – und auch nichts, was ich irgendjemanden würde zumuten wollen.
4) Gescheitert vor dem TestIch habe auch einige Lösungen ausprobiert, bei denen kein Video herausgekommen ist:
- Auf dreammachineai.online müssten wir zwanzig US-Dollar einwerfen, um einen Versuch wagen zu können.
- In der Software veed.io habe ich an der Stelle aufgegeben, an der man einen virtuellen Moderator (?) hätte wählen müssen.
- Dito auf colossyan.com.
- … und auf synthesia.io.
- Bei pixaivideo.com bin ich in der Storyboard-Phase stecken geblieben – hier wäre anscheinend mein Prompt vorgelesen statt in ein Video verwandelt worden.
- Von Veo von Google wurde ich mit dem Hinweis abgekanzelt, die Software sei in meinem Land bisher nicht verfügbar.
- Aitubo.ai wollte 13 US-Dollar von mir haben.
- Videogen.io kostet mindestens 21 Franken im Monat.
- Auf steve.ai hat das Erstellen eines Nutzer-Accounts nicht funktioniert.
- cinemaflow.ai verlangt zuerst diverse Antworten in einem Fragebogen, bei dem man sich für den Beta-Zugriff qualifizieren muss. Dann erscheint die Meldung, man sei im Programm drin – aber erst, nachdem man sieben US-Dollar pro Monat überwiesen hat.
- Sora von Open AI ist immer noch nicht offiziell am Start.
Das zeigt nebenbei eine Nebenwirkung des KI-Hypes: Die Unterscheidung zwischen ernsthaften Produkten und Nepp-Angeboten wird zunehmend mühsam.
Fussnoten1) «Ein Androide (Roboter) liegt in einem Bett und schläft. Eine über seinem Kopf schwebende Blase stellt den Traum dar, den er träumt. In dieser Blase befinden sich drei Schafe. Von Zeit zu Zeit blitzen elektrische Funken auf, weil die Schafe unter Strom stehen.» ↩
Beitragsbild: Die denken nicht daran, in elektrifizierter Form im Traum eines Androiden aufzutauchen (Ariana Prestes, Unsplash-Lizenz).
https://blog.clickomania.ch/2024/09/20/text-to-video-ai-generation-test/