Synthetische Musikvideos mit KI Künstliche Intelligenz ist wie ein Synthesizer - aber für alles
KI-Programme können mittlerweile in kurzer Zeit komplette Bilder und Musikvideos erschaffen. Das ist keine Bedrohung, sondern eine Chance – vor allem für kleine Künstler und Bands.
Eine neue Technologie sorgt für Unruhe. Ein Drücken einer Taste reicht und schon erschafft eine Maschine etwas, das von menschlich erschaffener Kunst nicht zu unterscheiden ist. Es braucht keine jahrelange Ausbildung und Erfahrung. Es braucht kaum Wissen über Theorie – in Sekundenschnelle kann man dank digitaler Technologie etwas Neues erschaffen. Aber die Technologie wird kontrovers diskutiert. Einige Künstler meinen, es wäre “Schummeln”, sie benutzen. Andere bezeichnen sie als “seelenlos”. Und manche versuchen sogar, sie zu verbieten.
Das alles klingt wie eine Geschichte aus der Gegenwart – in der wir immer öfter über die Auswirkungen von Generativer KI diskutieren. In Wahrheit geht es aber um den Moog – das ist der erste massentaugliche Synthesizer. Dank dem war es auf einmal möglich, auf elektronische Weise ganz neue Klänge zu erzeugen und alte zu manipulieren – ohne dass man dafür ein analoges Instrument brauchte. Und als der Synthesizer in den 70er-Jahren seinen Siegeszug durch die Popmusik antrat, stieß er auf jede Menge Widerstand. Queen brüsteten sich damit, keine Synthesizer zu benutzen. Und Musikergewerkschaften in UK und USA versuchten mit mehr oder weniger Erfolg, den Einsatz von Synthesizern zu verbieten – aus Angst vor Jobverlust in der Musik. Klingt heute alles absurd. War aber Realität.
Die vielen Möglichkeiten einer neuen Technologie, mit allen Unsicherheiten und Fragen, die dazugehören, erleben wir gerade wieder. Und zwar mit KI-Programmen, die Bilder und Videos erzeugen können. Es hat keine Tasten und keinen Körper und keinen so griffigen Namen wie der Moog – aber trotzdem kann man es am besten so betrachten: Als ein visuelles Instrument, mit dem auf einmal Dinge gehen, die vorher unmöglich waren. Ein Synthesizer für alles.
Manche Teile der Welt haben sich schon längst an das neue Instrument angepasst: Die Kleidermarke Mango bewirbt ihre neueste Teenagerkollektion ausschließlich mit KI-generierten Models. Ein Münchner Filmstudio hat gerade die weltweit erste KI-generierte Animationsserie gestartet. Und schon letztes Jahr hat ein KI-generiertes Bild den Sony World Photography Award gewonnen – ein Zeichen dafür, dass es auch für Experten praktisch nicht mehr.
Und in der Musik? Auch hier gibt es immer mehr Experimente. Linkin Park haben schon letztes Jahr ein Musikvideo mit KI-generierten Animationen veröffentlicht.
YouTube-Vorschau - es werden keine Daten von YouTube geladen.
Lost [Official Music Video] - Linkin Park
Und das Musikvideo von “The Hardest Part” des Synth-Indie-Künstlers “Washed Out” setzt komplett auf die Bilder von OpenAIs neuer Video-KI Sora.
Möglich machen das vor allem zwei verschiedene Arten von KI-Programmen: Einmal Text-zu-Bild-Programme, bei denen man mit dem richtigen “Prompt” schnell Bilder erhält, die praktisch so aussehen, als wären sie von Menschen erstellt.
Der nächste Schritt heißt dann Text-zu-Video oder Bild-zu-Video. Hierzu zählt auch “Sora” von ChatGPT-Entwickler OpenAI, das wegen Sorge um Fake News und Missbrauch immer noch nur für eine ausgewählte kleine Gruppe von Testern zur Verfügung steht. Aber andere Programme namens Runway und Pika füllen schon längst diese Lücke – in Sekunden können sie aus Bildern Filmclips erzeugen und sogar bestimmte Kamerafahrten nachbauen. Anders als bei den Fotos erkennt man die KI-Videos aktuell meist noch vom Hinsehen. Aber noch vor zwei Jahren konnten solche Programme eher nur verschwommene Formen generieren. Warten wir noch einmal zwei, und die Realität ist von der Synthetik nicht mehr zu unterscheiden. Diese Entwicklung kommt auch jetzt nicht überall gut an. Genau wie damals bei den Synthesizern gibt es auch hier Sorgen – ist diese Technologie nicht seelenlos? Ist es nicht “unfair”, sie zu benutzen?
Weil, klar: Es ist easy. Einmal ChatGPT nach einer Musikvideo-Idee fragen und dann diese Idee schnell von einer Video-KI generieren lassen. Das alleine macht keine Kunst. Vor allem haben KI-Modelle meist einen Drang zur Mitte. Sie geben also die offensichtliche Antwort, die “mittlerste” Antwort. Und das ist selten das, was man in der Kunst wirklich haben will.
YouTube-Vorschau - es werden keine Daten von YouTube geladen.
Washed Out - The Hardest Part (Official Video)
Das “Washed Out”-Musikvideo ist ein perfektes Beispiel dafür. Der Clip ist trippy, wie ein Albtraum, folgt keinen physikalischen Gesetzen. Die ganzen Schwächen, die KI-Videos (noch) haben, werden hier zum Stilmittel: Dass Körper ineinander wachsen, Türen ins Nichts führen, Autos unendliche Sitzreihen haben... All das passt perfekt zum psychedelischen Vibe des Songs.
KI-Programme ersetzen keine Ideen und Visionen, sie können ganz von alleine keine Kunst schaffen. Aber für alle, die Beats mit ihren Laptops bauen, Vocals in ihren Schlafzimmern aufnehmen und Loop-Stations programmieren... Für die entsteht gerade das größte Geschenk aller Zeiten: Die richtige Idee ist auf einmal viel schneller und besser umgesetzt als vorher.
Aber KI ist eben nur das Instrument. Nicht die Person, die es spielt. Und wenn man sie als Instrument benutzt, als Ausdruck von Gefühlen, Gedanken, wilden Ideen, die man sonst niemals visualisiert bekommen hätte. Dann wird dieses Instrument auf einmal richtig mächtig. Allerdings gilt - wie beim Synthesizer auch: Nicht alle Ideen muss man am Ende auch die KI machen lassen. Je nach Werk, Künstlerin oder Stimmung ist die gute alte Gitarre eben doch manchmal besser.