Die Hosts von "Der KI-Podcast" im Original, und in einer Achterbahn
Bildrechte: ARD / "Der KI-Podcast"
Audiobeitrag

Die Hosts von "Der KI-Podcast" im Original, und in einer Achterbahn

Audiobeitrag
> Netzwelt >

Gemini Flash: Viel Wirbel um Googles neue Bild-KI

Gemini Flash: Viel Wirbel um Googles neue Bild-KI

Google hat ein neues KI-Tool zur Bildgenerierung veröffentlicht – erstmals können Nutzer damit Bilder per Texteingabe bearbeiten. Die Technologie beeindruckt, wirft aber rechtliche Fragen auf.

Über dieses Thema berichtet: BR24 am .

Google hat in seiner Entwickler-Oberfläche AI Studio ein neues KI-Modell veröffentlicht – und das hat es in sich. Das Modell "Gemini 2.0 Flash Experimental" ist das erste KI-Modell seiner Art, mit dem man Bilder durch Chateingaben bearbeiten kann.

Zwar bieten auch andere Chatbots wie ChatGPT von OpenAI und Le Chat von Mistral die Möglichkeit, Bilder zu generieren – diese Bild-KIs werden jedoch separat von der Chat-KI generiert. Das heißt auch, dass man sie nachträglich nicht mehr im Chat bearbeiten kann.

Das kann Gemini 2.0 Flash Experimental

Doch hier kommt das neue Google-Modell ins Spiel. Wie ein Test vom ARD-Podcast "Der KI-Podcast" zeigt, kann man sogar bestehende Bilder in die KI laden – und dort per Text bearbeiten. Hier sind die drei Hosts von "Der KI-Podcast" im Original zu sehen:

Bildrechte: ARD / "Der KI-Podcast"
Bildbeitrag

Vorher-Bild im Original

Gibt man nun Gemini Flash den Auftrag "Setze diese drei in eine Achterbahn", erscheint zum Beispiel dieses Bild:

Bildrechte: ARD / "Der KI-Podcast"
Bildbeitrag

Nachher-Bild in der Achterbahn

Was die Qualität der Bildgenerierung angeht, hinkt die Google KI noch hinter Konkurrenten wie Midjourney und Flux zurück. Trotzdem: Die integration in das Chatfenster ist etwas, das es in dieser Form bislang nicht gab und das vor allem in der Grafik- und Designwelt große Wellen schlagen dürfte.

Kleidungstausch und Wasserzeichen

Auf Social Media tauschen sich viele Nutzer bereits darüber aus, was sie alles mit dieser KI angestellt haben. Ein Twitter-User zeigt, wie er ein künstlich generiertes Model mit einem real existierenden Kleidungsstück kombiniert hat: Auf einmal trägt die virtuelle Frau tatsächlich die Jacke, die er in den Chat eingefügt hat.

Andere Nutzer haben schnell festgestellt, dass das Tool auch für das Entfernen von Wasserzeichen erstaunlich gut geeignet ist. In nur wenigen Sekunden schafft es die KI, auch ein komplexes Wasserzeichen spurlos zu entfernen. Damit geht Google deutlich weiter als vergleichbare KI-Programme bislang. Andere KI-Modelle haben solche Anwendungen bisher bewusst geblockt. Google scheint das nicht zu tun, auch wenn das Entfernen von Wasserzeichen in bestimmten Fällen sogar illegal sein kann.

🎧 Wie verändert KI unser Leben? Und welche KI-Programme sind in meinem Alltag wirklich wichtig? Antworten auf diese und weitere Fragen diskutieren Gregor Schmalzried, Marie Kilg und Fritz Espenlaub jede Woche in Der KI-Podcast – dem Podcast von BR24 und SWR.

Diese Beispiele zeigen: Das neue KI-Tool dürfte nicht nur für produktive und spaßige Anwendungen herhalten, sondern auch für Manipulationen und Umgehung von digitalen Barrieren.

Wie oft in der KI-Welt gilt: Die Revolution liegt nicht unbedingt darin, dass völlig neue Dinge möglich sind. Künstliche Manipulationen dieser Art waren schon vorher mit Photoshop und anderen Programmen machbar. Allerdings benötigte man dafür Expertenwissen und deutlich mehr Zeit. Nun können auch Laien in wenigen Sekunden komplexe Manipulationen erstellen.

Das ist die Europäische Perspektive bei BR24.

"Hier ist Bayern": Der BR24 Newsletter informiert Sie immer montags bis freitags zum Feierabend über das Wichtigste vom Tag auf einen Blick – kompakt und direkt in Ihrem privaten Postfach. Hier geht’s zur Anmeldung!