Eine Frau spricht mit ihrem Handy.
Bildrechte: picture alliance / Zoonar | Dmitrii Marchenko
Audiobeitrag

Wie sieht eine Welt aus, in der KI immer menschenähnlicher wird?

Audiobeitrag
> Netzwelt >

ChatGPTs neue Stimme: Wann wird KI zu menschlich?

ChatGPTs neue Stimme: Wann wird KI zu menschlich?

Das neue Voice-Feature von ChatGPT ist nun auch in Europa verfügbar. Die KI-Stimme klingt täuschend echt – sie lacht, atmet und zeigt Emotionen. Was bedeutet es für uns Menschen, wenn künstliche Intelligenz immer menschenähnlicher wird?

Über dieses Thema berichtet: BR24 am .

"Blaukraut bleibt Blaukraut und Brautkleid bleibt Brautkleid." Die Stimme, die diese Worte spricht, klingt jung, weiblich und sympathisch. Als sie aufgefordert wird, den Zungenbrecher schneller zu sprechen, beschleunigt sie mühelos das Tempo – ohne zu straucheln. Erst beim dritten Mal, als sie den Spruch in doppelter Geschwindigkeit wiederholen soll, scheint auch sie an ihre Grenzen zu kommen. Doch statt zu stolpern, meistert sie die Herausforderung mit spielerischer Leichtigkeit.

🎧 Wie verändert KI unser Leben? Und welche KI-Programme sind in meinem Alltag wirklich wichtig? Antworten auf diese und weitere Fragen diskutieren Gregor Schmalzried, Marie Kilg und Fritz Espenlaub jede Woche in Der KI-Podcast – dem Podcast von BR24 und SWR.

Die Stimme gehört keinem Menschen, sondern dem neuen Voice-Feature von ChatGPT. Nach monatelanger Wartezeit ist die Funktion nun auch in Deutschland verfügbar. Und sie markiert einen weiteren Meilenstein auf dem Weg zu immer menschenähnlicherer künstlicher Intelligenz.

Mehr als nur Sprache: Wenn KI atmet und lacht

Was die neue Version von älteren Sprachausgaben unterscheidet, ist nicht nur die natürlichere Aussprache. In Tests, die das Team des KI-Podcasts durchführte, zeigte sich: Die KI atmet zwischen den Sätzen, lacht bei lustigen Bemerkungen und passt ihre Stimmlage der Situation an. "Es gab Momente, wo ich einfach nur dasaß und dachte – okay, da ist irgendwie jetzt eine Präsenz im Raum", beschreibt Podcast-Host Marie Kilg ihre Erfahrung.

Technisch basiert das System auf einem sogenannten multimodalen Ansatz. Anders als frühere Sprachausgaben, die Text erst in gesprochene Sprache umwandeln mussten, wurde ChatGPTs neues Voice-Feature direkt mit Audiodaten trainiert. Das ermöglicht eine deutlich natürlichere Kommunikation.

Design statt Authentizität: Die Grenzen der simulierten Menschlichkeit

Doch bei aller beeindruckenden Natürlichkeit – ein echtes Gespräch kann die KI nicht simulieren. Sie unterbricht ihr Gegenüber nicht, kann keine tiefergehenden Diskussionen führen und verfügt über kein Verständnis für die aktuelle Situation. Was menschlich erscheint, ist letztlich das Ergebnis gezielter Design-Entscheidungen der Entwickler.

Diese Designvorgaben können auch problematisch sein. Ein kürzlich bekannt gewordener Fall aus den USA zeigt die Schattenseiten der simulierten Menschlichkeit: Ein Teenager beging Suizid, nachdem er sich über Wochen intensiv mit einem KI-Chatbot der Firma character.ai ausgetauscht hatte. Die Familie sieht einen Zusammenhang zwischen der emotionalen Bindung an die KI und der Tragödie.

Von der Stimme zum Kontext: Was als Nächstes kommt

Die Entwicklung schreitet dennoch rasant voran. Künftige Versionen sollen auch visuelle Eindrücke über die Smartphone-Kamera verarbeiten und auf Umgebungsgeräusche reagieren können. Experten gehen davon aus, dass nicht-englische Sprachen wie Deutsch schon sehr bald das heutige Niveau englischsprachiger Systeme erreichen werden.

Zwischen Faszination und Unbehagen: Eine Gesellschaft im Wandel

Die zunehmende Menschenähnlichkeit von KI-Systemen stellt die Gesellschaft vor neue Herausforderungen. Während die technische Entwicklung kaum aufhaltbar scheint, werden Forderungen nach stärkerer Regulierung laut. Im EU AI Act, dem KI-Gesetz der Europäischen Union, sind bereits erste Transparenzvorschriften verankert.

OpenAI selbst, einst als gemeinnützige Organisation gestartet, agiert heute als gewinnorientiertes Unternehmen. Die Frage, wie menschlich künstliche Intelligenz sein darf oder sollte, wird also zunehmend von kommerziellen Interessen bestimmt. Die gesellschaftliche Debatte darüber, wo die Grenzen gezogen werden sollten, hat gerade erst begonnen.

Das ist die Europäische Perspektive bei BR24.

"Hier ist Bayern": Der BR24 Newsletter informiert Sie immer montags bis freitags zum Feierabend über das Wichtigste vom Tag auf einen Blick – kompakt und direkt in Ihrem privaten Postfach. Hier geht’s zur Anmeldung!