Sorge vor Missbrauch

OpenAI schafft Software zum Klonen von Stimmen

02.04.2024
Eine 15-sekündige Aufnahme soll reichen, um die Software zum Klonen echter Stimmen zu befähigen. Öffentlich nutzbar soll Voice Engine aber vorerst nicht werden - denn die Technologie birgt Risiken.
Eine 15-sekündige Audioprobe genügt schon. OpenAI arbeitet an einem Programm, das Text in Sprache umwandeln kann.
Eine 15-sekündige Audioprobe genügt schon. OpenAI arbeitet an einem Programm, das Text in Sprache umwandeln kann.
Foto: Gorodenkoff - shutterstock.com

OpenAI arbeitet an einer Software zum Klonen menschlicher Stimmen - hält sie wegen Sorgen vor Missbrauch aber vorerst zurück. "Voice Engine verwendet Texteingaben und eine lediglich 15-sekündige Audioprobe, um natürlich klingende Sprache zu erzeugen, die dem Originalsprecher sehr ähnlich ist", teilte der US-Konzern am Freitag mit. OpenAI arbeite seit 2022 an dem Programm, unter anderem um Software zu verfeinern, die Text in Sprache umwandelt.

Ob und wann Voice Engine für die breite Öffentlichkeit nutzbar wird, ist allerdings offen. Gerade in einem Wahljahr berge eine solche Anwendung erhebliche Risiken, hieß es von OpenAI. Wegen möglichen Missbrauchs gehe der Konzern deshalb "behutsam und sachkundig" an die Frage einer Freigabe heran. OpenAI erhoffe sich einen Diskurs über Chancen und Risiken der Technologie und wolle weitere Tests durchführen.

Im Januar hatten fingierte Anrufe Angst vor Manipulationen mithilfe Künstlicher IntelligenzKünstlicher Intelligenz im Rennen ums Weiße Haus geschürt. In automatisierten Anrufen hatte eine Stimme, die der von US-Präsident Joe Biden zum Verwechseln ähnlich klang, Demokraten in New Hampshire dazu aufgerufen, nicht an den Vorwahlen teilzunehmen. Solche sogenannten Robocalls sind ein gängiges Wahlkampf-Instrument in den USA. Alles zu Künstliche Intelligenz auf CIO.de

OpenAI verwies in seiner Mitteilung aber auch auf die Chancen der Anwendung. Mit einem Partner habe OpenAI daran geforscht, wie die synthetischen Stimmen beim Lesenlernen unterstützen können. Potenzial habe Voice Engine außerdem beim Übersetzen etwa von Videos und Podcasts, die so ein breiteres Publikum erreichen könnten. Wichtig sei in jedem Fall, dass sich die geklonte Stimme zuvor als KI-generiert zu erkennen gebe. (dpa/rs)

Zur Startseite