Mittwoch, 24. April 2024

Archiv

Künstliche Intelligenz
"Lyrebird" - ein Leierschwanz für jede Stimme

Mit einer kurzen Tonaufnahme als Muster kann ein kanadisches Start-up jede beliebige Stimme täuschend echt imitieren. Für Menschen, die ihre Sprechfähigkeit verloren haben, kann das vielleicht eine große Hilfe sein. Für das Vertrauen ins gesprochene Wort ist es womöglich ein Desaster.

von Julian Bernstein | 14.09.2018
    Illustration eines Vogels - Leierschwanz
    Lyrebird als Namensgeber - der Leierschwanz gilt als besonders guter Stimmen-Imitator (imago / Imagebroker)
    "I am Donald Trump, and I think my digital voice is quite impressive".
    Noch hört sich die künstliche Stimme von Donald Trump etwas blechern an – aber die Ähnlichkeit ist unverkennbar. Wer den Algorithmus besitzt, kann diese Stimme Dinge sagen lassen, die der amerikanische Präsident nie gesagt hat:
    "This is huge, they can make us say anything now, really anything".
    Um eine Stimme klonen zu können, braucht "Lyrebird" gerade mal eine einminütige Tonaufnahme. Ein derart effektives Programm hat auf diesem Gebiet bislang noch niemand hervorgebracht, ist die Firma überzeugt. Der Lyrebird, auf Deutsch: Leierschwanz, ist ein Vogel, dem man nachsagt, Stimmen täuschend ähnlich nachahmen zu können. Ein passender Pate, findet man in Montreal.
    Ein Algorithmus für Donald Trump
    Als das Start-up im vorigen Jahr sein Können mit den künstlichen Stimmen von Trump und Obama zum ersten Mal präsentierte, rief das aber gemischte Reaktionen hervor. Denn eine derartige Technologie wirft Fragen auf: Muss man zukünftig etwa bei jedem Telefonanruf vermuten, dass die vertraute Stimme am anderen Ende der Leitung womöglich gefälscht ist?
    Downtown Montreal. Das junge Unternehmen residiert mit seinen 15 Mitarbeitern in einem Wolkenkratzer in der Innenstadt, fünfter Stock. Die Etage teilen sich mehrere Firmen, ähnlich wie in einem Coworking-Space. Man sieht viele Glastüren, der Blick durch die großen Fenster nach draußen zeigt die Skyline der Millionenstadt. In einem Gemeinschaftsraum wartet Jose Sotelo.
    Sotelo, gebürtiger Mexikaner und gerade einmal 27 Jahre alt, ist einer der drei Gründer des Start-ups. Wie auch seine beiden Geschäftspartner hat er einen wissenschaftlichen Hintergrund: Er promoviert auf dem Gebiet der künstlichen neuronalen Netze – einem Teilbereich der künstlichen Intelligenz. Bei "Lyrebird" kommt genau diese Technik zur Anwendung.
    DNA der Stimme
    Zunächst habe man ein Software-Modell an Tausenden Stimmen trainiert, erklärt der Unternehmensgründer. Dieses auf neuronalen Netzen beruhende Programm könne erkennen, was genau eine Stimme einzigartig macht. Sotelo nennt das: die DNA einer Stimme herausfinden. So lasse sich jede beliebige Stimme kopieren.
    Dass diese Fähigkeit nicht überall auf Anklang stößt, darüber ist man sich bei "Lyrebird" bewusst. Man setzt daher auf Transparenz, sagt Sotelo:
    "Wir geben unser Bestes, um diese Technologie in einer für die Gesellschaft sicheren Weise voranzutreiben. Dabei ist es besonders wichtig, die Technologie den Leuten zu zeigen. Damit sie darauf vorbereitet sind und Schritte unternehmen können, um Missbrauch zu verhindern".
    Motto: Besser wir als die Bösen?
    Auf der Webseite von "Lyrebird" kann sich jeder selbst mit der Technologie vertraut machen. Wer möchte, kann sich dort sogar kostenlos seine eigene künstliche Stimme generieren lassen. Ob sich durch das Bekanntmachen der Technologie Missbrauch langfristig verhindern lässt, ist jedoch fraglich. Und: Warum überhaupt eine Technologie entwickeln, deren Konsequenzen kaum absehbar sind? Einwände, die Sotelo routiniert beiseite wischt:
    "Das ist definitiv ein schwieriges ethisches Thema, aber ich denke, es wäre naiv zu sagen: Lasst uns aufhören, daran zu arbeiten! Und dann darauf zu hoffen, dass das niemand anderes macht. Stellen Sie sich vor, eine Gruppe von Leuten mit bösen Absichten würde diese Technologie entwickeln. Die würden den Stand der Technologie vor der Öffentlichkeit einfach geheim halten. Wenn diese Gruppe dann Chaos stiften will oder Betrügereien plant, dann wären die Menschen weniger darauf vorbereitet. Und ich vermute, dass es aktuell Menschen gibt, die mit genau diesen Absichten an der Technologie arbeiten. Deshalb denke ich, dass wir, ethisch gesehen, das Richtige tun".
    Daneben, sagt er, gibt es einen weiteren moralischen Aspekt: Es sei unfair, Menschen, denen eine künstliche Stimme helfen könnte, diese Hilfe zu verweigern. Unter anderem betrifft das Personen, die an Amyotropher Lateralsklerose – kurz ALS – erkrankt sind. Im Endstadium verlieren sie häufig die Fähigkeit zu sprechen. Diesen Patienten könnte Lyrebird mit seiner Technologie helfen. Neben dem Gesundheitssektor gibt es eine Reihe weiterer Anwendungsmöglichkeiten, zum Beispiel in der Computerspiele-Industrie.
    Vertrau keiner Stimme, die Du nicht siehst?
    Investoren haben das Potenzial erkannt und das Start-up mit Geld ausgestattet. Wie viel "Lyrebird" eingesammelt hat, will der Unternehmensgründer nicht verraten. Ebenso wenig will er eine Prognose wagen, wann genau die Technologie voll ausgereift sein wird. Aber es dürfte klar sein: Der Tag wird kommen. Der Unternehmensgründer räumt offen ein, dass man Stimmen, zum Beispiel am Telefon, dann nicht mehr ohne weiteres vertrauen kann. Grund für Pessimismus sei das jedoch nicht:
    "Daran arbeiten wir derzeit ein wenig nebenher. Es wird Möglichkeiten geben, computergenerierte Stimmen zu erkennen. Wenn Sie so einen Anruf bekommen, könnte Sie eine Nachricht warnen mit dem Inhalt: "Ich habe den Verdacht, dass diese Stimme nicht authentisch ist."
    Ob "Lyrebird" sich langfristig auf dem Markt behaupten kann, ist unklar. Denn die großen Technologiekonzerne dürften ebenfalls an künstlichen Stimmen arbeiten. Die Konkurrenz schreckt Jose Sotelo allerdings nicht. Auch kleine Teams können, wenn sie entschlossen sind, gegen Google und Co. bestehen, meint er. Ein harter Kampf werde das, aber er ist sich sicher: "Lyrebird" kann es schaffen.