Künftig sagt an Bahnhöfen keine Frauenstimme mehr an, wenn ein Zug einfährt oder Verspätung hat, sondern eine Männerstimme. Sie kommt von einem „Text-To-Speech“-System (einfach gesagt ist das eine Software, die geschriebene Sätze vorliest). Die künstliche Stimme soll natürlich klingen und vor allem gut zu verstehen sein.
Wie funktioniert so eine künstliche Stimme? Wie bringt man ihr bei, Ortsnamen richtig auszusprechen? Und wieso wurde eine tiefe Männerstimme gewählt?
Um das herauszufinden, habe ich mit Experten der Bahn gesprochen, mit Fachleuten eines Text-To-Speech-Anbieters und auch mit dem Mann, der dem „Text-To-Speech“-System der Bahn seine Stimme geliehen hat.
18.11.2021
15:05 Uhr
WDR 5, Quarks
Bilder: Pressmaster, Soumyadip Sarkar
Auch interessant
So liefert ChatGPT bessere Antworten
Ich stelle kuriose wissenschaftliche Tricks zum Prompt Engineering vor: Fragen mit emotionalen Formulierungen ergänzen oder Trinkgeld versprechen.
Headsets zum besseren Verstehen
In lauten Werkshallen können In-Ear-Kopfhörer helfen, indem sie Krach dämpfen, Sprecher erkennen, Sprache hervorheben. Ich kläre, wie weit die Forschung dazu ist.
Schleudern auf der Astronautenzentrifuge
Ich wage die Fahrt auf einer Kurzarmzentrifuge, einem Testgerät, auf dem man hohe Beschleunigungen wie beim Start ins Weltall spürt.