Mittwoch, 01. Mai 2024

Archiv

Cebit-Reihe: Teil 1
SemVox lässt Computer hören und sprechen

Die Saarbrücker Firma SemVox beschäftigt sich mit dem hochkomplexen Thema der Spracherkennung. Dabei geht es um die Frage, wie man mit menschlicher Sprache Maschinen steuern kann.

28.02.2014
    Früher Abend auf der Autobahn A2 am Kamener Kreuz. Es nieselt, die Sicht ist schlecht, zäh fließender Verkehr meldet der Deutschlandfunk. Auf dem rechten Fahrstreifen quälen sich LKW dicht an dicht Richtung Hannover; wirklich zügig geht es auf den beiden anderen Spuren auch nicht voran. Höchstgeschwindigkeit 80 Stundenkilometer - immerhin:
    "Ich bin auf der A2, bitte mal nachschauen, wie sich der Verkehr in den nächste 100 Kilometern entwickelt!"
    "Okay, ich beginne jetzt mit der Navigation: Auf Ihrer Strecke liegt eine starke Verkehrsbehinderung vor, die Ihre Ankunft am Ziel um eine Stunde und 30 Minuten verzögert."
    Das bordeigene Navigationssystem zeigt auf einem Bildschirm den Verlauf der A2:
    "Super, das hat noch gefehlt."
    "Soll ich eine Ausweichroute programmieren, die Ihre Ankunft nur um 20 Minuten verzögert?"
    "Ich bitte drum!"
    Persönliche digitale Assistentin
    Alltag auf deutschen Autobahnen: Staus und stockender Verkehr, von den Baustellen ganz zu schweigen. Kein Alltag ist dagegen die Kommunikation des Fahrers mit seinem Navigationssystem: Statt Aufgaben und Befehle einzutippen, spricht er mit dem Gerät. Genauer: Er spricht mit seiner persönlichen digitalen Assistentin, die ihm jeden Wunsch von den Lippen abliest – vorausgesetzt, sie versteht ihn. Entwickelt hat das System die SemVox GmbH in Saarbrücken:
    "Gestartet sind wir 2008 als Spin-off des Deutschen Forschungszentrums für Künstliche Intelligenz in Saarbrücken, in dem Sinne sind wir eigentlich auch ein Start-up gewesen."
    Norbert Pfleger, Vorsitzender der Geschäftsführung:
    "Wir sind eigenfinanziert gestartet und haben die Technologie, die wir im Rahmen unserer Forschungstätigkeit im Deutschen Forschungszentrum für Künstliche Intelligenz entwickelt haben, mit rausgenommen aus der Forschung in die kommerzielle Verwertung und haben die in den letzten fünf Jahren in Kundenprojekten eingesetzt."
    "Semantic Technologies and Voice Soutions" heißt SemVox übersetzt, "Semantische Technologien und Sprachkommunikationslösungen". Oder schlichter ausgedrückt: Es geht um die Frage, wie man mit menschlicher Sprache Maschinen steuern kann.
    "Zum heutigen Tag beschäftigen wir 24 Mitarbeiter, unsere Umsätze entwickeln sich in den letzten Jahren sehr positiv, wir haben zum Beispiel im Vergleich zum Vorjahr, dieses Jahr eine Verdoppelung des Umsatzes realisieren können."
    Hochkomplexe Spracherkennung
    Spracherkennung ist ein hochkomplexes Thema. Noch vor zehn Jahren musste man laut und deutlich ins Mikrofon sprechen, damit die Software den Schall übersetzen konnte. Mit normaler Kommunikation hat das aber nichts zu tun. Mal sprechen Menschen leise und nuscheln, mal mit Dialekt und ausländischem Akzent, mal sind die Nebengeräusche lauter als der Sprecher. Probleme, die die Entwickler der SemVox GmbH mit Hard- und Software in den Griff bekommen haben:
    "Zum einen ist es ja so, dass Mikrofonierung heute in einer anderen Qualität ist, als das noch vor zehn Jahren der Fall war. Dadurch ist es möglich, Sprache grundsätzlich besser über die Technik zu erkennen. Im Hintergrund ist es natürlich auch so, dass da noch eine Software arbeitet und diese Software ist über die Jahre in der Qualität der Spracherkennung deutlich gewachsen, auf diese Weise kann das Sprachergebnis durchaus auch mal in lauteren Umgebungen gut funktionieren",
    sagt Marc Mailänder, Vertriebschef der SemVox GmbH Saarbrücken. Trotz aller Fortschritte gibt es aber auch heute noch keine perfekte Spracherkennung:
    "Aber hier ist es so, dass das System tendenziell nachfragt, das nennen wir „Proaktive Assistenz“, das heißt, im Beispiel, wenn es nicht ganz sicher ist, ob im Automobilbereich der Zielort jetzt Bonn oder Bauna war, dann fragt das System zurück."
    So wie es Menschen auch machen, wenn sie sich unsicher sind. Die Bedienschnittstelle zwischen Mensch und Maschine reagiert intelligent und flexibel. Das bedeutet aber auch: SemVox setzt Spracherkennung nur dort ein, wo sie tatsächlich sinnvoll ist. Parallel zur Sprache gibt es noch die klassischen Eingaben etwa über Touchscreen – wobei das Ziel schon die sprachgesteuerte Assistenz sei, sagt Norbert Pfleger. Und die lässt sich auf vielen Feldern nutzen.
    "Beispiel: Nimm heute Abend den Tatort auf! Eine sinnvolle Reaktion in dem Fall wäre, wenn gesagt wird: Okay, die Sendung wird heute um 20:15 Uhr aufgezeichnet! Oder: Heute Abend gibt es keinen Tatort, aber nächsten Sonntag, sollen wir den dann aufnehmen?"
    Das intelligente Haus
    Das intelligente Haus zählt zu den spannendsten Anwendungen sprachgesteuerter Assistenten. In wenigen Jahren seien sie unverzichtbare Helfer für Alte und Behinderte, sagt Norbert Pfleger, Mobilität gewinne vor diesem Hintergrund eine neue Dimension:
    "Unser Ansatz ist es hier, wirklich persönliche digitale Assistenten zu realisieren, die eine ganze Reihe von Funktionen, Geräten und Anwendungen zusammenfassen, sodass ich als Benutzer mich nicht darum kümmern muss, wo kommt jetzt die Information zum Thema „Wetter“ her, all diese Informationen werden für mich aggregiert, werden für mich zusammengefasst, und erst dann kommen wir in einen Bereich, wo Sprachsteuerung seinen Mehrwert ausüben kann."