Archiv


Versteh mich doch!

Bei nahezu jeder Hotline oder in den Telefonzentralen großer Firmen nehmen erst ein mal Computer den Hörer ab und sortieren vor. Mit einfachen Worten wie "Ja" oder "Nein" oder "Eins", "Zwei" und "Drei" wird man dann abgefertigt. Viel mehr können die Systeme nämlich noch nicht zuverlässig. Das wird sich jetzt ändern - versprechen die Experten.

Von Pia Grund-Ludwig |
    Erfahrungen mit Spracheingabesystemen haben viele Menschen mittlerweile gemacht, und die sind derzeit noch häufig sehr frustrierend. Man muss sich durch zu komplexe Menüstrukturen hangeln, verheddert sich in unsinnigen Dialogen oder muss gar nach langen Zwiegesprächen mit dem Kollegen Computer wieder vorne anfangen, weil man sich an der falschen Stelle geräuspert hat. Matthias Peissner Experte für Spracherkennung am Fraunhofer-Institut IAO ist vor allem mit den Benutzerschnittstellen der Systeme noch unzufrieden:

    "Ich würde mir wünschen, dass auf Seiten der Benutzerschnittstellen deutlich mehr Systeme den Ansatz der Mixed Initiative verfolgen. Das heißt, der Benutzer, wenn er das System nicht kennt, wird durch das System geführt, ihm werden die Optionen, die ihm zur Verfügung stehen in Menüs explizit genannt und er kann auswählen. Der erfahrene Benutzer, der das System bereits kennt, kann direkt sagen, was er möchte, bestimmte Schritte überspringen und viel schneller an sein Ziel kommen. "

    Dabei sind die Technologien eigentlich vorhanden, und einige Anwendungen vor allem aus dem Bankbereich funktionieren ziemlich gut. Dort kann man dann Überweisungen durchführen, Kontostände abfragen, Freistellungsaufträge erteilen oder Daueraufträge einrichten. Im Einsatz sind Sprachsysteme auch bei Ansagediensten. So wurde auf dem Voice Day ein System ausgezeichnet, das Auskunft über Kinofilme liefert. Es erlaubt die Anfrage in kompletten Sätzen, etwa: ich möchte den neuen Film von Jim Jarmusch sehen. Wer nachfragen will, kann die Ansagen des Automaten sofort unterbrechen. Solche Systeme werden, davon ist Professor Wolfgang Wahlster vom Deutschen Forschungszentrum für Künstliche Intelligenz überzeugt, in vielen unterschiedlichen Feldern Einzug halten:

    "Ich glaube die nächste Welle wird sein, dass man die Systeme stärker einbettet. Sie werden in zwei drei Jahren Systeme haben wo sie den Musiktitel, den sie gerne hören würden einfach ansprechen, ich möchte jetzt den neusten Hit von Madonna oder Mozarts Klavierkonzert Köchelverzeichnis soundsoviel haben. Wir werden im nächsten Jahr die ersten Produkte sehen, wo wir unser Navigationssystem mit Sprache programmieren können. "

    Das ist schwieriger zu realisieren als Systeme, bei denen die Menschen zu Hause ihr Telefon benutzen:

    " Das ist eine große Herausforderung, technologisch deshalb, weil wir im Auto mehr Störgeräusche haben, dort ist natürlich auch wichtig, dass wir eine sichere Erkennung haben, dass das System nicht zu lange in Klärungsdialoge geht, denn das hält natürlich auch von der Konzentration ab. "

    Fraunhofer-Experte Peissner geht davon aus, dass dies nicht nur bei Anwendungen im privaten Umfeld eine Rolle spielen wird, sondern auch im Arbeitsalltag. Bei Auskünften funktioniert das heute schon. So gibt es einige Untenehmen, bei denen Mitarbeiter sprachgesteuert Passwörter anfragen könne, wenn sie die vergessen haben. Ihr Stimmmuster ist hinterlegt und wird als Zugangsberechtigung benutzt. In Lagern könnte Spracheingabe Bleistift und Papierliste ersetzen:

    " Zum Beispiel in der Fertigung, in der Produktion, insbesondere Fertigung, Servicebereich, Wartung, insbesondere da, wo es Routinen gibt, Prüfroutinen, wo man Schritt für Schritt bestimmte Dinge überprüfen muss, wo man bestimmte Prüfergebnisse einsprechen kann, da wo der Servicetechniker Hände und Augen mit anderen Dingen beschäftigt hat, wo die Lichtverhältnisse schlecht sind, da kann ich mehr sehr gut vorstellen, dass Sprachapplikationen sinnvollen Einsatz bieten können. "

    Sprachsysteme werden uns also künftig sehr viel häufiger begegnen. Und sie werden schlauer, verspricht Sprachforscher Wolfgang Wahlster. So werden künftige Systeme mit verschiedenen künstlich erzeugten Personenprofilen auf Seiten der Computer arbeiten. Das soll für mehr Akzeptanz sorgen. Jugendliche erhalten die Antworten dann von einem Youngster, der Produkte stylish, angesagt und cool findet, ältere dagegen hören Computerstimmen, die etwas langsamer und in tieferer Tonlage Dinge erklären. Auch die Stimmung der Benutzer sollen die Rechner künftig besser mitbekommen. Das gibt Anlass zur Hoffnung: Künftig entschuldigt sich das Navigationssystem in ihrem Auto vielleicht, wenn es Ihnen mit Besserwisserei über vermeintlich richtige Routen auf den Wecker gegangen ist.