Von Andrea Vogel
Nehmen wir an, wir teilen unserem elektronischen Kalender mit, dass wir uns um elf Uhr verabredet haben. Per Spracheingabe natürlich. Nehmen wir außerdem an, der Kalender hat die einzelnen Wörter richtig erkannt. Dann hat er immer noch keine Ahnung, was wir ihm eigentlich sagen wollen.
"11 ist ein Zahlwort, Uhr ist ein Substantiv, vielleicht hat die Spracherkennung auch etwas anderes erkannt. Ur- kann eine Vorsilbe sein von irgendwelchen anderen Wörtern und dann tauchen Mehrdeutigkeiten auf. Auf diese Wortartbestimmung folgt eine syntaktische Analyse. Da geht es darum zu erkennen, was das Verb in dem Satz ist und welche Objekte mit dieser Aktion verbunden werden."
Michael Strube leitet die Arbeitsgruppe Computerlinguistik am European Media Lab in Heidelberg. Seine und etliche andere Arbeitsgruppen erproben verschiedene Verfahren, um Maschinen einen Sinn für gesprochene Sprache zu geben. Sprache verstehen – das bedeutet, die logische Struktur eines Satzes zu erkennen. Grammatik kann den Maschinen bei dieser Aufgabe nur sehr wenig weiterhelfen. Denn kaum ein Mensch spricht spontan exakt nach ihren Regeln. Sicherer ist es, zuerst nach Wortarten zu schauen: Um die logische Struktur zu finden, schält man nach und nach einzelne Wörter aus dem Satzgebilde heraus und verknüpft sie zu Sinnzusammenhängen.
"Wenn wir ein Beispiel nehmen: Ich treffe heute Abend Robert im Restaurant. Dann haben wir ein Verb, das ist das Wichtigste im Satz: "treffen". Wir wissen, dass das Verb "treffen" mindestens zwei Objekte braucht, die sich treffen. Das sind jetzt ich und Robert. "Treffen" gibt einen Rahmen und wir hängen diese beiden Objekte in den Rahmen, so dass das ein ganzes Bild ergibt."
So entwickeln die Linguisten aus der Oberflächenstruktur, aus der Konstruktion des Satzes, eine Tiefenstruktur, die die Bedeutung erfasst. Keine leichte Aufgabe. Denn ein freier Dialog – selbst wenn er sich auf ein bestimmtes Thema beschränkt – ist unendlich komplex. Und die Maschine muss im Grunde für jeden Teil jeder möglichen Äußerung wissen, wie die Tiefenstruktur aussieht, welches also der passende Rahmen ist und welche anderen Teile der Äußerung hinein gehängt werden können. Dazu kann die Maschine, fast wie für einen Wetterbericht, Prognosen erstellen:
"Man verwendet Statistik, um Zusammenhänge zwischen verschiedenen Worten, zwischen verschiedenen Teilen der Äußerung zu erkennen und versucht daraus, die Bedeutung zu erschließen."
Dadurch wird sie sehr flexibel: Sie kann mit vielen Wörtern und darum auch relativ freien Dialogen umgehen. Nur ist sie nicht so besonders genau und versteht immer wieder Dinge falsch. Sie kann auch arbeiten wie ein Schachcomputer und fest einprogrammierte Regeln benutzen. Nur ist die Aufgabe, Sprache zu verstehen, viel schwieriger als ein Schachspiel. Alle Regeln kennt die Maschine meist nur für einen winzigen Bereich der Sprache. Man muss mit ihr also sehr genau bei einem Thema bleiben. Dann ist sie aber so gut wie perfekt. Welcher Weg vielversprechender ist, ist umstritten. Lange war es so, dass die "klassischen" Linguisten versuchten, die Regeln der Sprache zu verstehen, und darum den regelbasierten Ansatz immer weiter betrieben haben. Die Computerlinguisten hingegen suchten nach Wegen, mit den gigantischen Datenmengen und Unschärfen gesprochener Sprache umzugehen – und betrieben dazu fast ausschließlich Statistik. Ob das so weitergehen kann, darüber wird derzeit heftig diskutiert.
"James Allen, eine der wichtigsten Personen in der Szene, sagt, dass er glaubt, dass wir linguistisches Wissen, dass wir Weltwissen, Wissen über die Domäne, in der das System existiert, brauchen, um ein funktionierendes System überhaupt zu bekommen. Ich persönlich glaube, dass wir die Statistik noch nicht ausgereizt haben. Und wir müssen eher noch etwas weiter in diese Richtung gehen, und wir müssen versuchen, auch semantische und pragmatische Phänomene durch Statistik zu beschreiben. "
Ob mit Statistiken, Regeln oder vielleicht beidem: Sicher ist, dass die Forscher noch einen langen Weg vor sich haben, bis Maschinen wirklich flüssig Sprache verstehen können.
Näheres finden Sie im Internet unter http://www.cl.uni-heidelberg.de/.
Die Sendung steht Ihnen auch als Audiodatei zur Verfügung. Forschung aktuell als Real-Audio-Datei Forschung aktuell als mp3-Datei
Nehmen wir an, wir teilen unserem elektronischen Kalender mit, dass wir uns um elf Uhr verabredet haben. Per Spracheingabe natürlich. Nehmen wir außerdem an, der Kalender hat die einzelnen Wörter richtig erkannt. Dann hat er immer noch keine Ahnung, was wir ihm eigentlich sagen wollen.
"11 ist ein Zahlwort, Uhr ist ein Substantiv, vielleicht hat die Spracherkennung auch etwas anderes erkannt. Ur- kann eine Vorsilbe sein von irgendwelchen anderen Wörtern und dann tauchen Mehrdeutigkeiten auf. Auf diese Wortartbestimmung folgt eine syntaktische Analyse. Da geht es darum zu erkennen, was das Verb in dem Satz ist und welche Objekte mit dieser Aktion verbunden werden."
Michael Strube leitet die Arbeitsgruppe Computerlinguistik am European Media Lab in Heidelberg. Seine und etliche andere Arbeitsgruppen erproben verschiedene Verfahren, um Maschinen einen Sinn für gesprochene Sprache zu geben. Sprache verstehen – das bedeutet, die logische Struktur eines Satzes zu erkennen. Grammatik kann den Maschinen bei dieser Aufgabe nur sehr wenig weiterhelfen. Denn kaum ein Mensch spricht spontan exakt nach ihren Regeln. Sicherer ist es, zuerst nach Wortarten zu schauen: Um die logische Struktur zu finden, schält man nach und nach einzelne Wörter aus dem Satzgebilde heraus und verknüpft sie zu Sinnzusammenhängen.
"Wenn wir ein Beispiel nehmen: Ich treffe heute Abend Robert im Restaurant. Dann haben wir ein Verb, das ist das Wichtigste im Satz: "treffen". Wir wissen, dass das Verb "treffen" mindestens zwei Objekte braucht, die sich treffen. Das sind jetzt ich und Robert. "Treffen" gibt einen Rahmen und wir hängen diese beiden Objekte in den Rahmen, so dass das ein ganzes Bild ergibt."
So entwickeln die Linguisten aus der Oberflächenstruktur, aus der Konstruktion des Satzes, eine Tiefenstruktur, die die Bedeutung erfasst. Keine leichte Aufgabe. Denn ein freier Dialog – selbst wenn er sich auf ein bestimmtes Thema beschränkt – ist unendlich komplex. Und die Maschine muss im Grunde für jeden Teil jeder möglichen Äußerung wissen, wie die Tiefenstruktur aussieht, welches also der passende Rahmen ist und welche anderen Teile der Äußerung hinein gehängt werden können. Dazu kann die Maschine, fast wie für einen Wetterbericht, Prognosen erstellen:
"Man verwendet Statistik, um Zusammenhänge zwischen verschiedenen Worten, zwischen verschiedenen Teilen der Äußerung zu erkennen und versucht daraus, die Bedeutung zu erschließen."
Dadurch wird sie sehr flexibel: Sie kann mit vielen Wörtern und darum auch relativ freien Dialogen umgehen. Nur ist sie nicht so besonders genau und versteht immer wieder Dinge falsch. Sie kann auch arbeiten wie ein Schachcomputer und fest einprogrammierte Regeln benutzen. Nur ist die Aufgabe, Sprache zu verstehen, viel schwieriger als ein Schachspiel. Alle Regeln kennt die Maschine meist nur für einen winzigen Bereich der Sprache. Man muss mit ihr also sehr genau bei einem Thema bleiben. Dann ist sie aber so gut wie perfekt. Welcher Weg vielversprechender ist, ist umstritten. Lange war es so, dass die "klassischen" Linguisten versuchten, die Regeln der Sprache zu verstehen, und darum den regelbasierten Ansatz immer weiter betrieben haben. Die Computerlinguisten hingegen suchten nach Wegen, mit den gigantischen Datenmengen und Unschärfen gesprochener Sprache umzugehen – und betrieben dazu fast ausschließlich Statistik. Ob das so weitergehen kann, darüber wird derzeit heftig diskutiert.
"James Allen, eine der wichtigsten Personen in der Szene, sagt, dass er glaubt, dass wir linguistisches Wissen, dass wir Weltwissen, Wissen über die Domäne, in der das System existiert, brauchen, um ein funktionierendes System überhaupt zu bekommen. Ich persönlich glaube, dass wir die Statistik noch nicht ausgereizt haben. Und wir müssen eher noch etwas weiter in diese Richtung gehen, und wir müssen versuchen, auch semantische und pragmatische Phänomene durch Statistik zu beschreiben. "
Ob mit Statistiken, Regeln oder vielleicht beidem: Sicher ist, dass die Forscher noch einen langen Weg vor sich haben, bis Maschinen wirklich flüssig Sprache verstehen können.
Näheres finden Sie im Internet unter http://www.cl.uni-heidelberg.de/.
Die Sendung steht Ihnen auch als Audiodatei zur Verfügung. Forschung aktuell als Real-Audio-Datei Forschung aktuell als mp3-Datei