Wenn ein Schachspieler im Zug sitzend einen Zug macht, ist nicht klar, ob er dabei Bahn fährt, oder raucht, oder ob er in einem stark durchlüfteten Raum eine Spielfigur bewegt. Wir erkennen das aus dem Zusammenhang, aber den kennt der Computer nicht.
Das soll der neue Sonderforschungsbereich 732 der Deutschen Forschungsgemeinschaft ändern, in dem 30 Wissenschaftler an 14 Projekten arbeiten. Seine Sprecherin, Artemis Alexiadou, ist Professorin für englische Sprachwissenschaft an der Universität Stuttgart. Die Sprachwissenschaftler wollen das in der Sprache steckende Wissen erschließen.
"Was der Linguist macht, ist dieses Wissen, dieses implizite Wissen, dass sie und ich über unsere Sprache haben, explizit zu machen. Der normale Mensch nimmt das als eine selbstverständliche Sache, aber so selbstverständlich ist es nicht, wie wir in den Beispielen gesehen haben."
Maschinelle Sprachverarbeitung ähnelt oft einem Schüler, der versucht einen Text Wort für Wort zu übersetzen. Das geht meist schief. Bei Mehrdeutigkeiten erst recht. Was wir aus der Situation, dem Klang, dem Gesagten automatisch berücksichtigen, muss mit Hilfe der Sprachlehre, also Laut,- Formen- und Satzbau-Lehre erkannt und beschrieben werden.
"Der Geist ist willig, aber das Fleisch ist schwach!" wird sonst in einer maschinellen Übersetzung zu: "Der Alkohol ist gut, aber der Braten schlecht."
"Wenn ich den Satz einfach so höre - ohne Kontext - weiß ich auch nicht, wie ich ihn verstehen kann. Wir sagen ok, wir müssen jetzt diesen Kontext in irgendeiner Form messen können. Das heißt wir gucken was war vorher im Satz, was ist nachher im Satz und aus diesem Kontext wird "normalerweise" klar, wie der Satz zu interpretieren ist. Das müsste man dann natürlich in irgendeiner Form als Regel dann der Maschine beibringen."
Und zwar so knapp wie möglich, damit der Rechner flott arbeiten kann. Er braucht nicht die ganze Bibel als Kontext, aber irgend etwas, dass klar macht, dass es um Religion und Metaphysik geht und nicht um eine Restaurantkritik.
Es gibt auch Fälle, bei denen ein Wort gar nicht mal mehrdeutig ist, sondern seine Stellung, also der Satzbau, unterschiedliche Deutungen zulässt. Meist nur in einer Sprache, weil die Grammatik ja nicht in allen Sprachen gleich ist.
Auch deshalb gehen die Stuttgarter Sprachwissenschaftler den Mehrdeutigkeiten gleich mehrsprachig auf den Grund. Wie, erklärt Professorin Artemis Alexiadou:
"Wir arbeiten hier hauptsächlich komparativ. Also das heißt wir vergleichen zwischen den Sprachen, zum Beispiel Englisch und Deutsch, oder Englisch und die Romanischen Sprachen. Es gibt viele Adjektive, die mehrdeutig sind. Im Englischen sind diese Adjektive immer genauso wie im Deutschen vor dem Nomen, also:
"Peter ist ein alter Freund" Und das heißt, der selber, also die Person ist alt, oder die Freundschaft hält schon lange. Wenn ich jetzt die romanischen Sprachen angucke, dann sehe ich, dass die eine Bedeutung eine andere Syntax hat. Wenn ich sage der Peter, die Person, ist alt, dann kommt mein Adjektiv nach dem Nomen in den romanischen Sprachen. Und wenn ich sage, die Freundschaft ist alt, dann kommt mein Adjektiv vor dem Nomen in den romanischen Sprache."
Das bedeutet die Stellung des Eigenschaftswortes verrät in romanischen Sprachen, also Lateinisch, Spanisch, Italienisch, Französisch etwas über den Zusammenhang.
Das könnte bei einer Übersetzung aus diesen Sprachen hilfreich sein. Für Menschen und Computer. Denn zunächst einmal geht es darum zu verstehen, wie das Regelsystem Sprache funktioniert. Die Anwendung kommt erst viel später. Artemis Alexiadou möchte im SFB herausfinden:
"Welche Mechanismen braucht der Mensch um mit Mehrdeutigkeit umgehen zu können? Wie kann ich das automatisch in die Maschine eingeben? Das wird natürlich dann, vor allem gegen Ende der Laufzeit bedeuten, dass wir in der Lage sein werden ein bisschen mehr in Richtung Sprache für den Computer zu tun. Also, wie kann der Computer Sprache verstehen und bearbeiten, genauso wie ein normaler Mensch? Und das wäre ein wichtiger Schritt für die Kollegen in der Computerlinguistik..."
...mit denen der neue SFB an der Uni Stuttgart eng zusammen arbeiten wird.
Zunächst mal müssen die Sprachforscher aber heraus finden, wie Sprache bei Mehrdeutigkeiten funktioniert. Ob das in allen Sprachen gleich geschieht, oder ob einzelne Sprachen bestimmte Regeln bevorzugen:
"Ich gehe davon aus, dass es so sein wird, dass manche Sprachen bestimmte Regeln bevorzugen. Unsere Aufgabe wird dann sein zu erklären, wieso das so ist. Wieso in Sprache X Regel Y wichtig ist und in Sprache A nicht. Ich geh aus, dass es so sein wird und das ist das Spannendste."
Zumindest für Sprachforscher. Für normale Sterbliche, die Sprache meist nur nach dem Gefühl benutzen und sich keine Gedanken über Grammatik, Syntax und all die anderen Fachbegriffe der Sprachforscher machen, bleibt das Vergnügen darauf zu achten, wo ein Mensch einem Übersetzungsprogramm überlegen ist. Und das ist viel häufiger der Fall, als man denkt. Hier ein paar Beispiele:
Es ist ein großer Unterschied, ob man an oder unter die Decke geht.
Der Löwenzahn ist nur harmlos, solange er auf der Wiese wächst und nicht im Maul eines Tieres.
Der Händler am Stand hat einen schweren Stand, wenn die Kunden drängeln.
Das macht die Gewohnheit, sagt man, wenn man die Macht der Gewohnheit zu spüren bekommt.
Und im folgenden Satz führt nur eine entsprechende Betonung zu verschiedenen Bedeutungen: "Was wollen Sie schon wieder?" "Was wollen Sie schon wieder?" "Was, wollen Sie schon wieder?
Das soll der neue Sonderforschungsbereich 732 der Deutschen Forschungsgemeinschaft ändern, in dem 30 Wissenschaftler an 14 Projekten arbeiten. Seine Sprecherin, Artemis Alexiadou, ist Professorin für englische Sprachwissenschaft an der Universität Stuttgart. Die Sprachwissenschaftler wollen das in der Sprache steckende Wissen erschließen.
"Was der Linguist macht, ist dieses Wissen, dieses implizite Wissen, dass sie und ich über unsere Sprache haben, explizit zu machen. Der normale Mensch nimmt das als eine selbstverständliche Sache, aber so selbstverständlich ist es nicht, wie wir in den Beispielen gesehen haben."
Maschinelle Sprachverarbeitung ähnelt oft einem Schüler, der versucht einen Text Wort für Wort zu übersetzen. Das geht meist schief. Bei Mehrdeutigkeiten erst recht. Was wir aus der Situation, dem Klang, dem Gesagten automatisch berücksichtigen, muss mit Hilfe der Sprachlehre, also Laut,- Formen- und Satzbau-Lehre erkannt und beschrieben werden.
"Der Geist ist willig, aber das Fleisch ist schwach!" wird sonst in einer maschinellen Übersetzung zu: "Der Alkohol ist gut, aber der Braten schlecht."
"Wenn ich den Satz einfach so höre - ohne Kontext - weiß ich auch nicht, wie ich ihn verstehen kann. Wir sagen ok, wir müssen jetzt diesen Kontext in irgendeiner Form messen können. Das heißt wir gucken was war vorher im Satz, was ist nachher im Satz und aus diesem Kontext wird "normalerweise" klar, wie der Satz zu interpretieren ist. Das müsste man dann natürlich in irgendeiner Form als Regel dann der Maschine beibringen."
Und zwar so knapp wie möglich, damit der Rechner flott arbeiten kann. Er braucht nicht die ganze Bibel als Kontext, aber irgend etwas, dass klar macht, dass es um Religion und Metaphysik geht und nicht um eine Restaurantkritik.
Es gibt auch Fälle, bei denen ein Wort gar nicht mal mehrdeutig ist, sondern seine Stellung, also der Satzbau, unterschiedliche Deutungen zulässt. Meist nur in einer Sprache, weil die Grammatik ja nicht in allen Sprachen gleich ist.
Auch deshalb gehen die Stuttgarter Sprachwissenschaftler den Mehrdeutigkeiten gleich mehrsprachig auf den Grund. Wie, erklärt Professorin Artemis Alexiadou:
"Wir arbeiten hier hauptsächlich komparativ. Also das heißt wir vergleichen zwischen den Sprachen, zum Beispiel Englisch und Deutsch, oder Englisch und die Romanischen Sprachen. Es gibt viele Adjektive, die mehrdeutig sind. Im Englischen sind diese Adjektive immer genauso wie im Deutschen vor dem Nomen, also:
"Peter ist ein alter Freund" Und das heißt, der selber, also die Person ist alt, oder die Freundschaft hält schon lange. Wenn ich jetzt die romanischen Sprachen angucke, dann sehe ich, dass die eine Bedeutung eine andere Syntax hat. Wenn ich sage der Peter, die Person, ist alt, dann kommt mein Adjektiv nach dem Nomen in den romanischen Sprachen. Und wenn ich sage, die Freundschaft ist alt, dann kommt mein Adjektiv vor dem Nomen in den romanischen Sprache."
Das bedeutet die Stellung des Eigenschaftswortes verrät in romanischen Sprachen, also Lateinisch, Spanisch, Italienisch, Französisch etwas über den Zusammenhang.
Das könnte bei einer Übersetzung aus diesen Sprachen hilfreich sein. Für Menschen und Computer. Denn zunächst einmal geht es darum zu verstehen, wie das Regelsystem Sprache funktioniert. Die Anwendung kommt erst viel später. Artemis Alexiadou möchte im SFB herausfinden:
"Welche Mechanismen braucht der Mensch um mit Mehrdeutigkeit umgehen zu können? Wie kann ich das automatisch in die Maschine eingeben? Das wird natürlich dann, vor allem gegen Ende der Laufzeit bedeuten, dass wir in der Lage sein werden ein bisschen mehr in Richtung Sprache für den Computer zu tun. Also, wie kann der Computer Sprache verstehen und bearbeiten, genauso wie ein normaler Mensch? Und das wäre ein wichtiger Schritt für die Kollegen in der Computerlinguistik..."
...mit denen der neue SFB an der Uni Stuttgart eng zusammen arbeiten wird.
Zunächst mal müssen die Sprachforscher aber heraus finden, wie Sprache bei Mehrdeutigkeiten funktioniert. Ob das in allen Sprachen gleich geschieht, oder ob einzelne Sprachen bestimmte Regeln bevorzugen:
"Ich gehe davon aus, dass es so sein wird, dass manche Sprachen bestimmte Regeln bevorzugen. Unsere Aufgabe wird dann sein zu erklären, wieso das so ist. Wieso in Sprache X Regel Y wichtig ist und in Sprache A nicht. Ich geh aus, dass es so sein wird und das ist das Spannendste."
Zumindest für Sprachforscher. Für normale Sterbliche, die Sprache meist nur nach dem Gefühl benutzen und sich keine Gedanken über Grammatik, Syntax und all die anderen Fachbegriffe der Sprachforscher machen, bleibt das Vergnügen darauf zu achten, wo ein Mensch einem Übersetzungsprogramm überlegen ist. Und das ist viel häufiger der Fall, als man denkt. Hier ein paar Beispiele:
Es ist ein großer Unterschied, ob man an oder unter die Decke geht.
Der Löwenzahn ist nur harmlos, solange er auf der Wiese wächst und nicht im Maul eines Tieres.
Der Händler am Stand hat einen schweren Stand, wenn die Kunden drängeln.
Das macht die Gewohnheit, sagt man, wenn man die Macht der Gewohnheit zu spüren bekommt.
Und im folgenden Satz führt nur eine entsprechende Betonung zu verschiedenen Bedeutungen: "Was wollen Sie schon wieder?" "Was wollen Sie schon wieder?" "Was, wollen Sie schon wieder?