Archiv


Unterstützung für Duden und Co

Um neue Sprach-Trends, Wörter und Wendungen aufzuspüren und in Lexika und Wörterbücher aufzunehmen, mussten Linguisten bislang Unmengen an Zeitungen, Magazinen und Büchern geduldig abarbeiten. In Zukunft hilft den Redakteuren dabei ein Programm, das derzeit am Institut für Maschinelle Sprachverarbeitung in Stuttgart entwickelt wird. Vergangenen Donnerstag wurde dieser erste Transferbereich der Deutschen Forschungsgemeinschaft, der in die Geisteswissenschaften führt, vorgestellt.

Cajo Kutzbach |
    "Wörterbücher, die einmal geschrieben sind, sind nach ein paar Jahren veraltet, weil die Sprache sich weiter entwickelt. Und um dabei auf dem neuesten Stand zu bleiben, unterhalten wir ein Team von freien Mitarbeitern, die für uns Zeitungen, Zeitschriften und Bücher nach unseren Vorgaben auswerten und prüfen, welche Wörter und Wortverwendungen möglicherweise noch nicht in Wörterbüchern erfasst sind", erklärt der stellvertretende Leiter der Dudenredaktion, Werner Scholze-Stuben-recht, den Weg neuer Wörter in ein Lexikon. Diese freien Mitarbeiter bekommen jetzt maschinelle Konkurrenz, denn das Institut für Maschinelle Sprachverarbeitung der Universität Stuttgart arbeitet mit Duden und Langenscheidt an einem Programm, dass Datenmengen von 200 Millionen Wörtern auswerten kann. Dennoch soll die Maschine dem Menschen diese Sisyphus-Aufgabe nicht vollständig abnehmen, betont die Projektleiterin für Wörterbücher bei Langenscheidt, Dr. Esther Debus-Gregor: "Der Computer kann den Menschen nicht völlig ersetzen, denn wir müssen ja bewerten, was da herausgefiltert und uns zur Aufnahme ins Wörterbuch vorgeschlagen wird."

    Allerdings soll das Programm auf Lernfähigkeit getrimmt werden, so dass es im Laufe der Zeit immer besser zwischen etwa Druckfehlern und neuen Wortschöpfungen zu unterscheiden weiß. Institutsleiter Professor Christian Rohrer skizziert das Ziel der Arbeit: "Wir wollen die Wörterbücher von Verlagen, wie Duden oder Langenscheidt verbessern, indem wir versuchen, etwa Wortkombinationen zu finden, die eine Übersetzung besser treffen. Möchte beispielsweise ein Engländer wissen, was eine nahe deutsche Entsprechung für die Wendung "give a talk" ist, sollte das Lexikon dann eben nicht "einen Vortrag geben", sondern "einen Vortrag halten" liefern. Es bestehen ganz bestimmte Kombinationen von Verben und Substantiven, die man einfach kennen muss. Und solche Informationen fehlen sehr häufig in Wörterbüchern." Der wesentliche Unterschied der neuen Software zu bisherigen Korrekturprogrammen, wie sie etwa in Textverarbeitungsprogrammen existieren, besteht in der Erkennung von Sinn-Zusammenhängen. So erkennt das Programm auch in langen Sätzen zum Beispiel die Zusammengehörigkeit der beiden darin enthaltenen Wörter "Vortrag" und "halten". "Überdies erstellt das Programm eine Statistik, wie häufig ein bestimmtes Wort vorkommt und weist darauf hin, ob es sich wirklich eingebürgert hat oder nur die Marotte eines einzelnen Autors ist", so Rohrer. Die Software verfüge zwar über Grammatik-, nicht aber über Semantikkenntnisse und erkenne daher auch nicht wirklich, wovon in einem Text die Rede ist.

    Der größte Vorteil des Programms, von dem bereits eine Demoversion läuft, sei die Fähigkeit, riesige Mengen Text zu analysieren, führt Werner Scholze-Stuben-recht aus: "Werten wir so genannte Volltextsammlungen maschinell aus, etwa ganze Zeitungsjahrgänge, so erhalten wir statistisch viel genauere Angaben, mit denen die Arbeit des menschlichen Geistes in großem Umfang unterstützt und ergänzt werden kann." Wenn der Computer die Fleißarbeit übernimmt, ermöglicht das den Redaktionen, ihre Wörterbücher viel rascher als bisher zu aktualisieren. Der Benutzer soll überdies in Zukunft durch einfaches Anklicken eines Wortes auch die typischen Redewendungen dazu finden. "Einerseits erhöhen wir so die Qualität unserer Produkte, indem wir feststellen, in welchen Zusammenhängen Wörter gebraucht werden, und dies in Wörterbüchern wiedergeben. Andererseits hoffen wir, mit den Ergebnissen dieses Projekts auch weiterhin innovative Wörterbuchsoftware anbieten zu können", betont Esther Debus-Gregor.