Montag, 13. Mai 2024

Archiv


Virtueller Klatschreporter

Rascalli ist der Name eines Projekts am Deutschen Forschungszentrum für Informatik in Saarbrücken. Rascalli heißt gleichzeitig der künstliche Agent, der fast alles weiß über die internationale Popkultur.

Von Klaus Herbst | 03.01.2009
    Feiji Shü leitet das Rascalli-Projekt. Rascalli ist ein Software-Agent und besitzt neben – wie gerade gehört Sprachausgabe – auch eine bunte, animierte und roboterähnliche Bedieneroberfläche. Was will Rascalli? Ganz einfach: den Popfans alles vermitteln, was zu Pop Trivia gerechnet wird, Trivialitäten des Pop-Geschäftes, wer mit wem, wie lange und warum?

    "Dieses ganze soziale Network von Madonna wurde bei uns gefunden und visualisiert. Hier kann man genau sehen, mit wem Madonna liiert war und mit wem Madonna zusammenarbeitete, welche Musikrichtung beeinflusste Madonna? Oder umgekehrt?"

    Rascalli gibt manchmal falsche Antworten, es fällt ihm weiß aber fast zu jedem Künstler etwas ein. Zunächst haben ihm die Forscher vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken – wie im Schulunterricht auch - sichere Grundkenntnisse vermittelt. Der Computerlinguist Professor Hans Uszkoreit vom DFKI:

    "Das System beginnt mit ganz vielen Beispielen. Die stammen aus einer Popmusikdatenbank. Und dann findet es die Internetorte, die Web-Seiten, in denen viel über so Pop und Popmusiker steht, und dann sucht es, ob es zu diesem Namen oder zu den Musikrichtungen neue Sachen gibt, und hat aber Muster gelernt aus dem Beispiel, weil es ja schon angefangen hat mit vielen Beispielen. Also ungefähr wie wir das als Mensch auch machen würden in einem neuen Gebiet."

    Übertragbar sei das Projekt auf jedes andere Wissensgebiet, sagt Uszkoreit, zum Beispiel auch auf das Thema Finanzkrise. Nur habe man für den Demonstrator absichtlich eine Anwendung geschaffen mit einem Thema, bei dem der eine oder andere Fehler nicht gleich katastrophale Folgen hätte. Ob Madonna in Wirklichkeit zehn Kontakte mehr oder weniger hat als Rascalli weiß, wen kümmert’s? Außerdem soll der im Internet lebende Roboter auch ein bisschen Freude bereiten.

    "Das macht als den Jugendlichen jetzt mehr Spaß. Eigentlich wird diese Person nicht gebraucht. Wir wollen auch gerne mit bestimmten Wissensgebieten bestimmte Agenten identifizieren, damit das Ergebnis eher so wirkt wie in der normalen Welt. Ich zeige ihm zum Beispiel ein paar Beispiele von Leuten, von zwei Musikstars, die sich zerstreiten. Und dann sucht der überall in den Texten, wo etwas zu diesem Zeitpunkt über die beiden steht, über den Streit. Und lernt aus all diesen Sätzen, in denen darüber berichtet wird, welche Muster verwenden Journalisten und andere Menschen, wenn sie über einen Streit berichten zwischen zwei Personen? Dann hat unser System wieder etwas dazugelernt."

    Caroline Sporleder leitet eine Forschungsgruppe im Intelligenzcluster für Informatik. Sie hat Rascalli Grammatik beigebracht und gibt dem bunten Bot gerne Nachhilfestunden.

    "Wir haben ja Systeme, die Verben erkennen können und wissen, um was für Handlungen oder so es sich da handelt und die halt auch analysieren können. Wie hängt das syntaktisch zusammen, Wie hängt das grammatikalisch zusammen? Das Problem ist, dass das halt nicht unbedingt in allen Sätzen immer ganz explizit gemacht wird."

    Nicht alles ist transparent und sprachlich eindeutig. Genau da stößt Rascalli oft an seine Grenzen – Redewendungen sind ein Paradebeispiel.

    "Das Problem ist einfach, dass Sprache oder bestimmte Wörter unterschiedliche Bedeutung haben können in unterschiedlichem Kontext. Und wenn Sie so etwas haben, wie aus dem Fenster lehnen kann das halt einmal bedeuten, sich tatsächlich im echten Sinne aus dem Fenster zu lehnen. Oder es kann bedeuten, irgendetwas zu sagen, was ein bisschen riskant ist. Was wir gemacht haben ist, das wir geguckt haben, sie ausgegangen sind von der Hypothese, das wenn es die wörtliche Bedeutung hat, das dann im Kontext anderer Worte stehen, die irgendwas mit Fenster zum Beispiel zu tun haben oder mit sich herauslehnen oder so zu tun haben. Und wir haben uns halt den Kontext angeguckt und haben geguckt, stehen da Worte im Kontext, die halt irgendwas mit dem Idiom örtlicher Bedeutung kalt, mit dem Ausdruck in wörtliche Bedeutung zu tun haben. Wenn das so war, sind wir davon ausgegangen, das ist jetzt hier wörtliche Bedeutung. Wenn das nicht so war, sind wir davon ausgegangen, das ist idiomatische Bedeutung."

    So ist also auch das leidige Problem mit den Redewendungen bereits weitgehend gelöst. Im Prinzip hält Uszkoreit den künstlichen Agenten für unbegrenzt lernfähig. Wahrscheinlich kann er bald an bestimmten Sprachmustern sogar den Wahrheitsgehalt einer Aussage erkennen.

    "Das nächste Mal lernt das System vielleicht, darüber wie Journalisten darüber schreiben als Gerücht, wenn eine Sängerin schwanger ist, ja, und wird das dann alle die Muster lernen. Aber natürlich so wie ein Kind ja auch früher in der Sprache mal alles lernen musste, bevor es erkennt, was gesagt wird, so muss natürlich unser System schrittweise immer mehr Muster lernen und kann nicht gleich alles wissen."