Mittwoch, 24. April 2024

Archiv

Schnell formuliert
Wie gut ist Roboterjournalismus?

In den Sportteilen, auf den Wirtschaftsseiten und bei den Wettermeldungen vieler Zeitungen erscheinen immer mehr Texte, die nicht von Journalisten, sondern von einer Software geschrieben wurden. Doch den automatisch generierten Texten fehlen immer noch wesentliche Eigenschaften, die gut geschriebene Geschichten gewöhnlich haben.

Von Piotr Heller, Moderation: Manfred Kloiber | 03.06.2017
    Arbeit mit Algorithmen am Computer
    Algorithmen können mittlerweile ganze Artikel über Fußballspiele oder Aktienkurse schreiben. (picture alliance / dpa / Lukas Schulze)
    In der Berliner Zentrale der Firma Retresco scrollt sich Sebastian Golly durch Fußballspiele.

    "Das sind die Daten zu einem Fußballspiel. Da haben wir ein paar Informationen zur Liga. Wir haben Daten zu den Teams. Ganz viele Tabelleninformationen. Und wir haben die Informationen zum Spiel selbst: Welche Karten gab es und in welcher Minute. Welche Tore sind gefallen? Daten zu Torchancen mit einer Einstufung: War das eher eine knappe Chance oder eine wichtige? Das ist in der Größenordnung von 20.000 Datenpunkten, die für ein Spiel gezogen werden." Analysen in Sekundenschnelle Die Informationen stammen von Anbietern für Fußball-Statistiken. In den oberen Ligen sind sie sehr detailliert. Aber auch für alle unteren Ligen in Deutschland gibt es zumindest die Ergebnisse sofort nach Abpfiff. Daraus kann das "textengine" genannte System von Retresco Texte generieren.

    "Ich habe für eine Hamburger Amateurliga ein paar Spieltage rausgegriffen und lasse dazu einfach mal Texte generieren. Jetzt sieht man, dass hier im Sekundentakt Vorberichte rauspurzeln."

    Im Hintergrund analysiert das System in Sekundenschnelle die Daten zur Oberliga Hamburg, fasst sie zu Aussagen zusammen, findet Formulierungen dafür und fügt sie zu Sätzen zusammen.

    "Da muss ich sagen, dass wir einen sehr pragmatischen Ansatz verfolgen. Dieses System hat große Bausteine, aus denen es die Texte aufbaut. Es geht ein bisschen über so einen ganz primitiven Lückentext Ansatz hinaus, aber es ist im Prinzip schon so, dass das System nicht von Grund auf ganz Sätze formuliert." Das System beherrscht mittlerweile etwa 6.000 Formulierungen Diese Textbausteine muss es mit Formulierungen füllen und dafür das nötige Fußball-Vokabular beherrschen.

    "Wir zeigen dem System Formulierungen und definieren: Unter welchen Bedingungen sind diese Formulierungen angemessen? Ein typisches Beispiel: "Der Spieler hämmerte den Ball zwischen die Pfosten." Da merkt man schon: Wir haben versucht, ein bisschen Emotion in die Sprache zu bringen. Und da müssen wir sagen: Diese Formulierung kann nicht für jedes Tor verwendet werden."

    Sondern nur für einen kräftigen Schuss, etwa aus der Distanz. Um die 6.000 solcher Formulierungen beherrscht das System mittlerweile. Retresco beauftragt Experten aus den jeweiligen damit, dem System Formulierengen einzuprogrammieren. Mittlerweile kann es nicht nur über Fußballdaten sondern etwa auch über Börsendaten, Wetterdaten oder Daten aus Online-Shops schreiben. Dabei bleibt es immer sehr nah an dieser Datenbasis.

    "Die Datenquellen, die wir haben, beinhalten einen gewissen Ausschnitt aus der Welt. Gerade im Börsenbereich spielen viele Fakten mit rein, die nicht in diesen Daten enthalten sind. Nicht nur wirtschaftliche Entwicklungen, auch politische Entwicklungen sind da dabei. Um man kommt da schnell in einen Bereich, wo man Aussagen trifft, die man auf Grundlage dieser Datengrundlage nicht mit Sicherheit treffen kann. Deswegen: Der momentane Stand der Dinge ist, dass wir deskriptive Texte schreiben. Texte, die den Stand der Welt beschreiben und relativ neutral beschreiben." Wenn Redakteure der Maschine auf die Finger schauen Wie gut sind die Texte aus der Maschine? Retresco hat uns Texte zu Fußballspielen und zum Aktienmarkt generiert. Die haben wir dann erfahrenen Journalisten vorgelegt: Dem Leiter unserer Wirtschaftsredaktion im Deutschlandfunk – Klemens Kindermann. Und Astrid Rawohl – der Leiterin vom Sport hier im Haus.
    Wir haben die beiden gefragt, was ihnen an den Maschinentexten aufgefallen ist und was sie daran aus journalistischer Perspektive kritisieren. Den Anfang macht Klemens Kindermann mit einer Meldung zur Aktie eines Maschinenbauunternehmens.
    Die Wirtschaftsredaktion
    "SLM-Solutions-Group-Aktie verliert weiterhin. Die SLM-Solutions-Group-Aktie sank weiterhin und musste gestern erneut Verluste machen."

    Klemens Kindermann: "Würde kein normaler Wirtschaftsjournalist so formulieren. Die arme Aktie! Sie musste Verluste machen. Eigentlich müsste man journalistisch sagen: Die Aktie ist gesunken, aus dem und dem Grund. Wir haben weitere Sätze hier in der Meldung. Die heißen:"

    "Intraday bewegte sich die Aktie von SLM Solutions Group am Dienstag im Bereich zwischen 38 € und 38,95€."

    Klemens Kindermann: "Das sind charttechnische Fachausdrücke. Intraday, das würde keiner so formulieren. Manchmal stellt sich der Algorithmus auch selber ein Bein, wenn er sagt:

    "Im großen Ganzen war der Dienstag ein positiver Handelstag für die Handelspapiere aus der Maschinenbaubranche."

    Klemens Kindermann: "Man merkt dem Text an, dass er für die Aktie immer andere Wörter aussucht. Manchmal mischt er die so, dass es dann Wiederholungen gibt. Wir haben hier einen anderen Text zur Deutschen Bank Aktie."

    "Die Deutsche-Bank-Aktie sank weiterhin und musste gestern erneut Verluste machen. Zum DAX-Ende am Dienstag notierte der Anteilschein des Finanzunternehmens mit einem Kurs von 17,34 €."

    Klemens Kindermann: "Ich habe auch noch nie gehört, dass man die Deutsche Bank als Finanzunternehmen bezeichnet, das ist eine Sprache, die nicht dem entspricht, wie wir als Journalisten das darstellen. Dann schaut das Programm auch noch auf die internationale Konkurrenz:

    "Auch die internationale Konkurrenz schwächelt. Bei US-Bancorp gab es am Dienstag keinen Anlass zur Freude."

    Klemens Kindermann: "Und hier wird die Deutsche Bank verglichen mit US-Bancorp, das ist eine Bank aus Minneapolis. Auch das würde ich als vernünftiger Wirtschaftsjournalist nicht machen, das ist nicht die Konkurrenz der Deutschen Bank. Also insofern: Hier fehlt eigentlich jedes Hintergrundwissen."
    Die Sportredaktion
    Jetzt schauen wir noch auf eine Meldung aus dem Fußball. Der hat sich die Leiterin der Sportredaktion im Haus angenommen – Astrid Rawohl.

    "Dortmund lässt nichts anbrennen. 1899 Hoffenheim kehrte vom Auswärtsspiel gegen Borussia Dortmund mit leeren Händen zurück."

    Astrid Rawohl: "Kann man machen, aber wenn man eine Nachricht für Sportsendungen haben möchte, dann sollte man klar im ersten Satz sagen: Worum geht es, was ist passiert? Und nicht schon mit einer Wendung daherkommen, dass man mit leeren Händen zurückgeht."

    "Am Ende hieß es 1 zu 2."

    Astrid Rawohl: "Lieblos formuliert. Statisch. Nicht in Zusammenhang gestellt."

    "In einem Spiel zweier formal gleich starker Gegner machte am Ende lediglich ein Tor den Unterschied aus."

    Astrid Rawohl: "Es gab ein Tor Unterschied. Das hat jeder mitbekommen. Das ist eine Information, die total überflüssig ist und da nicht hingehört. Weshalb ich das so heftig kritisiere ist, dass man im Hinterkopf haben muss, dass in diesem Spiel Dortmund deswegen nur auf die Siegstraße kam, weil das 1:0 als Abseitstor von Marco Reus fiel. Eine schwere Fehlentscheidung des Schiedsrichters. Das wird mit keinem Wort erwähnt das gehört für mich sogar in den Leadsatz. Der Leadsatz hätte beispielsweise sein müssen: Abseitstor bringt Dortmund auf die Siegstraße. Dann geht es weiter:

    "Dortmund erwischte einen Blitzstart ins Spiel. Marco Reus traf in der vierten Minute zur frühen Führung, nach einer Vorlage von Gonzalo Castro."

    Astrid Rawohl: "Ja, das ist genau der Punkt. Das Tor fiel früh, ich glaube in der 4. Minute. Aber dass das ein sehr umstrittenes Tor war, das erfahre ich dem ganzen kompletten Bericht nicht. Damit riskiert jedes Medium seine Glaubwürdigkeit."