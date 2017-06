In der Berliner Zentrale der Firma Retresco scrollt sich Sebastian Golly durch Fußballspiele.



"Das sind die Daten zu einem Fußballspiel. Da haben wir ein paar Informationen zur Liga. Wir haben Daten zu den Teams. Ganz viele Tabelleninformationen. Und wir haben die Informationen zum Spiel selbst: Welche Karten gab es und in welcher Minute. Welche Tore sind gefallen? Daten zu Torchancen mit einer Einstufung: War das eher eine knappe Chance oder eine wichtige? Das ist in der Größenordnung von 20.000 Datenpunkten, die für ein Spiel gezogen werden." Das System analysiert in Sekundenschnelle Die Informationen stammen von Anbietern für Fußball-Statistiken. In den oberen Ligen sind sie sehr detailliert. Aber auch für alle unteren Ligen in Deutschland gibt es zumindest die Ergebnisse sofort nach Abpfiff. Daraus kann das "textengine" genannte System von Retresco Texte generieren.



"Ich habe für eine Hamburger Amateurliga ein paar Spieltage rausgegriffen und lasse dazu einfach mal Texte generieren. Jetzt sieht man, dass hier im Sekundentakt Vorberichte rauspurzeln."



Im Hintergrund analysiert das System in Sekundenschnelle die Daten zur Oberliga Hamburg, fasst sie zu Aussagen zusammen, findet Formulierungen dafür und fügt sie zu Sätzen zusammen.



"Da muss ich sagen, dass wir einen sehr pragmatischen Ansatz verfolgen. Dieses System hat große Bausteine, aus denen es die Texte aufbaut. Es geht ein bisschen über so einen ganz primitiven Lückentext Ansatz hinaus, aber es ist im Prinzip schon so, dass das System nicht von Grund auf ganz Sätze formuliert." Das System beherrscht mittlerweile etwa 6.000 Formulierungen Diese Textbausteine muss es mit Formulierungen füllen und dafür das nötige Fußball-Vokabular beherrschen.



"Wir zeigen dem System Formulierungen und definieren: Unter welchen Bedingungen sind diese Formulierungen angemessen? Ein typisches Beispiel: "Der Spieler hämmerten den Ball zwischen die Pfosten." Da merkt man schon: Wir haben versucht, ein bisschen Emotion in die Sprache zu bringen. Und da müssen wir sagen: Diese Formulierung kann nicht für jedes Tor verwendet werden."



Sondern nur für einen kräftigen Schuss, etwa aus der Distanz. Um die 6.000 solcher Formulierungen beherrscht das System mittlerweile. Retresco beauftragt Experten aus den jeweiligen damit, dem System Formulierengen einzuprogrammieren. Mittlerweile kann es nicht nur über Fußballdaten sondern etwa auch über Börsendaten, Wetterdaten oder Daten aus Online-Shops schreiben. Dabei bleibt es immer sehr nah an dieser Datenbasis.



"Die Datenquellen, die wir haben, beinhalten einen gewissen Ausschnitt aus der Welt. Gerade im Börsenbereich spielen viele Fakten mit rein, die nicht in diesen Daten enthalten sind. Nicht nur wirtschaftliche Entwicklungen, auch politische Entwicklungen sind da dabei. Um man kommt da schnell in einen Bereich, wo man aussagen trifft, die man auf Grundlage dieser Datengrundlage nicht mit Sicherheit treffen kann. Deswegen: Der momentane Stand der Dinge ist, dass wir deskriptive Texte schreiben. Texte, die den Stand der Welt beschreiben und relativ neutral beschreiben." Wenn Redakteure der Maschine auf die Finger schauen Wie gut sind die Texte aus der Maschine? Retresco hat uns Texte zu Fußballspielen und zum Aktienmarkt generiert. Die haben wir dann erfahrenen Journalisten vorgelegt: Dem Leiter unserer Wirtschaftsredaktion im Deutschlandfunk – Klemens Kindermann. Und Astrid Rawohl – der Leiterin vom Sport hier im Haus.

Wir haben die beiden gefragt, was ihnen an den Maschinentexten aufgefallen ist und was sie daran aus journalistischer Perspektive kritisieren. Den Anfang macht Klemens Kindermann mit einer Meldung zur Aktie eines Maschinenbauunternehmens.

Die Wirtschaftsredaktion

"SLM-Solutions-Group-Aktie verliert weiterhin. Die SLM-Solutions-Group-Aktie sank weiterhin und musste gestern erneut Verluste machen."



Klemens Kindermann: "Würde kein normaler Wirtschaftsjournalist so formulieren. Die arme Aktie! Sie musste Verluste machen. Eigentlich müsste man journalistisch sagen: Die Aktie ist gesunken, aus dem und dem Grund. Wir haben weitere Sätze hier in der Meldung. Die heißen:"



"Intraday bewegte sich die Aktie von SLM Solutions Group am Dienstag im Bereich zwischen 38 € und 38,95€."



Klemens Kindermann: "Das sind charttechnische Fachausdrücke. Intraday, das würde keiner so formulieren. Manchmal stellt sich der Algorithmus auch selber ein Bein, wenn er sagt:



"Im großen Ganzen war der Dienstag ein positiver Handelstag für die Handelspapiere aus der Maschinenbaubranche."



Klemens Kindermann: "Man merkt dem Text an, dass er für die Aktie immer andere Wörter aussucht. Manchmal mischt er die so, dass es dann Wiederholungen gibt. Wir haben hier einen anderen Text zur Deutschen Bank Aktie."



"Die Deutsche-Bank-Aktie sank weiterhin und musste gestern erneut Verluste machen. Zum DAX-Ende am Dienstag notierte der Anteilschein des Finanzunternehmens mit einem Kurs von 17,34 €."



Klemens Kindermann: "Ich habe auch noch nie gehört, dass man die Deutsche Bank als Finanzunternehmen bezeichnet, das ist eine Sprache, die nicht dem entspricht, wie wir als Journalisten das darstellen. Dann schaut das Programm auch noch auf die internationale Konkurrenz:



"Auch die internationale Konkurrenz schwächelt. Bei US-Bancorp gab es am Dienstag keinen Anlass zur Freude."



Klemens Kindermann: "Und hier wird die Deutsche Bank verglichen mit US-Bancorp, das ist eine Bank aus Minneapolis. Auch das würde ich als vernünftiger Wirtschaftsjournalist, das ist nicht die Konkurrenz der Deutschen Bank. Also insofern: Hier fehlt eigentlich jedes Hintergrundwissen."

Die Sportredaktion