Donnerstag, 18. April 2024

Archiv


Mehr Struktur für Wikipedia

"Wikidata" heißt das jüngste Projekt der Wikimedia Foundation. Es soll das Wissen der Online-Enzyklopädie Wikipedia in einer zentralen Datenbank speichern. Bisher gab es nämlich das ernsthafte Problem, dass jede Sprachvariante der Wikipedia quasi ihr Eigenleben führte.

Von Keywan Tonekaboni | 04.05.2013
    "Dass es eine ganze Menge Daten über die Welt unter freier Lizenz für jeden verfügbar gibt, das ist ein unheimlicher Schatz, aus dem man schöpfen kann."

    Manfred Kloiber: Das meint Lydia Pintscher, sie ist verantwortlich für die Community-Kommunikation bei Wikidata, dem jüngsten Projekt der Wikimedia Foundation. Wikidata soll das Wissen der Wikipedia in einer zentralen Datenbank speichern. Über ein Jahr hat ein Team an dem Projekt gearbeitet, betreut vom deutschen Wikimedia-Ableger. Und seit vergangener Woche können die Einträge von Wikidata in allen Sprachvarianten der Wikipedia genutzt werden. Warum braucht die Online Enzyklopädie eine Datenbank, Keywan Tonekaboni?

    Keywan Tonekaboni: In der Wikipedia schlummern zwar sehr viele Informationen, sehr viel Wissen. Doch jede Sprachvariante führt ihr Eigenleben. Und dieses Problem gab es schon einmal in ähnlicher Form, nämlich mit den Multimedia-Inhalten wie Fotos, Grafiken oder Videos. Die waren auch mehrfach gespeichert, bis sie zentralisiert wurden im Medienarchiv Wikimedia Commons. Dort können sie jetzt genutzt werden in jeder Wikipedia-Variante. Bei Wikidata hat das Ganze aber eine andere Qualität, denn es geht um Inhalte, Fakten, vielleicht auch um Wahrheit. Und das ist komplexer als eine Mediathek.

    Beginn Beitrag:

    Wikipedia ist die größte Enzyklopädie die es je gab. Allein in der deutschsprachigen Fassung gibt es mehr als 1,5 Millionen Artikel - wobei die Qualität der einzelnen Beiträge schwankt. Dennoch, die Artikel zu wichtigen Themen sind aktuell und oft auch korrekt. Doch das meiste, was in der Wikipedia steht, ist unstrukturiert – zumindest aus informationstechnischer Sicht. Denn: Wird in der deutschsprachigen Wikipedia eine Angabe in einem Artikel ergänzt oder geändert, dann muss diese Information von Hand auch in der englischen Wikipedia angepasst werden. Und in der französischen - von der in Kisuaheli ganz zu schweigen.

    Mit Wikidata soll das fortan automatisch passieren. Denn Wikidata speichert solche Daten zentral für alle Wikipedien. Darin sieht Wikidata-Sprecherin Lydia Pintscher mehrere Vorteile für die gesamte Online-Enzyklopädie:

    "Zum einen: Kleinere Wikipedien haben mehr Daten zur Verfügung und können mehr Artikel daraus schreiben, weil einfach die Manpower, die sie haben, viel besser für das Schreiben der eigentlichen Artikel um diese Daten herum verwendet werden kann. Zum anderen hoffen wir, dass Wikipedia dadurch korrekter und aktueller wird, weil viel mehr Menschen an diesem Datensatz gemeinsam arbeiten können."

    Um das zu erreichen, unterscheidet sich Wikidata gänzlich von den bisherigen Wikipedia-Ablegern wie dem Wörterbuch Wiktionary oder Wikibooks. Keine Artikel mehr mit freiem Textfeld, um die Daten einzutragen - stattdessen gibt es ein Eingabeformular, wie bei einer Datenbank üblich. Doch statt wild Daten zu sammeln, hat sich das Wikidata-Team zunächst mit den Interwiki-Links beschäftigt. Sie verweisen von jedem Wikipedia-Artikel zu den anderen Sprachfassungen des Artikels. Diese Interwiki-Links sind ein Problem, denn auch sie mussten mühsam zwischen den knapp 300 Sprachfassungen der Wikipedia abgeglichen werden. Auch dafür gab es keine zentrale Infrastruktur. Diese Rolle erfüllt nun Wikidata.

    "Weshalb das für uns eine schöner Start ist. Etwas, was den Wikipedianern am Herzen liegt, dass das jemand löst. Und zum anderen gibt es uns einen Grunddatensatz an sogenannten Items. Ein Item ist in Wikipedia eine Seite, die ein bestimmtes Ding beschreibt, wie eben zum Beispiel den Eifelturm, oder die Simpsons. Und durch diese Interwiki-Links haben wir schon mal eine ganze Menge an diesen Items, zu denen man dann Daten hinzufügen kann."

    Diese Daten sind verschiedene Aussagen, auch Statements genannt. Beispiel Berlin: Hier ist das etwa die Angabe von Staat oder Wappen. Hinzu kommen Einordnungen, dass Berlin sowohl eine Stadt, eine Hauptstadt, ein Bundesland als auch Metropole ist. Und als Bürgermeister ist nicht Klaus Wowereit als Text eingetragen, sondern dessen Wikidata-Item verknüpft.

    Mit speziellen Befehlen können diese Daten dann abgefragt und direkt im Wikipedia-Artikel genutzt werden. Und im Bearbeitungsmodus taucht statt der Einwohnerzahl Berlins nur noch der entsprechende Abfragecode für Wikidata auf. Für komplexere Abfragen wird die Programmiersprache Lua unterstützt. Technisch ist das alles raffiniert, doch es wirkt auch sehr abstrakt und kompliziert. Auf langer Sicht sieht Lydia Pintscher das aber anders:

    "Es ist in der Tat aktuell noch ziemlich abstrakt, weil es einfach so ein junges Projekt ist und wir noch viel Arbeit auch in die Grundlagen stecken müssen. Aber es gibt eine ganze Menge Sachen, die dann in Zukunft auch sehr viel einfacher als es jetzt auf Wikipedia ist werden sollten."

    In vielen Artikeln beinhalten Infoboxen wichtige Fakten, aber deren Quelltext ist sehr unübersichtlich. Da sie am Anfang eines Artikels stehen, erschweren sie das Bearbeiten der Artikel unnötig. Ziel von Wikidata ist es, die Infoboxen mit wenigen Befehlen automatisch zu erzeugen. In der Bearbeiten-Ansicht würde der eigentliche Artikeltext dann präsenter erscheinen.

    Wikidata soll viele Probleme der Wikipedia lösen. Aber sie bringt auch neue mit sich. Daten gelten zwar als objektiv, sie sind es aber selten. Auch wenn die Wikipedia den Neutral Point of View, die neutrale Sichtweise, verlangt: Konflikte, selbst um scheinbar feststehende Zahlen und Daten, gibt es regelmäßig. Um diese Konflikte nicht in die Wikidata zu tragen, erlaubt die Datenbank auch widersprüchliche Angaben.