Archiv


Mehr Sinn im Netz

Internet. Semantik, die Lehre von Sinn und Bedeutung sprachlicher Einheiten, soll das Web erobern. Damit könnte sehr viel mehr Sinn etwa in Suchfunktionen gebracht werden, damit könnten aber viele Datensammlungen informativer gemacht werden. Auf der "Semantics" in Wien wurden Ansätze dazu diskutiert.

Von Pia Grund-Ludwig |
    Eine gute Idee, aber viel zu abstrakt: So urteilen viele über das Semantic Web. Das Konzept, das von Web-Erfinder Tim Berners-Lee entwickelt wurde, sieht vor, dass Daten und deren Beziehungen zueinander explizit beschrieben werden. Dadurch sollen Computer in der Lage sein, anhand dieser Beschreibungen Zusammenhänge zu erkennen. Bessere Wissenswerkzeuge sind das Ziel. Einzelne Firmen haben das in den vergangenen Jahren bereits getestet. Auf der "Semantics" in Wien haben sich diese Woche Entwickler getroffen, um Erfahrungen mit solchen Ansätzen auszutauschen und offene Probleme zu diskutieren. Dabei wurden neben Einsatzbeispielen aus der betrieblichen Praxis vor allem Projekte vorgestellt, die semantisches Web und Web 2.0 zusammenbringen. Zum Web 2.0 zählen unter anderem Wikis und Blogs. Blogs sind Kommunikationsforen, Wikis Sammlungen von Einträgen im Internet, die von den Benutzern nicht nur gelesen, sondern auch erstellt und verändert werden. Das wohl bekannteste Beispiel ist das Nachschlagewerk Wikipedia. Die Wikipedia ist bislang schon gut verschlagwortet und verlinkt. Semantische Beschreibungen würden diese Links wertvoller macht, ist Denny Vrandecic vom Institut für Angewandte Informatik und Formale Beschreibungsverfahren in Karlsruhe sicher:

    "Die semantischen Erweiterungen der Wikipedia würden es den Autoren ermöglichen, dass sie die Links zwischen Artikeln mit einem Typ versehen und so sagen, wie stehen die verschiedenen Artikel zueinander im Bezug. Wenn ich zum Beispiel den Artikel zu Berlin nehme oder zu Deutschland könnte man sagen, dass Berlin die Hauptstadt von Deutschland ist und diese Sachen halt explizit in den Artikel eintragen."

    Schaut man sich den Eintrag zu Berlin bei Wikipedia an, dann sieht man bereits eine Reihe von Links, die zu weiteren Informationen führen. Die könnten dann nicht mehr nur zu den Informationen führen, die die Betreiber selbst für notwendig halten. Die Benutzer könnten sich vielmehr die spontan und mit einer Anfrage die Informationen zusammenstellen, die sie haben wollen. Vrandecic:

    "Wenn ich heute zum Beispiel die Frage stellen möchte, was sind die zehn größten Städte in Deutschland mit einem weiblichen Oberbürgermeister, steht die Information prinzipiell in Wikipedia drin. Man kann sich durch alle Städte klicken und diese lesen und herausfinden, okay welche haben einen weiblichen Oberbürgermeister. Aber wenn man das alles formalisieren würde, wenn man die Kategorien benutzen könnte, könnte man diese Frage direkt an Wikipedia stellen und die Antwort bekommen."

    Dazu sind ist freilich Zusatzarbeit von Seiten der Betreiber notwendig, aber Vrandecic ist da ganz optimistisch. Schließlich wurde auch das Kategoriensystem in Wikipedia erst nach dem Start eingeführt. Außerdem könnte die semantische Beschreibung die Pflege der Daten erleichtern. Die Betreiber seien von der Idee begeistert, es bleibe noch abzuwarten, ob das System für die riesigen Datenmengen der Wikipedia skaliert und die hohe Zahl der Abfragen verkraftet. Bei der englischen Version sind dies immerhin 12.000 Anfragen pro Sekunde. Um das auszuprobieren, haben sich die Karlsruher eine Kopie der Daten der Wikipedia heruntergeladen. Wann und ob eine semantische Wikipedia wirklich ans Netz geht, mag Vrandecic freilich nicht zu versprechen. Bei den bisherigen Tests habe sich gezeigt, dass der Teufel im Detail stecke. Das mache Vorhersagen schwierig.
    Nicht nur Wikis, auch Blogs, die Kommunikationsforen im Internet könnten durch Semantik gewinnen, so Steve Cayser, der in den Forschungslabors von HP im englischen Bristol sitzt:

    "”Die Idee von semantischen Blogs ist, dass man Zusatzinformationen zur Verfügung stellen kann. Wenn ich zum Beispiel über ein Musikstücke blogge oder über den Auftritt eines Musikers kann ich andere Informationen dazufügen. Zum Beispiel zu anderen Alben des Musikers oder zu seinen Konzerten in den nächsten Monaten, oder auch nur zu den Konzerten, die in meiner Nähe stattfinden.""

    Das Prinzip ist also das gleiche wie bei der Wikipedia: Die Informationen sollen angereichert und mit anderen kombinierbar werden. Die Krux ist ebenfalls die Beschreibung, die natürlich einen zusätzlichen Aufwand bedeutet. Hier setzt Cayser auf standardisierte Mikroformate, etwa für Kalendereinträge oder Visitenkarten. Auch Portale wie Amazon stellen beschriebene Daten zur Verfügung, die genutzt werden können. Doch Cayser sieht nicht nur Anwendungen, die sich an Endkunden richten. Gedacht sind seine Ideen auch für Software für Unternehmen, die Daten aus unterschiedlichen Anwendungen zusammenbringen soll. Cayser:

    "”Wir wollen diese Produkte mit Semantik versehen und hoffen, dies in den nächsten drei bis fünf Jahren zu realisieren.""