Dienstag, 19. März 2024

Archiv


Ein Mammutprojekt und seine Herausforderungen

Unter dem Namen Deutsche Digitale Bibliothek sollen zahlreiche Dokumente aus Kultur und Wissenschaft kostenlos übers Internet bereitgestellt werden. Mehrfach wurde in dieser Sendung bereits über die Startschwierigkeiten dieses Projekts berichtet. Nun soll sich die Deutsche Nationalbibliothek – die gerade 100 Jahre alt geworden ist – der Sache annehmen.

Von Maximilian Schönherr | 06.10.2012
    Manfred Kloiber: Diese Woche feierte die Deutsche Nationalbibliothek ihren 100. Geburtstag. Und das Jubiläum ist sogar so feierlich, dass das Bundesfinanzministerium dazu eigens eine Gedenkmünze und eine Gedenkbriefmarke aufgelegt hat. Also auch für uns Grund genug, sich einmal anzusehen, wie die Nationalbibliothek zum Beispiel mit dem Internet umgeht, und welche Rolle dabei die Deutsche Digitale Bibliothek spielt. Wir haben ja mehrfach über deren Startschwierigkeiten gesprochen. Maximilian Schönherr, wie hängen denn Deutsche Nationalbibliothek und Deutsche Digitale Bibliothek überhaupt zusammen?

    Maximilian Schönherr: Die Deutsche Digitale Bibliothek soll Dokumente aus Kultur und Wissenschaft kostenlos übers Internet bereitstellen. Die Deutsche Nationalbibliothek ist ein Haus, wo diese Dokumente liegen. Und weil es große Startschwierigkeiten gab, hat sich nun die Deutsche Nationalbibliothek mit ihrer IT-Abteilung der Sache angenommen.

    Kloiber: Und wie der aktuelle Stand der Deutschen Digitalen Bibliothek aussieht, hat uns Ellen Euler erklärt. Sie leitet die Geschäftsstelle der Deutschen Digitalen Bibliothek, die wiederum bei der Stiftung Preußischer Kulturbesitz in Berlin angesiedelt ist.

    Beginn Beitrag:

    "Die Deutsche Digitale Bibliothek existiert als solche auch erst mit einer Projekt-Webseite, und die wird auch stark vernachlässigt. Wir hatten uns dazu entschieden, unsere Ressourcen und Kapazitäten zu konzentrieren auf den Beta-Launch."

    Die DDB wird Teil eines europäischen Archivgroßunternehmens sein, der Europeana. Deren Rechenzentrum steht in der Königlichen Bibliothek der Niederlande in Den Haag.

    Auch die Europeana hatte große Startschwierigkeiten, ist aber jetzt online. Sie bietet über ihr Internetportal Text-, Ton- und Bild-Dokumente aus allen Mitgliedsstaaten. Bei einer Recherche nach früher Automobilgeschichte findet man über die Europeana unter anderem bunte Firmenprospekte über Elektroautos aus den 1970er-Jahren oder diesen Song: Schorschel, kauf mir doch ein Automobil von 1909:

    Die Deutsche Digitale Bibliothek sollte als Alleinstellungsmerkmal die "semantische Suche" beinhalten, programmiert vom Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin. Semantische Suche bedeutet: Man stellt unscharfe Anfragen, das System versteht sie richtig und liefert dann nicht, wie eine normale Suchmaschine, besonders viele, sondern qualitativ hochwertige Ergebnisse. Damit das funktioniert, müssen alle beteiligten Archive und vielleicht auch die Wikipedia inhaltlich verknüpft sein.

    Laut dem IT-Chef der Deutschen Nationalbibliothek, Reinhard Altenhöner, sind diese Forschungen weit von einer praktischen Einführung entfernt.

    "Das Problem ist: Semantik sagt sich leicht, ist aber komplex. Ich muss all die Verknüpfungen manchmal auch erst bilden. Denn wenn eine Einrichtung sozusagen Jahrhundertelang die Dinge immer nur auf ihre eigene Sammlung hin beschrieben hat, und nicht auf irgendein Ortungssystem hin, oder auf irgendeine andere Information, die woanders liegt – dann muss ich mir viel einfallen lassen, damit ich diese Bezüge auch herstelle. Und das heißt, ich setze am Ende auch viel Maschinenpower ein, vor allem aber viel Intelligenz, die richtigen Regeln dafür zu finden. Und ganz ehrlich: Die Daten haben oft nicht die Qualität, um tiefe, semantische Analysen zu ermöglichen. Das ist die Realität. Deswegen haben wir da eine Aufgabe vor uns, die uns wahrscheinlich noch Dutzende von Jahren beschäftigt."

    Wenn die Deutsche Digitale Bibliothek Ende des Jahres tatsächlich in einer vorläufigen Version online geht, wird weder die semantische Suche enthalten sein, noch lassen sich dann Dokumente aus den angekündigten 30.000 angeschlossenen deutschen Archiven und Bibliotheken finden; es sind weit weniger. Dazu Ellen Euler, die Sprecherin der Deutschen Digitalen Bibliothek DDB:

    "Es ist nicht so, dass wir nicht schon viele Einrichtungen mit digitalen Angeboten haben, die in die DDB reinwollen. Aber auch das muss erst der Workflow geschaffen werden. Da sind wir jetzt dabei. Wir sind dabei, die Service-Zentren auszugestalten, und die werden eben diesen Service aus einer Hand für die Einrichtungen bieten, von der Registrierung bis zur Übergang der Daten in die DDB."


    Weiteres zum Thema:

    "Deutschlands kulturelles Gedächtnis auf dem Weg ins digitale Zeitalter" (Wissenschaft im Brennpunkt vom 29.4.12)