Archiv


Scannen für die Ewigkeit

Das Hamburger Unternehmen CSS ist international erfolgreich bei der Digitalisierung von Bibliotheksbeständen. Die Bibliothek des US-Kongresses zum Beispiel arbeitet mit Hilfe von CCS daran, alle jemals in den USA erschienenen Zeitungen zu digitalisieren und der Öffentlichkeit zugänglich zu machen. Besonders prestigeträchtig ist allerdings ein Auftrag der British Library in London.

Von Werner Nording |
    Die British Library in London: Sie hat vor wenigen Tagen damit begonnen, ihre wertvollsten Bestände zu scannen und sie als PDF-Dateien in ihr Online-Angebot aufzunehmen. Das "Exeter Book" ist darunter, eine Anthologie altenglischer Dichtung, die um 1000 nach Christus entstand, eine reich verzierte Karte Irlands aus dem 18. Jahrhundert oder ein Poesiealbum von 1820 mit Gedichten, Zeichnungen und persönlichen Widmungen.

    Die kleine Hamburger Firma CCShat den Auftrag bekommen, die kostbaren Schriften in Bits und Bytes umzusetzen. CCS steht für Content Conversion Specialist. Weltweit sind die Hamburger einer der wenigen Spezialisten für das Umwandeln von einzigartigen Kulturschätzen in eine digitale Form. Und zwar so, dass die Inhalte vollständig erhalten bleiben.

    Zwei Jahre lang wird CCS 20 Millionen Seiten aus Beständen der British Library digitalisieren. Und das weitgehend vollautomatisch, betont Geschäftsführer Richard Helle. Doch das CCS-Verfahren kann weit mehr:

    "Unsere Technologie kann nicht nur ein Buch oder eine Zeitungsseite in einfachen Text umwandeln, sondern kann zusätzlich zu diesem Text auch wichtige Strukturinformationen erkennen. Das heißt im Fall einer Zeitungsseite zum Beispiel, dass nicht nur der reine Text erkannt wird, sondern dass man ganze Artikel identifizieren kann. In einem Buch kann man solche Strukturelemente wie Bilder oder auch Inhaltsverzeichnisse und einzelne Kapitel erkennen. Diese Strukturen werden benötigt, um gerade bei einer großen Informationsflut die richtige Navigation ansetzen zu können."

    Der gelernte Technikinformatiker und Kaufmann hat den Nischenmarkt der Digitalisierung von Bibliotheksbeständen für sein Unternehmen entdeckt. Hauptsächlich werden Bücher und Zeitungen für internationale Kunden bearbeitet. Die Bibliothek des US-Kongresses arbeitet mit Hilfe von CCS daran, alle jemals in den USA erschienenen Zeitungen zu digitalisieren und der Öffentlichkeit zugänglich zu machen. Aus Norwegen kam der Auftrag, die Nationalbibliothek mit den notwendigen Geräten und Programmen für die Digitalisierung von mehr als 172 Millionen Seiten auszurüsten. Alles, was in Norwegen jemals veröffentlicht wurde, soll erfasst werden. Es wird rund 15 Jahre dauern, alles zu scannen und zu digitalisieren. Ähnliche Aufträge haben Singapur und Neuseeland erteilt. Der Auftrag der British Library ist besonders prestigeträchtig, weil es sich in London um die größte Bibliothek der Welt handelt. Bezahlt wird das Ganze vom amerikanischen Software-Hersteller Microsoft, sagt CCS-Projektleiter Daniel Lanz.

    "Microsoft verwendet die digitalisierten Bücher, um sie in seinem Online-Portal bereitzustellen. Dabei hat Microsoft den Vorteil, dass sie Content generieren und dieser Content über MSN, über Microsofts Suchportal, verfügbar ist. Dadurch werden mehr Nutzer erreicht, das Interesse für die Nutzer ist höher, das ist Microsofts originäres Interesse an der Sache neben dem Kultursponsoring, was bei Microsoft auch eine große Rolle spielt."

    Neben Microsoft hat sich auch Google in diesem Bereich engagiert und ein Digitalisierungsprojekt bei der Bayrischen Staatsbibliothek in München angeschoben. 1000 Seiten schlagen mit etwa 100 Euro zu Buche, rechnet Claus Gravenhorst vor, der bei CCS für die Qualitätssicherung verantwortlich ist.

    "Also es sind ja Zahlen über das Google-Projekt bekannt geworden, das heißt, man liegt da heute so im Bereich der Massen-Digitalisierung, wenn wir so ein Projekt heranziehen im Bereich von zehn Euro-Cent pro digitalisierter Seite."

    Auch für die notorisch klammen Bibliotheken hat die Digitalisierung Vorteile: Werden Bücher und Zeitungen digitalisiert, sind sie nicht nur vor Bränden oder dem Papierzerfall geschützt. Auch der Zugriff auf die Medien wird erheblich erleichtert. Wissenschaftler oder auch einfache Leser können weltweit in den Bibliotheksbeständen recherchieren, in Büchern nach Stichworten oder in Zeitungen nach Artikeln suchen.

    Die Marklücke, in der sich CCS systematisch ausbreitet, bietet noch eine Menge Potenzial für das Unternehmen mit seinen 250 Mitarbeitern. Denn die Digitalisierung von Bibliotheken hat gerade erst begonnen, so Geschäftsführer Richard Helle.

    "Wir sind kurz vor dem Durchbruch. Wir haben gerade erst den Anfang dieser Entwicklung mitbekommen. Eine Google oder Microsoft oder Yahoo hat diesen Trend ins Rollen gebracht. Die Digitalisierung hat allerdings nur wenige Prozentpunkte des Bestandes abgedeckt, das heißt, wir schauen uns um, sehen Hunderte von Millionen Büchern, die noch zu digitalisieren sind. Erreicht haben wir im Augenblick nur wenige Millionen Bücher."

    Dementsprechend optimistisch schaut Helle, dessen CCS einer Holding aus Österreich gehört, in die Zukunft.

    "Das Wachstum ist vorprogrammiert. Wir haben im letzten Jahr ein Wachstum von 40 Prozent erreicht. Wir bewegen uns noch im mittleren einstelligen Millionenbereich, wir planen innerhalb von zwei Jahren, einen zweistelligen Millionenumsatz in Euro zu erzielen."