Freitag, 29. März 2024

Archiv


Geldmangel könnte zu Datenverlust führen

Technik. - 625 Regalmeter füllen die über neun Millionen Erhebungsbögen der Volkszählung von 1970 im Staatsarchiv von Baden-Württemberg in Ludwigsburg. Ihre digitale Auswertung passt auf drei CDs. Die sparen Platz, sind aber schwierig zu archivieren. Denn so, wie man papierene Dokumente zum Archivieren von Heftklammern befreien muss, damit sie nicht rosten und das Papier beschädigen, so muss man auch digitale Daten für das Archiv aufbereiten. Und da gibt es eine Menge Probleme.

Von Cajo Kutzbach | 30.08.2004
    Urbare sind alte Bücher, die seit dem 9. Jahrhundert die Besitztümer von Städten oder Fürsten enthalten. Dank diesen alten Akten wissen wir sehr viel über das damalige Leben. Sie sind, wenn man sich mit der damaligen Schrift auskennt, durchaus ohne Hilfsmittel lesbar. Trocken gelagert halten sie Jahrhunderte.

    Datenbanken und digitale Dokumente dagegen sind nur mit einem Gerät lesbar und halten nicht sehr lange. Als Pilotprojekt hat Dr. Christian Keitel im Staatsarchiv in Ludwigsburg die Datenbank der Volkszählung von 1970 archiviert. Dabei gab es einige Probleme:

    Als wir da vor drei Jahren angefragt haben, ob es denn noch digitale Unterlagen zur Volkszählung 1970 gäbe, hat man uns geantwortet: 'Ja, die gibt's noch auf Magnetbändern.' Wer hat heute noch Magnetbänder, wer hat noch 8-Zoll-, 5 1/4-Zoll-Disketten. Wer hat die ganzen alten Datenträger und kann sie noch lesen? Also baten wir das Statistische Landesamt diese Magnetbänder auf CDs zu brennen. Dann kam die nächste Frage: 'Ja haben sie denn unser Programm von damals, mit dem wir damals die Zeichen kodiert haben?'

    Die ersten zwei Stolpersteine der digitalen Archivierung sind erstens der Datenträger, beziehungsweise die geeigneten Lesegeräte und zweitens das Datenformat und die Software. Und drittens braucht man jemand, der sich mit beidem auskennt. Keitel:

    Schließlich gab es im Statistischen Landesamt noch genau einen Mitarbeiter aus dieser Zeit, der uns das alles machen konnte. Aber an diesem Punkt sieht man schon: Die Volkszählung war 1970. Wir haben jetzt 2004. Nach 34 Jahren ist es oft nicht mehr möglich, digitale Unterlagen so in derzeit gängige Formate zu bringen, dass sie noch lesbar und verstehbar sind.

    Digitale Daten bringen den Archivaren viel mehr in Zeitdruck als Papier. Damit die Daten auch in ferner Zukunft verwertbar sind, übertrug sie Christian Keitel in ein Datenformat, dass vermutlich noch lange von vielen Programmen verstanden wird.

    Außerdem dokumentierte er alle Arbeitsschritte, damit zukünftige Historiker wissen, was er mit den Daten gemacht hat. Es handelt sich bei diesen Dateien ja nicht mehr um eindeutig identifizierbare Originale, sondern um Kopien von Kopien. Im Fall der Volkszählungsdatenbank trennte Christian Keitel die endlosen Zahlenreihen mit Satzzeichen, dort, wo ein neues Datenfeld beginnt. Keitel:

    Das ist jetzt ein Format - Charakter Seperated Value - CSV-Format, das von den meisten heute gängigen Datenbankprogrammen wieder eingelesen werden kann. Aber es gibt dann eine größere Zahl an Problemen, die man zu lösen hat, zum Beispiel ob die Feldüberschriften noch in die Datei rein müssen, oder nicht.

    Trotz hilfreicher Software dauerte es zwei bis drei Monate, die drei CDs in dieses Format zu übertragen. Dann wurden die Daten dreimal auf CDs gebrannt. Dadurch soll ein Verlust der Daten verhindert werden, wenn eine CD kaputt geht. Da CDs nicht ewig halten, wird man sie alle fünf Jahre erneut kopieren.

    Dass es so aufwendig und teuer ist, digitale Daten lange zu speichern, hängt auch damit zusammen, dass bei der Einführung von Software nur die Sicht der Programmierer und Benutzer berücksichtigt wird:

    Die Sicht der langfristigen Erhaltung dieser Daten, die Sicht der Archive, die ist bisher noch nicht so weit Gemeingut, hat sich noch nicht so weit durchgesetzt, dass man jetzt sagen könnte, wir haben leichtes Spiel. Oft ist es ja so, dass bei Systemeinführung gar nicht dran gedacht wird, wie krieg ich Daten überhaupt raus, geschweige denn in Formaten, die zur Langzeit-Archivierung taugen.

    Dabei gibt es immer mehr digitale Daten zu Archivieren. Aber Umweltdatenbanken, elektronische Grundbücher oder Patientenakten, sowie das alle paar Jahre nötige Umkopieren, all das wird viel Arbeit und hohe Kosten verursachen, die noch niemand beziffern kann. Ob das durch die bessere Nutzbarkeit der Daten ausgeglichen wird ist offen. Historiker fürchten, dass bei digitalen Daten Geldmangel viel schneller zum Verlust historischer Dokumente führen könnte, als es heute bei schlechtem Papier der Fall ist.