"My-Life-Bits" nennt sich das Projekt, das alle Dokumente aus Gordon Bells Leben digitalisieren will, seine Bücher, seine Notizen, wichtige Besprechungen, die Musik, die er hört, seine Urlaubsfotos und Videoaufzeichnungen seiner Vorlesungen. Doch die Spielerei, die vom Microsoft Bay Area Research Center unterstützt wird, hat auch nützliche Gründe: Die Wissenschaftler und Programmierer des Software-Konzerns wollen herausfinden, welche prinzipiellen Probleme ein derartig voluminöses Tera-Archiv mit sich bringt und wie sie gelöst werden können. Gelingt das Experiment, könnte daraus möglicherweise eine entsprechende Archivierungssoftware für Jedermann resultieren. "Zweck des Vorhabens ist es herauszufinden, welchen Nutzen es bringen kann, wenn man alles, was einem zu Gesicht oder zu Ohren kommt, archiviert und man es sich später wieder vergegenwärtigen kann", meint Gordon Bell selbst über sein "My-Life-Bits-Projekt".
Bei Videoaufnahmen von elf Stunden am Tag und mit einer Auflösung von rund 200 Kilobit pro Sekunde - etwa in der Qualität gängiger Internet-Clips – ergeben sich für die Bilder und Töne eines ganzen Menschenlebens rund 100 Terabyte an Speicher. Weitere erhellende Dateien in Audio-, Bild- und Textformaten können angesichts dieser Größe vernachlässigt werden. Hinzu kämen noch die Software-Kosten und der Arbeitsaufwand für die Datenerfassung, die gegenwärtig bei 10.000 US-Dollar für ein Jahr liegen, schätzt Gordon Bell. Doch in 20 Jahren könnten die Kosten auf 100 Dollar für ein digitales Lebensjahr sinken.
Doch die dabei entstehenden Probleme sind so alt wie die Archivierung selbst, denn die Daten müssten in Formaten abgelegt werden, die die Programme und Maschinen unbefristet überdauern, auf denen sie erstellt wurden. Diese "goldenen Formate", wie der Computer-Pionier sie nennt, müssten möglichst einfach und weit verbreitet sein: "JPEG-Bilder können vermutlich noch in 100 Jahren betrachtet werden. Dasselbe gilt für TIF-Bilder oder PDF-Dokumente. Angesichts der Internetentwicklung bin ich auch zuversichtlich, dass auch HTML und seine Nachfolger dann noch lesbar sein werden." Spezial-Formate, etwa von Finanzsoftware oder herkömmllichen Textverarbeitungsprogrammen, eignen sich hingegen nicht für ein Langzeitarchiv, bereitet dabei doch bereits ein Versionswechsel mitunter Probleme bei der Datenverfügbarkeit.
Doch das Hauptproblem sei ein anderes, meint Bell, denn schließlich muss der Betrachter seinen Weg durch einen unvorstellbaren Datenwust finden: "Die Organisation und Indizierung auf den höheren Ebenen muss so angelegt sein, dass ich auch mit unscharfen Begriffen nach etwas fragen kann und nicht nach exakt den Wörtern suchen muss, die seinerzeit bei der Beschreibung des Archiv-Files verwendet wurden." Auch an der automatischen Garbage-Collection arbeiten die Forscher: Welche Dateien, die der Anwender aktuell im Gebrauch hat, sollen anschließend gelöscht, welche archiviert werden?
Geld und Aktien sind die einzigen Papiere, die Gordon Bell behalten möchte. Alles andere will er künftig nur noch in digitaler Form aufbewahren. Höchstens zum Lesen werde er dann noch das eine oder andere ausdrucken.
Bei Videoaufnahmen von elf Stunden am Tag und mit einer Auflösung von rund 200 Kilobit pro Sekunde - etwa in der Qualität gängiger Internet-Clips – ergeben sich für die Bilder und Töne eines ganzen Menschenlebens rund 100 Terabyte an Speicher. Weitere erhellende Dateien in Audio-, Bild- und Textformaten können angesichts dieser Größe vernachlässigt werden. Hinzu kämen noch die Software-Kosten und der Arbeitsaufwand für die Datenerfassung, die gegenwärtig bei 10.000 US-Dollar für ein Jahr liegen, schätzt Gordon Bell. Doch in 20 Jahren könnten die Kosten auf 100 Dollar für ein digitales Lebensjahr sinken.
Doch die dabei entstehenden Probleme sind so alt wie die Archivierung selbst, denn die Daten müssten in Formaten abgelegt werden, die die Programme und Maschinen unbefristet überdauern, auf denen sie erstellt wurden. Diese "goldenen Formate", wie der Computer-Pionier sie nennt, müssten möglichst einfach und weit verbreitet sein: "JPEG-Bilder können vermutlich noch in 100 Jahren betrachtet werden. Dasselbe gilt für TIF-Bilder oder PDF-Dokumente. Angesichts der Internetentwicklung bin ich auch zuversichtlich, dass auch HTML und seine Nachfolger dann noch lesbar sein werden." Spezial-Formate, etwa von Finanzsoftware oder herkömmllichen Textverarbeitungsprogrammen, eignen sich hingegen nicht für ein Langzeitarchiv, bereitet dabei doch bereits ein Versionswechsel mitunter Probleme bei der Datenverfügbarkeit.
Doch das Hauptproblem sei ein anderes, meint Bell, denn schließlich muss der Betrachter seinen Weg durch einen unvorstellbaren Datenwust finden: "Die Organisation und Indizierung auf den höheren Ebenen muss so angelegt sein, dass ich auch mit unscharfen Begriffen nach etwas fragen kann und nicht nach exakt den Wörtern suchen muss, die seinerzeit bei der Beschreibung des Archiv-Files verwendet wurden." Auch an der automatischen Garbage-Collection arbeiten die Forscher: Welche Dateien, die der Anwender aktuell im Gebrauch hat, sollen anschließend gelöscht, welche archiviert werden?
Geld und Aktien sind die einzigen Papiere, die Gordon Bell behalten möchte. Alles andere will er künftig nur noch in digitaler Form aufbewahren. Höchstens zum Lesen werde er dann noch das eine oder andere ausdrucken.