Die moderne Wissenschaft ist vor allem eins: ein Moloch, der immer größere Datenmengen frisst, um die komplexe Wirklichkeit um uns herum zu verstehen.
"”Wenn sie zurückblicken, wann jeweils haben wir wieder etwas vom Erdsystem verstanden und zwar so gut verstanden, dass man das eigene Handeln verändern konnte, dann war das fast nur, wenn neue Daten zusammengestellt worden sind","
sagt Klimapapst Hartmut Grassl, emeritierter Professor und Direktor des Max-Planck-Instituts für Meteorologie in Hamburg. Sein Institut betreibt eines der größten Datenzentren weltweit: Hier werden die Ergebnisse vieler wichtiger Klimamodellrechnungen archiviert. Michael Lautenschlager, Direktor des Weltdatenzentrums Klima:
"Zurzeit haben wir 290 Terabyte an Daten, Wachstum haben wir ungefähr 60 bis 100 Terabyte an Daten pro Jahr, da kann man sich ausrechnen, dass es da so lustig weiterläuft."
290 Terabyte, das ist ungefähr 250 Mal so viel wie die gesamte Weltjahresproduktion an wissenschaftlicher Literatur. Auf CD-Rom gebrannt ergäben die Daten einen Stapel von stattlichen 450 Metern Höhe. Und das ist nur der online verfügbare Teil der Daten. Schon heute nutzen Klimaforscher und Meteorologen aus aller Welt diesen Fundus – aber sie würden künftig gerne diese modellierten Daten mit Beobachtungsdaten von Satelliten vergleichen – und das schnell und bequem vom Rechner im eigenen Büro aus. Lautenschlager:
"Ich möchte sie auch gegeneinander vergleichen, ich möchte sie nicht nur runterladen, sondern ich möchte sie auch noch zwischendrin bearbeiten, um halt aus zwei Sachen einen Vergleich machen zu wollen. Zum Beispiel Beobachtungsdaten gegen Modelldaten."
Aber das geht derzeit noch nicht. Denn die Daten aus Klimamodellen und die gemessenen Satellitendaten lassen sich nicht einfach vergleichen. Der Grund: Jeder diese Datenberge für sich ist gut geordnet und standardisiert – aber es gibt keine gemeinsamen Standards. Dabei sind technische Fragen wie etwa Dateiformate noch am einfachsten zu lösen. Das größte Problem sei vor allem die Vielfalt der Daten, erklärt Michael Diepenbroek, Leiter des Weltdatenzentrums für marine Umweltdaten in Bremen:
"Es ist vielleicht nicht die Masse der Daten, aber die große Vielfalt der Daten, die in den Geowissenschaften gewonnen wird. Da redet man nicht nur von zehn oder 20 oder 100 Parametern, wenn es darum geht, jetzt biologische oder geologische Parameter zu erfassen, dann kommen Sie in die Zehntausende, Zehntausende verschiedene Messgrößen."
Diepenbroeks Datenzentrum beherbergt Sammlungen von unterschiedlichsten Informationen. Sie für Klimamodelle verfügbar zu machen, wäre ideal, denn das Leben hat einen gewaltigen Einfluss auf das System Erde. Aber die Daten der Biologen sind für einen Klimarechner absolut unverdaulich. Diepenbroek:
"Die ganze Biologie, das können Sie pauschal sagen, die ist mindestens noch zehn bis 20 Jahre weit davon entfernt, jetzt Standarddatensätze zu produzieren, die man im globalen Sinne wirklich benutzen könnte. Das sind eklektizistische Sammlungen von sehr unterschiedlichen Dingen, die Heterogenität ist ein echtes Problem."
Aber es wird angegangen. Eine Gruppe von inzwischen 69 Regierungen und der EU-Kommission wollen ein globales Erdbeobachtungssystem einrichten. Dort sollen alle Datensammlungen verfügbar sein. Diepenbroek:
"Die Erwartungshaltung der Nutzer ist schon so, dass man eben halt in alle diese Datenzentren wirklich reingehen kann und wirklich Daten bekommt in einer Form, die für sich selber nutzbar sind."
Ob dafür die Zeit von zehn Jahre reicht, die sich diese Geo genannte Gruppe gesetzt hat, bezweifeln die Datenspeicherexperten zwar. Doch der neue Schwung zum 50. Geburtstag der Weltdatenzentrenist sehr willkommen. Hartmut Grassl:
"Jetzt hat dieses offene und freie Zugänglichmachen von Daten in dieser Gruppe für Erdbeobachtung, die global eine Beobachtung der Erde des Gesamtsystems Erde anstrebt, wieder neuen Schwung bekommen und wir hoffen, dass die Weltdatenzentren von diesem Schwung etwas mitbekommen können."
"”Wenn sie zurückblicken, wann jeweils haben wir wieder etwas vom Erdsystem verstanden und zwar so gut verstanden, dass man das eigene Handeln verändern konnte, dann war das fast nur, wenn neue Daten zusammengestellt worden sind","
sagt Klimapapst Hartmut Grassl, emeritierter Professor und Direktor des Max-Planck-Instituts für Meteorologie in Hamburg. Sein Institut betreibt eines der größten Datenzentren weltweit: Hier werden die Ergebnisse vieler wichtiger Klimamodellrechnungen archiviert. Michael Lautenschlager, Direktor des Weltdatenzentrums Klima:
"Zurzeit haben wir 290 Terabyte an Daten, Wachstum haben wir ungefähr 60 bis 100 Terabyte an Daten pro Jahr, da kann man sich ausrechnen, dass es da so lustig weiterläuft."
290 Terabyte, das ist ungefähr 250 Mal so viel wie die gesamte Weltjahresproduktion an wissenschaftlicher Literatur. Auf CD-Rom gebrannt ergäben die Daten einen Stapel von stattlichen 450 Metern Höhe. Und das ist nur der online verfügbare Teil der Daten. Schon heute nutzen Klimaforscher und Meteorologen aus aller Welt diesen Fundus – aber sie würden künftig gerne diese modellierten Daten mit Beobachtungsdaten von Satelliten vergleichen – und das schnell und bequem vom Rechner im eigenen Büro aus. Lautenschlager:
"Ich möchte sie auch gegeneinander vergleichen, ich möchte sie nicht nur runterladen, sondern ich möchte sie auch noch zwischendrin bearbeiten, um halt aus zwei Sachen einen Vergleich machen zu wollen. Zum Beispiel Beobachtungsdaten gegen Modelldaten."
Aber das geht derzeit noch nicht. Denn die Daten aus Klimamodellen und die gemessenen Satellitendaten lassen sich nicht einfach vergleichen. Der Grund: Jeder diese Datenberge für sich ist gut geordnet und standardisiert – aber es gibt keine gemeinsamen Standards. Dabei sind technische Fragen wie etwa Dateiformate noch am einfachsten zu lösen. Das größte Problem sei vor allem die Vielfalt der Daten, erklärt Michael Diepenbroek, Leiter des Weltdatenzentrums für marine Umweltdaten in Bremen:
"Es ist vielleicht nicht die Masse der Daten, aber die große Vielfalt der Daten, die in den Geowissenschaften gewonnen wird. Da redet man nicht nur von zehn oder 20 oder 100 Parametern, wenn es darum geht, jetzt biologische oder geologische Parameter zu erfassen, dann kommen Sie in die Zehntausende, Zehntausende verschiedene Messgrößen."
Diepenbroeks Datenzentrum beherbergt Sammlungen von unterschiedlichsten Informationen. Sie für Klimamodelle verfügbar zu machen, wäre ideal, denn das Leben hat einen gewaltigen Einfluss auf das System Erde. Aber die Daten der Biologen sind für einen Klimarechner absolut unverdaulich. Diepenbroek:
"Die ganze Biologie, das können Sie pauschal sagen, die ist mindestens noch zehn bis 20 Jahre weit davon entfernt, jetzt Standarddatensätze zu produzieren, die man im globalen Sinne wirklich benutzen könnte. Das sind eklektizistische Sammlungen von sehr unterschiedlichen Dingen, die Heterogenität ist ein echtes Problem."
Aber es wird angegangen. Eine Gruppe von inzwischen 69 Regierungen und der EU-Kommission wollen ein globales Erdbeobachtungssystem einrichten. Dort sollen alle Datensammlungen verfügbar sein. Diepenbroek:
"Die Erwartungshaltung der Nutzer ist schon so, dass man eben halt in alle diese Datenzentren wirklich reingehen kann und wirklich Daten bekommt in einer Form, die für sich selber nutzbar sind."
Ob dafür die Zeit von zehn Jahre reicht, die sich diese Geo genannte Gruppe gesetzt hat, bezweifeln die Datenspeicherexperten zwar. Doch der neue Schwung zum 50. Geburtstag der Weltdatenzentrenist sehr willkommen. Hartmut Grassl:
"Jetzt hat dieses offene und freie Zugänglichmachen von Daten in dieser Gruppe für Erdbeobachtung, die global eine Beobachtung der Erde des Gesamtsystems Erde anstrebt, wieder neuen Schwung bekommen und wir hoffen, dass die Weltdatenzentren von diesem Schwung etwas mitbekommen können."