Freitag, 01. Juli 2022

Archiv


Weniger ist mehr

Am Dienstagabend ist die Global CEO Studie der IBM weltweit vorgestellt worden. 1100 Unternehmenslenker aus allen Kontinenten der Erde wurde dazu befragt, wie das Unternehmen der Zukunft aussehen wird. Die steigenden Datenmengen bereiten den Entscheidern offenbar Kopfzerbrechen.

Manfred Kloiber im Gespräch mit Peter Welchering | 10.05.2008

Manfred Kloiber: Wie sehen denn die Ansprüche an die Informationsverarbeitung konkret aus, Peter Welchering?

Peter Welchering: Diese Anforderungen an die Informationsverarbeitung der Unternehmen lassen sich für die Praxis am ehesten in drei Bereiche unterteilen. Zum einen haben die Analysten da herausgefunden, dass sich das Datenvolumen in einem normalen Unternehmen bis zum Jahre 2010 alle elf Stunden verdoppelt. Das ist natürlich der helle Wahnsinn: Alle elf Stunden eine Verdopplung des Datenvolumens in den Unternehmen. Wir haben auch bei den Analysten der Studie extra noch einmal nachgefragt, ob die nicht vielleicht alle elf Monate meinten und sich da verschrieben haben. Nein, alle elf Stunden verdoppelt sich der Datenbestand. Mit einem so extrem schnellen Datenwachstum hat eigentlich niemand gerechnet. Zweiter Bereich: Diese Datenmengen sind weitgehend unstrukturiert, und in ihrem Aufbau werden sie immer komplexer. Wir haben es hier also eben gerade nicht mit strukturierten Datenbankinformationen zu tun, sondern mit Rohdaten, das heißt, mit Web-Seiten, mit E-Mails, mit Aktennotizen, mit Dokumenten aller Art, die inhaltlich überhaupt nicht erschlossen sind und dabei auch noch auf andere Daten verweisen, also komplex sind, nur für sich betrachtet gar nicht richtig eingeordnet und verstanden werden können. Drittens sind alle diese Daten in technischen Silos eingeschlossen. Und diese technischen Silos sind voller Daten, und sie dienen jeweils als Datenspeicher für isolierte Anwendungen. Will ein Unternehmen zum Beispiel seine Raumkosten mit einem betriebswirtschaftlichen Programm berechnen, muss es dafür auf Informationen aus den Vertragsdokumenten zurückgreifen, beispielsweise über Servicepauschalen, automatisch steigenden Mietzins usw. Diese Informationen liegen aber nicht im Silo "Kosten", sondern im Datensilo "Verträge", müssen also aus dem Datensilo "Verträge" herausgeholt werden, für die betriebswirtschaftliche Anwendung eventuell sogar umformatiert werden. Und sie werden extra noch einmal gespeichert. Denn dummerweise können die Anwendungen untereinander häufig gar nicht miteinander kommunizieren. Die Konsequenz: Die Daten können nicht flexibel genutzt werden, häufig sind sie gleich mehrfach für unterschiedliche Anwendungen vorhanden. Und es gibt keine unternehmensweite einheitliche Übersicht über die Daten.

Kloiber: Das klingt ja nach Daten-Chaos. Waren die Unternehmen da vor zehn Jahren nicht schon viel weiter?

Welchering: Da waren die Unternehmen tatsächlich schon viel weiter. Aber dann ist etwas ganz Schreckliches passiert, was sich auch auf die Unternehmen der Zukunft auswirkt: Die Datensammelwut hat zugenommen. Und zwar nicht nur die staatliche Datensammelwut, die vom gläsernen Bürger träumt, sondern die Datensammelwut der Unternehmen, die vom gläsernen Kunden träumen. Und das war kontraproduktiv. Mit dieser Sammelwut hat nämlich das strategische Informationsmanagement nicht mehr Schritt halten können. Da muss nachgearbeitet werden. Die Daten müssen raus aus den Silos der isolierten Anwendungen, und sie müssen erschlossen und intelligent verknüpft werden.

Kloiber: Das hört sich aber nicht besonders neu an. Haben wir das nicht vor 15 Jahren auch schon diskutiert?

Welchering: Die Forderung ist alt, die Umsetzung passierte immer nur teilweise. Und dabei wurde von den großen Managementstrategen in den vergangenen Jahren dummerweise die rein semantische Aufarbeitung teilweise vergessen. Deshalb plädiert Udo Hertz, der die Informationsmanagement-Entwicklung im Forschungslabor der IBM in Böblingen leitet, auch für einen ganz grundlegenden Ansatz bei der Datenerschließung.

"Das muss man sich so vorstellen, dass wir in Texten nach Worten suchen und Worte erkennen, dass wir erkennen können, ob es sich um Begriffe handelt, Personen oder Automarken. Und dann können wir aus Texten wesentliche Begriffe heraus kristallisieren und diese dann in strukturierter Form zur Verfügung stellen."

Welchering: Hier lässt sich also eine Art Renaissance der semantischen Erschließung feststellen. Die Analyse einzelner Dokumente reicht aber noch nicht, sondern eine Verknüpfung muss her.

Kloiber: Für solch eine Verknüpfung braucht das Unternehmen aber einheitliche Standards. Wie sieht es da aus?

Welchering: Da gibt es erste Ansätze im Open-Source-Bereich. Hier wird mit so genannten Annotatoren gearbeitet. Die analysieren den Text automatisch und legen aber auch fest, welche Zusatzinformationen aus anderen Dateien und Dokumenten benötigt werden. Wenn ich beispielsweise eine betriebswirtschaftliche Auswertung über Lohnkosten habe, dann brauche ich eine Verknüpfung zu den Arbeitsverträgen, um diese Lohnkosten bewerten zu können. Und an einer solchen Verknüpfungsarchitektur wird auf Open-Source-Basis gearbeitet. Gleichwohl setzt diese Verknüpfungsarchitektur noch etwas ganz Wichtiges voraus. Die Systeme dürfen Daten nämlich nicht nur sammeln, sie müssen Daten auch strukturiert wieder vergessen können, weil sie sonst bei einer Verdopplung des Datenvolumens alle elf Stunden vollkommen überlastet sind. Da entsteht im strategischen Informationsmanagement ein ganz wichtiger neuer Bereich: Wie organisiere ich dieses strukturierte Vergessen. Da steht die Forschung noch sehr am Anfang. Da stellt sich etwa die spannende Frage, auf welche Wie bestimmte Rohdaten gelöscht werden müssen, damit die daraus gewonnenen Trenddaten weiter verarbeitet werden können, ohne dass diese Trenddaten wieder auf die Struktur der ursprünglichen Rohdaten zurückwirken.