Dienstag, 23. April 2024

Archiv


Schnipsel-Jagd

Technologie.- Über 15.000 Säcke mit Papierschnipseln – das ist eine der Hinterlassenschaften des ehemaligen DDR-Ministeriums für Staatssicherheit. Angerichtet wurde diese Zerstörung von Stasi-Mitarbeitern zur Wendezeit. Ein Forschungsprojekt am Berliner Fraunhofer Institut für Produktionsanlagen und Konstruktionstechnik möchte die Rekonstruktion der Akten virtuell beschleunigen.

Von Anja Paumen | 13.04.2010
    Ein Zweiraum-Büro im Institut an der Berliner Pascal-Straße. An den Seiten stehen Tische mit Monitoren und an einer Wand hängen zwei Großmonitore mit einem Meter Diagonale. In der Mitte steht eine Platte so groß wie ein Billardtisch mit einem Aufsatz. Das ist der Scanner.

    "Wir haben höchste Anforderungen an Farbtreue, an Geometrie, dass keine Schatten gebildet werden."

    Bertram Nickolay, Leiter der Abteilung Sicherheitstechnik, hat den Scanner nach eigenen Vorgaben bauen lassen. Jetzt öffnet er einen Karton. Hier liegen einige hundert Papierschnipsel lose übereinander. Sie sind handtellergroß oder kleiner, aus weißem, braunem oder grünem Papier. Es fühlt sich ganz dünn, fast zerbrechlich an. Die Birthler-Behörde hat diese Fetzen zuvor aus Säcken vorsortiert und an die Forscher übergeben.

    "Wir brauchen Säcke, die zum gleichen Bestand gehören. Weil unser Verfahren hat ja den großen Vorteil, wenn ein Schnipsel übrig bleibt von einem Sack, kann er vielleicht zum benachbarten Sack gehören."

    Vorteilhaft sind auch vorsortierte Schnipsel in der gleichen Schicht, die also benachbart liegen, sie stammen oft von der gleichen Seite oder der gleichen Stasi-Akte. Damit die Schnipsel beim Scannen keine Falten schlagen oder übereinander liegen, legt Nickolay sie vorsichtig zwischen zwei zwei Millimeter dicke Klarsicht-Folien.

    "Das Besondere an dem Scanner ist: Die Schnipsel werden von der Vorder- und Rückseite aufgenommen. Wir brauchen zum Zusammensetzen die Vorder- und die Rückseite."

    Sofort danach sind sie als digitale Schnipsel auf den Monitoren zu sehen. Vor dunklem Hintergrund heben sich die Konturen der einzelnen Schnipsel gut voneinander ab. Die Mathematikerin Anke Stieber ist zuständig für den nächsten Schritt und zeigt auf einen der beiden Großmonitore an der Wand.

    "Nachdem die Schnipsel ausgescannt sind – wie man hier auch sieht einzelnen Schnipsel zu Vorder- und Rückseite vorhanden sind und auch in der Datenbank abgespeichert sind, werden zu jedem Bild Merkmale berechnet, Bildmerkmale wie die Kontur eines Schnipsels, verschiedene Farbmerkmale, wie Hinter- und Vordergrundfarbe, Handschrift und diverse andere Abstrakta wie kariertes oder liniertes Papier."

    Mit diesen Bildmerkmalen arbeitet die Software. Anke Stieber markiert einen Schnipsel. Dieser ist grün und die Handschrift ist erkennbar. Sogleich sucht der Rechner nach dem Merkmal "grün" und findet 16 Schnipsel. Unter diesen sucht er nach dem Merkmal "handbeschrieben" und findet acht Schnipsel. Diese sind alle grün und handbeschrieben. Jetzt sortiert der Rechner nach der Form der Schnipsel. Auf dem zweiten der beiden Großmonitore erscheint sogleich ein erster Schnipsel, dann ein zweiter, der sich an den ersten anfügt, dann ein dritter und so weiter und schließlich baut
    sich aus acht Schnipseln eine komplette DIN-A4-Seite auf.

    "Wir hatten Kartons, wo wir viel zusammengefügt haben, so 80 Prozent, das ist schon gut. Die Zeit lag im Bereich von wenigen Minuten. Das ist vielversprechend, dass das System mal gut funktionieren wird."

    Das System ist eine gridbasierte Hardware. Dabei wird die Rechenleistung auf mehrere Computer verteilt. Das erhöht die Sicherheit und ermöglicht die schnelle Weiterverarbeitung der Daten. Für die Software schreiben die Forscher ständig neue Algorithmen, also Berechnungsvorschriften. So lassen sich Trefferquote und Prozesszeit optimieren, sagt Bertram Nickolay, der Initiator des Projekts.

    "Wir glauben – aus dem heutigen Blickwinkel – man wäre in der Lage in einem Zeitraum von acht bis zehn Jahren mit einem vernünftigen Aufwand an Ressourcen die ganzen Säcke zu rekonstruieren."

    Ab 2012 möchte er die Anlage routinemäßig einsetzen. So könnte die
    Rekonstruktion aller 15.000 Säcke im Jahr 2020 abgeschlossen sein.