Archiv


Big Brother im Kaufhaus

Informationstechnik. - Nicht nur zu Sicherheitszwecken kann Bild- und Videoanalyse genutzt werden, sondern auch, wenn es darum geht, Bewegungen von ganzen Personenströmen innerhalb eines Kaufhauses zu untersuchen. Potsdamer Forscher haben dabei die Nase vorn.

Von Wolfgang Noelke |
    Per Videokamera aufgenommene Bilder von Menschen sofort in abstrakte, verschiedenfarbige Punkte zu verwandeln, gelingt der Software des Potsdamer Unternehmens "Vis á Pix". Die aufgenommenen Kunden existieren nicht mehr als Bilddatei, sondern als rote, grüne oder blaue Punkte und diese Punkte dürfen im Einklang mit dem Datenschutz, beispielsweise von Werbestrategen großer Kaufhäuser überallhin verfolgt und auch statistisch auswertet werden. Die Idee ist alt, doch war sie bislang technisch schwer umzusetzen: Der Inhalt unkomprimierter Videobilder fordert für die Auswertung eine zu hohe Rechenkapazität, komprimierte Bilder sind jedoch wieder zu ungenau. Die Erkennung und Verfolgung einzelner Menschen und Objekte funktioniert in der Praxis kaum. Ein im heutigen MPEG4- Verfahren komprimiertes Bild fasst jeweils acht mal acht Bildpunkte, so genannte Pixel zusammen zu einem der Blöcke, oder so genannten Kacheln aus denen sich auch die Bilder digitaler Fernsehprogramme zusammensetzen:

    "Einfache Videoanalysesysteme arbeiten mit diesen Mittelwerten der Blöcke. Das heißt, Personen sind zwei Blöcke breit und vier Blöcke hoch und Autos sind eben zehn Blöcke breit und sechs Blöcke hoch, zum Beispiel. Auf dieser groben Analyse arbeiten die meisten Erkennungssysteme und die können auch nicht sehr viel mehr machen als Personen von Fahrzeugen zu unterscheiden, vielleicht auch noch Fahrzeuge zählen, aber mit der Personenzählung hört’s da sehr bald auf."

    Dr. Ivo Kellers Team beschäftigte sich vormals am Berliner Heinrich-Hertz-Institut mit dem Aufbau einer Bilddatenbank. Deren Software sollte Bilder nach optischen Gesichtspunkten finden, also nach Farben und bestimmten Geometrien suchen: Die Geometrie eines sitzenden langhaarigen Hundes beispielsweise ähnelt auch der Geometrie langhaariger Menschen. Kellers Software berechnet nun nicht die ungenauen Mittelwerte der MPEG-4-Blöcke, die aus acht mal acht Pixel bestehen, sondern jedes einzelne Pixel wird berücksichtigt. Dieses Erkennungsprinzip der Bilddatenbank funktioniert auch mit Videobildern. Einbezogen werden ausschließlich Einzelpixel der Umrisse von Menschen, Autos oder Hunden, je nachdem, was man erkennen und verfolgen möchte. Die Kunst des Weglassens unwichtiger Faktoren, beispielsweise aller Bildpunkte eines bekannten Hintergrundes ist das Betriebsgeheimnis des Unternehmens, das Ivo Keller nur zum Teil lüftet:

    "Da gibt es verschiedene Verfahren bis dahin - wenn ein Mensch in die Szene kommt, dann ändert sich erst mal der Mittelwert des Pixels sehr stark. Jetzt ist eben die Kunst, wie genau man das modelliert hat. "

    Dieses pixelgenaue Modellieren ist die Fleißarbeit der mehr als 20 Mitarbeiter Ivo Kellers. Die Bildpunkte des von mehreren Kameras aufgenommenen Hintergrundes sind dann der Software bekannt, die dann nur noch alle darin veränderten Bildpunkte berechnet. Konventionelle Erkennungsprogramme, so Ivo Keller, wären bereits überfordert mit der Schlange an der Kaufhauskasse:

    "Wenn die Menschenmenge dann etwas dichter wird, also die Menschen sich partiell schon mal verdecken, dann kann es nicht mehr auseinander halten, wie viel Menschen es genau sind. Wir analysieren auf dem Pixel selbst und haben dort sehr umfangreiche mathematische Modelle, die wir in diese Pixel hineinsetzen und wir machen das Ganze auch noch dreidimensional. Also bei uns wird in "Weltkoordinaten" analysiert: wenn mehrere Kameras dieselbe Szene analysieren, dann rechnen die gemeinsam in Weltkoordinaten und das ergibt eine sehr hohe Genauigkeit. Wir erreichen in Menschenmengen 95 Prozent etwa."

    ... eine Erkennungsgenauigkeit, die bedeutet, dass in einem Gedränge von hundert Menschen im Schnitt nur fünf unerkannt bleiben. Diese hohe Präzision reicht aus, um nicht nur in Kaufhäusern Kundenströme exakt zu messen, sondern Verkehrs-, Messe- oder Flughafenmanager rechtzeitig zu warnen vor sich aufbauenden Staus und Engpässen.