Archiv


Sehende Computer sollen Blinden helfen

Sehende Computer und wie Computer beim Sehen helfen können - diese Themen standen im Mittelpunkt der Fünften Europäischen Konferenz für Computersehen, die in der vergangenen Woche an der Universität Freiburg stattfand. Computergenerierte Bilder bieten etwa bei der Fußball-WM den Zuschauern ungewöhnliche Perspektiven, ein Rechner der Universität Oxford hat gar das berühmte Wembley-Tor als Fehlentscheidung entlarvt. Doch schon dem Computer den Unterschied zwischen einer Telefonzelle und einem Schrank beizubringen, erfordert komplizierte Verfahren der Mustererkennung.

Klaus Herbst, Hans Burkhardt |
    "Es war kein Tor." Da ist sich Professor Hans Burkhardt vom Lehrstuhl für Mustererkennung und Bildverarbeitung der Universität Freiburg ziemlich sicher. Er glaubt den Ergebnissen eines Oxforder Rechners, der aus alten Fernsehbildern des Wembley-Spiels ein dreidimensionales Bild der Objekte und Spieler auf dem Spielfeld erstellt hat, das beweist: Der Ball war nicht über der Linie. Doch schon einfachere Aufgaben können den Grafikcomputern und ihren Programmierern Probleme bereiten. Um aus einem Bild das Muster einer Telefonzelle beispielsweise zu erhalten, werden zunächst alle darin vorkommenden Linien extrahiert. "Dann sind schnell 300.000 Linien im Rechner. Aus denen müssen nun die Linien herausgefunden werden, die mit projektiver Geometrie das Abbild einer Telefonzelle ergeben", berichtet Burkhardt. Die triviale Lösung, einfach alle Linien miteinander zu vergleichen, würde Tage dauern. Erst intelligente Algorithmen führen zum Ziel. Das in Linien zerlegte Weltbild vergleicht der Rechner dann mit sogenannten generischen Modellen, also geometrischen Beschreibungen von Gegenständen, die auf das Wesentliche abgespeckt sind. "Das ist ähnlich wie bei der Sprache", so Burkhardt. "Man extrahiert auch aus den Bildern zunächst primitive Elemente. In einem Bild sind das die Linienelemente, weil sie das Bild sehr stark charakterisieren können. Aus diesen Linienelementen müssen dreidimensionale Modelle generiert werden, die die Situation im Raum genau genug beschreiben."

    Burkhardt arbeitet an einer sogenannten Blindenbrille. Zwei winzige Kameras liefern Daten für ein Stereobild. Über eine Sprachausgabe sollen Blinde einen Eindruck von ihrem Umfeld bekommen. Die geometrischen Primitivmodelle aus Linien werden dazu noch einmal zusammengefaßt, ein Ansatz namens "Grouping". Burkhardt: "Damit kann etwa eine Häuserzeile erkannt werden. Obwohl die einzelnen Häuser unterschiedlich aussehen, haben sie typische Merkmale."