Mittwoch, 22. Mai 2024

Archiv


Hund, Katze, Kuh

Informatik. Wiener Informatiker haben eine Software entwickelt, die Tierstimmen unterscheiden kann. Einen einfachen Nutzen sehen sie bei der Archivierung von Tierfilmen. Vielleicht können aber auch einmal Verhaltensforscher von der Idee profitieren.

Von Ralf Krauter | 13.09.2006
    "Muuuuh! Im Hintergrund werden die Daten jetzt extrahiert. Das sieht man hier in diesem Fenster. Und tatsächlich: Unser Geräusch wurde als Kuh identifiziert."

    Dalibor Mitrovic steht mit einem Mikrofon in der Hand vor einem PC. Der Doktorand am Institut für Sofwaretechnik der technischen Universität Wien hat gemeinsam mit einem Kollegen ein Computerprogramm entwickelt, das Tierstimmen automatisch erkennt.

    "Wir können auch eine Katze versuchen: Miau, Miau, Miau!"

    Auch die imitierte Katze erkennt der Tierstimmen-Analysator korrekt als solche - genau wie 90 Prozent aller Aufnahmen von echten Kühen, Katzen, Hunden und Vögeln, mit denen die Wiener Informatiker ihr System getestet haben. Was klingt, wie eine nette Spielerei, könnte durchaus praktischen Nutzen haben. Etwa bei der Archivierung von Filmmaterial, erklärt Dalibor Mitrovics Doktoranden-Kollege Matthias Zeppelzauer:

    "Das ist eine der großen Anwendungen, dass man Videos automatisch annotiert - sozusagen Metadaten generiert aus dem Video."

    Bislang müssen Tierfilme bei der Archivierung mühsam von Hand verschriftet werden. Ein Archivar sichtet die Bänder und notiert, an welcher Stelle zum Beispiel ein bellender Hund durchs Bild läuft. Mit der Tierstimmenerkennung aus Wien ließe sich das künftig automatisieren. Zu Beginn ihrer Arbeit haben die Informatiker eine Datenbank mit jeweils 100 Stimmproben von Hunden, Katzen, Kühen und Vögeln angelegt. Zeppelzauer:

    "Diese Soundsamples haben jetzt unter Umständen auch eine sehr breite Charakteristik. Zum Beispiel haben wir in manchen Soundsamples nur ein Hundegebell, in anderen aber mehrere. Dann haben wir von kleinen Hunden angefangen bis zu großen Tieren in unserer Datenbank. Das heißt, eine solche Tierklasse hat durchaus sehr unterschiedliche Geräusche."

    In der Tonschnipsel-Sammlung haben die Forscher dann nach akustischen Fingerabdrücken gesucht, die es erlauben, etwa einen Hund zuverlässig von allen möglichen Katzen, Kühen und Vögeln zu unterscheiden. Das Ergebnis dieser tierischen Stimmanalyse sind Prototypen eines Bellens, Miauens, Muhens und Zwitscherns, mit dem die Informatiker nun alle neu zu klassifizierenden Aufnahmen vergleichen - vorausgesetzt, das betreffende Tier hatte einen Soloauftritt. An gemischte Stimmproben wie die Geräuschkulisse auf einem Bauernhof haben sich die Wiener nämlich noch nicht heran gewagt. Zeppelzauer:

    "An und für sich ist so eine Analyse natürlich möglich, aber die Erkennungsrate wird natürlich relativ stark hinunter gehen. Wir haben jetzt Erkennungsraten von 90 Prozent erreicht für vier Klassen. Es ist auch klar: Je mehr verschiedene Tiere man trennen will, umso weiter wird die Erkennungsrate runter gehen. Und wenn man natürlich noch überlappende Tierstimmen erkennen will, wird es natürlich noch weiter runter gehen. Weil: Man hat Interferenzen zwischen den Signalen, Überschneidungen, und dann ist es nicht mehr eindeutig trennbar das Signal."

    Mit verfeinerten Methoden könnten sich künftig sogar verschiedene Tiere einer Klasse unterscheiden lassen - was Verhaltensbiologen ganz neue Möglichkeiten beim Versuch, Tiere zu verstehen eröffnen würde. Doch bis Computer tatsächlich den Pferdeflüsterer ersetzen können, wird es noch dauern, schon allein wegen der Vielfalt der Geräusche. Das tierische Repertoire ist so groß, dass sich selbst Menschen manchmal schwer tun mit der Zuordnung. Matthias Zeppelzauer:

    "Da habe ich noch etwas, was auch sehr interessant ist. Das könnte ein Hund oder ein Vogel sein. Ich spiele es noch mal vor, weil es relativ kurz ist. Also wenn man sich zum Beispiel einen Truthahn oder so etwas vorstellt, dann könnte das durchaus von einem Vogel auch sein. In Wirklichkeit ist es ein Hund. In der Regel ist es eigentlich so: Wenn es für den Menschen nicht erkennbar ist, ist es für den Computer auch nicht verifizierbar."