Freitag, 19. April 2024

Archiv

Kinderpornografie
Suche nach der Nadel im Datenhaufen

In den USA wurde ein Mann festgenommen, nachdem kinderpornografisches Material in seinem Internet-Speicher aufgetaucht war. Der entscheidende Tipp kam vom Betreiber dieses Internetspeichers. Bei der Suche nach Kinderpornos setzen Konzerne auf Techniken wie das Hashverfahren oder "PhotoDNA".

Von Piotr Heller | 13.08.2014
    Zahlreiche Netzwerkkabel stecken in einem Serverraum in Berlin in einem Netzwerkverteiler.
    Internetfirmen wehren sich zunehmend gegen den Missbrauch ihrer Technik. (picture alliance / dpa / Matthias Balk)
    Das Internet hat seine Schattenseiten. Dadurch, dass es Menschen vernetzt und ihnen bei der Kommunikation hilft, ermöglicht es auch illegale Machenschaften. Eine der schlimmsten darunter ist die Verbreitung von Kinderpornografie. Doch Internetfirmen wehren sich gegen diesen Missbrauch ihrer Technik. Zusammen mit Forschern, Behörden und Kinderschutzorganisationen arbeiten sie an Technologien, um Kinderpornos aufzuspüren und aus dem Netz zu verbannen. Martin Steinebach vom Fraunhofer Institut für Sichere Informationstechnik entwickelt Systeme, die Kinderpornos automatisch erkennen.
    "Da gibt es eine ganze Reihe von verschiedenen Technologien. Von sehr einfach und schon lange etabliert bis zu quasi fast Science-Fiction. Die einfachsten Methoden das sind sogenannte kryptographische Hash-Verfahren."
    Fingerabdruck einer Datei
    Einen kryptographischen Hash kann man sich wie den Fingerabdruck einer Datei vorstellen. Man berechnet ihn aus den grundlegendsten Informationen einer Datei – aus den Bits. Das funktioniert für alle Dateien, auch für digitale Bilder. Der Hash ist einzigartig für jede Aufnahme. So kann man erkennen, ob zwei Bilder gleich sind, ohne sie selbst zu sehen: Es reicht, die Hashs zu vergleichen.
    Es gibt riesige Datenbanken mit den Hashs bekannter kinderpornografischer Bilder. Ermittler nutzen sie, um etwa beschlagnahmte Festplatten nach Kinderpornos zu durchforsten. Doch die Methode findet nur exakte Kopien bekannter Bilder. Schon bei minimalen Veränderungen eines Fotos versagt sie.
    "Und deswegen wurde das Konzept der robusten Hashverfahren entwickelt. Die robusten Hashverfahren, die sind dann eben robust gegen so was wie Größenveränderungen der Datei. Also im einfachsten Fall ist das wirklich so, dass man hergeht und skaliert das Bild auf eine Größe von 16 mal 16 Graustufen-Pixeln runter und vergleicht dann einfach nur, welche von diesen Graustufen sind die helleren und welche sind die dunkleren. Und erzeugt dadurch einen Hash."
    "PhotoDNA". Letzte Woche ist bekannt geworden, dass der Konzern damit auch die Datenströme seiner Nutzer nach Kinderpornos durchsucht: Die BBC berichtete, dass ein Mann in den USA festgenommen wurde, nachdem Microsoft ein kinderpornografisches Bild in dessen Cloud, also auf einem Internet-Speicher, gefunden hatte. Der Software-Konzern leitete die Daten an eine US-Organisation weiter, die vermissten und ausgebeuteten Kindern hilft und auch eine Hash-Datenbank für Kinderpornos betreibt. Kurz davor gab es einen ähnlichen Fall mit Google. Doch wie überprüfen die Konzerne all die Daten ihrer Kunden? Microsoft-Sprecher Thomas Baumgärtner:
    "Die Hash-Codes der Bilder, die eingehen, die werden während des Posteinganges oder während sie den Cloud-Raum betreten neu gebildet. Das machen wir mit allen Datenströmen, die eingehen. Wohlweislich scannen wir aber nicht die Email unserer Benutzer. Sondern immer dann, wenn so ein Datum, die Cloud-Hemisphere betritt, wird getestet oder wenn sie die Cloud verlässt, dann wird auch getestet."
    Hash-Verfahren erkennen nur bekannte Bilder
    Das Problem aller Hash-Verfahren ist, dass sie nur bekannte Bilder erkennen. Neues Material lässt sich immer noch unbemerkt durchs Netz schleusen. Doch Wissenschaftler arbeiten daran, Kinderpornos vollkommen automatisch zu erkennen. Martin Steinebach:
    "Es gibt bereits heute Erotik-Filter, die automatisiert erkennen können: Habe ich hier potenziell pornografischen Inhalt oder nicht: Hautfarbenerkennung, spezielle Strukturen, spezielle Anordnungen. Und wenn ich das kombiniere mir einem Mechanismus, der das Alter von der Person abschätzen kann. Dann kann ich da gegebenenfalls die Aussage treffen: Hier habe ich vielleicht Kinderpornografie."
    Noch haben solche Systeme Fehlerquoten im 10-Prozent-Bereich. Sie könnten aber besser werden. Ein Ansatz sind selbstlernende Algorithmen. Sie können lernen bestimmte Merkmale von Bildern zu erkennen und die Aufnahmen in Kategorien aufzuteilen. Einen solchen Algorithmus könnte man auch auf Kinderpornos trainieren. Dazu müsste man ihn zunächst mit vielen Beispielen füttern. Und von denen gibt es ja leider reichlich.