Dienstag, 30. April 2024

Archiv


Keine Anonymität für DNA-Spender

Weltweit werden DNA-Daten freiwilliger Spender in öffentlich zugänglichen Datenbanken gesammelt. Davon verspricht sich die Wissenschaft neue Erkenntnisse - etwa bei der Entstehung von Krankheiten. US-Forscher zeigen nun, wie leicht sich die eigentlich geschützte Identität der Spender feststellen lässt.

Von Michael Stang | 05.04.2013
    2003 erhielt John Doe, der US-amerikanische Max Mustermann, Post von einem Konsortium. Ob er nicht Studienteilnehmer beim Internationalen HapMap-Projekt werden möchte? Er würde der Wissenschaft helfen, bestimmte Regionen des menschlichen Erbguts zu kartieren. Später würden diese Informationen anonymisiert in öffentlich zugänglichen Genetikdatenbanken stehen. Eine Speichelprobe müsse er dafür abgeben, mehr nicht. Zwar wurde John Doe bei der schriftlichen Einverständniserklärung darauf hingewiesen, dass eine Reidentifizierung theoretisch möglich sei, in der Praxis sei dies jedoch nahezu ausgeschlossen. Falsch, sagt Melissa Gymrek vom Whitehead Institut für biomedizinische Forschung im US-amerikanischen Cambridge. Sie konnte mehr Dutzende Personen identifizieren, deren genetische Profile anonymisiert in öffentlichen Registern gespeichert sind.

    "Wir haben große Ahnenforschungsdatenbanken genutzt, in denen mehr als 100.000 genetische Profile öffentlich zugänglich sind und dann haben wir versucht, von diesen anonymen Spendern die Nachnamen zu erfahren. Wir haben aus anderen genetischen Datenbanken Proben von Männern genommen, die eine bestimmte Markierung auf ihrem Y-Chromosom haben und haben alle Daten mit einem von uns entwickelten Algorithmus analysiert."

    Bei solchen Sammlungen werden zu den genetischen Informationen auch einige wenige Zusatzdaten zur Verfügung gestellt: das Alter des Spenders zum Zeitpunkt der Spende und der jeweilige US-Bundesstaat.

    "Dabei sahen wir, dass wir allein durch die Kombination dieser Metadaten eine gesuchte Person schon auf zwölf Kandidaten eingrenzen konnten."

    Um aus diesen zwölf Männern denjenigen mit dem gesuchten Genetikprofil herauszufinden, nutzte Melissa Gymrek die Tatsache, dass in der Regel Y-Chromosomen nahezu unverändert vererbt werden, ähnlich wie Familiennamen. Der Gesuchte trägt nicht nur den gleichen Nachnamen wie sein Vater und sein Großvater, sondern auch das gleiche Y-Chromosom, ebenso wie alle Verwandten der männlichen Linie. Die Genetikerin gab ihre Daten in zwei Online-Familiensuchmaschinen ein und suchte nach Parallelen, also Namenshäufigkeit nebst Y-Chromosomenmarkierung. Damit wollte sie mit einer Art genetischen Schablone Familien finden, die durch dieses Raster passten. Die Anfrage ergab acht Familiennamen. Kombiniert mit weiteren öffentlichen Informationen wie demografische Daten, Sterbelisten und Suchmaschinen, konnte sie insgesamt 50 Individuen namentlich identifizieren, die ihr Erbgut für diese genetische Datenbank gespendet hatten. Dazu benötigte die Wissenschaftlerin nur einen Computer mit Internetzugang und öffentlich zugängliche Datenbanken.

    "Wir hatten eigentlich nur wenige Daten zur Verfügung und dennoch gelang uns die Identifizierung relativ einfach. Wenn man sieht, wie diese genetischen Datenbanken und jene der Ahnenforschung stetig wachsen, wird die Identifizierung technisch bald noch einfacher werden."

    Die Identitäten der enttarnten Spender haben die Forscher nicht preisgegeben. Nachdem sie sich bei Behörden und Datenbankbetreibern gemeldet hatten, wurden einige Metadaten wie das Alter aus den öffentlich zugänglichen Informationen entfernt. Zukünftig gilt es aber, so Melissa Gymrek, eine Balance zwischen Persönlichkeitsrechten und öffentlichem Nutzen zu finden.

    "Das Problem von Anonymität hier ist, dass sich sowohl Wissenschaftler als auch Studienteilnehmer dieser Risiken bewusst sein müssen. Wir denken, dass man diese Sicherheitslücken jetzt finden sollte, bevor es jemand macht, der die Daten für unlautere Aktivitäten nutzen möchte. Wir hoffen, dass diese Studie den Anstoß gibt, Sicherheitsrisiken zu minimieren."

    Denn die Gefahr ist groß, dass Versicherungen oder Arbeitgeber damit Daten zum Erbgut einer bestimmten Person prüfen können, auch wenn von ihr selbst gar keine biologisch verwertbare Probe in einer öffentlichen Datenbank gespeichert ist. Die Probe des Bruders, eines Onkels oder Cousins allein reicht bereits, um eventuelle Krankheitsrisiken einer dritten Person bestimmen zu können.