Forensische DNA-Phänotypisierung: Die hohe Kunst des Schubladendenkens

Debattenbeitrag von Dr. Joe Dramiga

Mit der Forensischen DNA-Phänotypisierung versucht die Kriminalpolizei aus einer DNA-Spur am Tatort die Haar-, Haut- und Augenfarbe sowie die biogeografische Herkunft des Spurenlegers vorherzusagen. Ist der Spurenleger der Tatverdächtige soll die DNA-Phänotypisierung, wie die Aussage eines Zeugen, helfen, den Kreis möglicher Tatverdächtiger einzugrenzen, um gezielter ermitteln zu können. Voraussetzung für diese Eingrenzung ist, dass diese Merkmale bei den Menschen in der Region, in der ermittelt wird, möglichst unterschiedlich sind. Es spielt also eine Rolle, wo diese Methode eingesetzt wird. Findet z. B. die Kriminalpolizei in Kampala, Uganda mittels DNA-Phänotypisierung heraus, dass der Spurenleger dunkelbraune Haut, braune Augen und schwarze Haare hat und aus Afrika stammt, hilft ihr das bei der Ermittlung wenig, da zu viele Menschen in Kampala diese Merkmalskombination zeigen. Die meisten Menschen in der Welt, vor allem in Afrika, Australien (Aborigines), Südamerika, und weiten Teilen Asiens, haben dunkelbraune bis schwarze Haare und braune Augen. In Deutschland würden Ermittler bei Menschen mit dieser Merkmalskombination daher zuerst eine außereuropäische Herkunft vermuten.

Ganz anders ist die Situation, wenn das Ergebnis der DNA-Phänotypisierung ist, dass der Spurenleger hellrosa Haut, grüne Augen und rote Haare hat und aus Europa stammt. Das grenzt den Kreis der Tatverdächtigen erheblich ein, kann aber auch die Minderheit in dieser Region, die diese Merkmalskombination hat, durch die Art und Weise der Berichterstattung unter Generalverdacht stellen und gegen sie bestehende Vorurteile verstärken. Wie wird mit dem durch die Interpretation der DNA-Phänotypisierung produzierten Wissen sowohl ermittlungsintern als auch öffentlich umgegangen?

Warum sich besonders die Kriminalpolizei in Europa für diese Methode interessiert ist leicht zu beantworten. Europa hat die größte Vielfalt an Haar- und Augenfarben. Diese Vielfalt erreicht ein Maximum in einem Gebiet, das um das Ostbaltikum zentriert ist und Nord- und Osteuropa abdeckt. Wenn wir uns nach außen, nach Süden und Osten bewegen, sehen wir eine schnelle Rückkehr zu schwarzen Haaren und braunen Augen. Haarfarben lassen sich in sechs Farbgruppen mit je verschiedenen Helligkeitsgraden einteilen: Schwarz, Braun, Rot, Blond, Grau, Weiß, wobei Grau und Weiß Folgen des Alterungsprozesses oder einer Krankheit sind und mit einer DNA-Phänotypisierung nicht erfasst werden können. In Europa liegen die häufigsten Haarfarben im Bereich der Brauntöne, die von Tiefbraun im Mittelmeerraum nach Norden hin immer heller werden und dort fließend in blonde Farbtöne übergehen. Rot ist mit 1 bis 2 Prozent die seltenste Haarfarbe.

Die Augenfarbe wird als (weitgehend) unveränderliches Körpermerkmal in den Personalausweis eingetragen und ist üblicherweise Bestandteil einer Personenbeschreibung. Augenfarben lassen sich in sieben verschiedene Farbgruppen einteilen: Braun, Haselnussbraun (im Englischen Hazel), Grün, Bernsteinfarben (im Englischen Amber), Grau, Blau und Rot. Menschen mit Albinismus haben rote Augen. Ihre Augen haben sehr wenig Melanin und das Rot entsteht durch die Blutgefäße hinter der Regenbogenhaut. Innerhalb der ersten sechs Farbgruppen gibt es jeweils mindestens zwei Helligkeitsabstufungen. Die Farbgruppen haben unterschiedliche Häufigkeiten: 8 Prozent der Weltbevölkerung hat blaue Augen. Doch auch hier gibt es Unterschiede in der regionalen Häufigkeit in Estland z. B. haben 99 % der Bevölkerung blaue Augen. Grün ist mit 2 bis 4 Prozent die seltenste Augenfarbe. Die meisten Menschen mit nicht-braunen Augen leben in Europa.

HIrisPlex-S DNA, das neueste Testsystem für die DNA-Phänotypisierung benutzt für die Vorhersage der Haar-, Haut- und Augenfarbe 41 DNA-Marker. 6 DNA-Marker für die Augenfarbe, 22 DNA-Marker für die Haarfarbe und 36 DNA-Marker für die Hautfarbe. Diese DNA-Marker haben unterschiedliche Auswirkungen auf die Vorhersagegenauigkeit, die durch die Unterschiede in der Stärke ihrer Vorhersagekraft bestimmt werden.

Für die Augenfarbe gibt es die drei Kategorien Blau, Mittel und Braun. Für die Haarfarbe gibt es vier Kategorien: Blond, Braun, Rot und Schwarz. Zusätzlich gibt es noch die Unterkategorien Hell und Dunkel. Für die Hautfarbe gibt es fünf Kategorien: Sehr blass, blass, mittel, dunkel und dunkel zu schwarz. HIrisPlex-S DNA kann mit seinen Kategorien für die Haar-, Haut- und Augenfarbe die Vielfalt dieser menschlichen Merkmale nicht in der natürlichen Farbtiefe abbilden. Wie hilfreich die genannten Kategorien bei einer Fahndung sind, hängt zusätzlich davon ab, ob es z. B. einen regionalen soziokulturellen Konsensus zur Augenfarbe „mittel“ und zur Hautfarbe „blass“ gibt.

Die Vorhersagen der DNA-Phänotypisierung haben bestimmte Eintrittswahrscheinlichkeiten. Statistiker haben jedoch erhebliche Bedenken was die Genauigkeit dieser Wahrscheinlichkeitsvorhersagen betrifft. Sowohl die DNA-Marker als auch die sichtbaren Merkmale sind kategoriale Variablen. Kategoriale Daten werden mit der relativen Häufigkeit beschrieben. Die relative Häufigkeit ist der Prozentsatz der Daten, der sich einer bestimmten Kategorie zuordnen lässt z. B. die Anzahl der Schüler mit schwarzen Haaren aus einer Klasse von 30 Schülern oder die Anzahl der Männer aus einem Dorf mit einem bestimmten DNA-Marker aus der Menge alle Männer des Dorfes. Forensische Genetiker würden nun für die DNA-Phänotypisierung untersuchen wie stark z. B. ein bestimmter DNA-Marker mit der Haarfarbe Schwarz assoziiert ist. Wenn sie nun die Wahrscheinlichkeiten basierend auf einer Stichprobe bestimmen so gelten diese Wahrscheinlichkeiten nur für diese Stichprobe.

HIrisPlex-S DNA z. B. benutzte für die Konstruktion des Vorhersagemodells für die Augenfarbe eine Stichprobe von 9466 Individuen aus den neun Ländern Niederlande, Norwegen, Estland, Großbritannien, Frankreich, Italien, Spanien, Griechenland, USA. Der positive Vorhersagewert (im Englischen Positive Predictive Value, PPV) für blaue Augen war 91 %, für braune Augen 79 % und für „mittel“ Augen 0 %. Dieses Modell wurde an 194 Menschen aus den USA getestet, die nicht an der Konstruktion des Modells beteiligt waren. Die Augenfarbe konnte in 80% der Fälle korrekt vorhergesagt werden (155 von 194 Vorhersagen waren richtig). Bemerkenswert ist, dass dieser Wert auf 96% steigt, (156 von 162) wenn nur braune und blaue Augen beurteilt werden und die Kategorie „mittel“ nicht aufgenommen wurde. Die Abstufungen der Pigmentierung in der Mitte sind viel schwieriger zu bestimmen. Eine weitere Schwierigkeit besteht darin, dass dieses Modell weitgehend mit Proben aus europäischen Populationen entwickelt wurden, was bedeutet, dass sie möglicherweise nicht so gut funktionieren, wenn die getestete Person aus einer außereuropäischen Population stammt. Der HIrisPlex-S DNA kann also auch wie ein Augenzeuge irren.

Die Forensiker müssen auch die Tatsache berücksichtigen, dass die Stichprobenergebnisse variieren. Sie müssen sicherstellen, dass die Stichprobe repräsentativ für die untersuchte Population ist. Grundsätzlich wäre auch eine Anpassung der Ergebnisse an den Anteil der Merkmalsträger in einer bestimmten Population nötig (im Englischen prevalence adjustment genannt). Da die DNA-Phänotypisierung nur eine statistische Wahrscheinlichkeit bietet, der Tatverdächtige also in Wirklichkeit auch anders aussehen kann, ist es wichtig, dass die Kriminalpolizei betont, dass der Täter so aussehen könnte, aber eben nicht muss.

Die Analyse der biogeografischen Herkunft im Englischen Biogeographical Ancestry (BGA) oder Admixture Testing genannt, verwendet die DNA eines Menschen, um zu bestimmen, aus welcher Region der Welt seine Vorfahren stammen. Ich möchte das Prinzip der BGA an einem Beispiel erläutern: Nehmen wir an, wir haben auf einer abgelegenen Insel einen Lennister-Clan von 1000 Menschen. Jeder in dieser Population hat den seltenen DNA-Marker M. Die relative Häufigkeit dieses DNA-Markers ist also 100 %. Zusätzlich hat niemand außerhalb des Lennister-Clans den DNA-Marker M.

Nun untersuchen wir die DNA von Udo, der in Bielefeld lebt. Wir entdecken, dass Udo den DNA-Marker M hat. Können wir sagen, dass Udo aus dem Lennister-Clan stammt? Wenn keine andere Population auf der Welt diesen DNA Marker hat, können wir mit hoher Wahrscheinlichkeit sagen, dass Udo entweder ein Lennister ist oder einen Vorfahren hat, der aus dem Lennister-Clan stammt. Zusätzlich besteht eine geringe Wahrscheinlichkeit, dass der DNA Marker M unabhängig jeglicher Verwandtschaft mit den Lennisters in den Keimzellen (Spermium oder Eizelle) von Udos Eltern entstanden ist und an ihn weitergegeben wurde.

Eine BGA vergleicht die DNA-Marker eines Individuums mit den DNA-Markern verschiedener Populationen. Nehmen wir an, wir haben drei verschiedene Populationen, den Lennister-Clan, den Ying-Clan und den Wakanda-Clan. Der Lennister-Clan lebt auf den Shetlandinseln in Schottland, der Ying-Clan in der Provinz Hunan in China und der Wakanda-Clan in der Provinz Arua in Uganda. Jeder Clan besteht aus 1000 Personen. Jede Person in jeder Population hat den DNA-Marker M. Mit anderen Worten, die relative Häufigkeit des DNA-Markers M beträgt in jeder Population 100 %. Jetzt entdecken wir wieder, dass Udo, der in Bielefeld lebt, den DNA-Marker M hat. Können wir sagen, dass Udo aus dem Lennister-Clan stammt? Wenn wir diese biologische Frage bejahen, sagen wir gleichzeitig, dass er von den Shetlandinseln kommt und machen damit eine Aussage über seine geographische Herkunft. 

Die Frage ist jetzt schwerer zu beantworten. Die Tatsache, dass Udo einen DNA-Marker M hat, bedeutet nicht unbedingt, dass Udo vom Lennister-Clan abstammt. Udo könnte aus jedem der drei Clans abstammen oder einen Vorfahren aus einem der drei Clans haben.

Die BGA schätzt wie viel Prozent DNA jede Population in der DNA-Datenbank zu der DNA der Person, die man untersucht, beigetragen haben könnte. Das Ergebnis einer BGA wird im Englischen Most Likely Estimate (MLE) genannt und mit einem bestimmten Konfidenzintervall angegeben.

In der BGA arbeitet man mit Einzelnukleotidpolymorphismen im Englischen Single Nucleotide Polymorphisms (SNPs) genannt. Ein Einzelnukleotidpolymorphismus ist eine Variation eines einzelnen Basenpaares in einem komplementären DNA-Doppelstrang, die in einer bestimmten Population die relative Häufigkeit von mindestens 1 % hat. Auch die DNA-Marker für die Haar-, Haut- und Augenfarbe sind SNPs. SNPs stellen circa 90 % aller genetischen Varianten im menschlichen Genom dar. Sie treten nicht gleichverteilt auf, sondern ungleichmäßig stark an bestimmten Regionen.

Das Kochrezept für eine BGA benötigt im Prinzip drei Zutaten: 1. Referenzpopulationen, 2. PCA, 3. AIMs. Eine Population wie der Wakanda-Clan wird als Referenzpopulation bezeichnet. PCA steht für Principal Component Analysis. Die PCA ist ein komplexer mathematischer Prozess, der eine Menge von Daten in seine Komponenten aufteilt. Nehmen wir zum Beispiel an, wir haben eine Tüte mit 100 Gummibärchen, die verschiedene Farben haben. Nachdem wir die Gummibärchen nach Farbe getrennt haben, zählen wir 25 gelbe, 25 rote, 25 grüne und 25 blaue Gummibärchen. Dies bedeutet, dass jede der vier Farben 25 % der Gummibärchen ausmacht. Die PCA würde die Gummibärchen im Wesentlichen genauso trennen.

Die PCA bestimmt im ersten Schritt in jeder der drei Referenzpopulationen Ying- Clan, Wakanda-Clan und Lennister-Clan die relative Häufigkeit eines SNP. Im zweiten Schritt wählt sie dann die SNPs aus, deren relativen Häufigkeiten sich zwischen diesen drei Clans um mindestens 30 % unterscheiden. Der DNA-Marker M, ein SNP, hat z. B im Lennister-Clan die relative Häufigkeit 10 % im Wakanda-Clan die relative Häufigkeit 45 % und im Ying-Clan die relative Häufigkeit 80 %. Der DNA-Marker M kann daher für diese drei Populationen als Ancestry Informative Marker (AIM) verwendet werden. In der BGA können zwischen 70 und 1400 AIMs benutzt werden je nachdem, wie viele Populationen man unterscheiden will. Je mehr Populationen man unterscheiden muss, desto mehr AIMs braucht man. Der AIM ist also nicht spezifisch für eine Population, sondern nur seine relative Häufigkeit ist es und die kann sich ändern, wenn neue Einträge in die Datenbank kommen oder alte gelöscht werden.

Je relativ mehr Menschen aus einer Referenzpopulation, die AIMs haben, die auch die untersuchte Person hat, desto wahrscheinlicher ist es, dass die untersuchte Person mit diesen Menschen aus der Referenzpopulation verwandt ist. Die BGA sucht aber nicht alle Vorfahren, sondern nur einen Teil der genetischen Vorfahren. Die Vorfahren eines Menschen haben jeweils einen Teil ihrer DNA und mit diesem auch bestimmte AIMs in die nächste Generation weitergegeben. Die DNA von mehr als 99 % seiner Vorfahren ist im Laufe der Generationen aber verloren gegangen und hat es gar nicht bis in die heutige Generation geschafft.  In dem Fall sprechen wir von biologischen Vorfahren. Die Vorfahren deren AIMs es in die heutige Generation geschafft haben machen weniger als 1 % aller Vorfahren aus und wir nennen sie genetische Vorfahren. Die BGA sucht die Population in der Welt mit denen der untersuchte Mensch, einen jüngsten gemeinsamen genetischen Vorfahren hat. Es gibt mindestens drei wesentliche aktuelle Hürden mit einer BGA:

  1. Populationen können den Standort und die Identität ändern. Sie sind nicht statisch. Was wir derzeit über die Geschichte einer Bevölkerung wissen, ist begrenzt. Die Kriminalpolizei kann also mit der BGA nicht das Geburtsland eines Tatverdächtigen bestimmen.
  2. Es gibt keinen vollständigen Satz von Referenzpopulationen, der die ganze Welt abdeckt. Es gibt weiße Flecken auf der Karte. Der Nahe Osten ist in den Datenbanken besonders schlecht repräsentiert. Menschen aus dem Nahen Osten stellen eine Herausforderung für aktuelle biogeografische Abstammungstests dar, da die Bevölkerung der Region durch Genfluss aus Europa, Südasien und Nordafrika beeinflusst wird. Wenn wir die DNA eines Spurenlegers haben, der aus dem Nahen Osten stammt, dann wird das Modell nicht vorhersagen, dass er aus dem Nahen Osten kommt, wenn diese Bevölkerung nicht Teil des Vorhersagemodells ist. Stattdessen wird es vorschlagen, dass er aus Europa, Südasien oder Nordafrika kommt.
  3. Verschiedene Algorithmen können zu unterschiedlichen Ergebnissen führen. Die Referenzpopulation und der bei der PCA verwendete Algorithmus bestimmen, was der „Best Fit“ ist.

Die Forensische DNA-Phänotypisierung hat bisher nicht die technische Reife erreicht, um in der kriminalistischen Ermittlungspraxis eingesetzt zu werden. Zusätzlich müsste immer geprüft werden, ob der Einsatz dieser Technologie in einzelnen Ermittlungsfällen einen zusätzlichen Nutzen bringt. Forensische Genetiker und Politiker sollten daher in der Öffentlichkeit keine übertriebenen Erwartungen an diese Technologie wecken und ehrlich auf ihre Grenzen und Risiken hinweisen.