Clear Sky Science · de

Erkennung von Probenvertauschungen in Anti-Doping-Untersuchungen mithilfe von maschinellem Lernen

· Zurück zur Übersicht

Warum das Aufdecken schlauer Betrüger wichtig ist

Spitzensport beruht auf Vertrauen: Wenn ein Athlet gewinnt, möchten wir davon ausgehen, dass das Ergebnis sauber ist. Moderne Dopingtests sind sehr empfindlich, doch einige Athleten versuchen, sie auszutricksen, indem sie heimlich Urinproben vertauschen. Diese Studie zeigt, wie maschinelles Lernen erkennen kann, wenn ein Athlet eine zuvor abgegebene „saubere“ Probe wiederverwendet — ein Trick, der mit den heutigen Routinetests extrem schwer zu entdecken ist. Die Arbeit weist auf neue Möglichkeiten hin, fairen Wettkampf zu schützen, indem heimlich große Testdatenbanken nach versteckten Hinweisen auf Manipulation durchsucht werden.

Eine versteckte Schwachstelle in der aktuellen Testpraxis

Anti-Doping-Labore untersuchen üblicherweise Urin, weil viele verbotene Substanzen und deren Abbauprodukte dort lange nachweisbar bleiben. Die natürlichen Steroidhormonprofile von Athleten werden über Jahre im Athlete Biological Passport verfolgt, sodass ein plötzlicher Sprung dieser Werte eine Untersuchung auslösen kann. Das Einsetzen fremden Urins stört dieses Langzeitmuster und ist oft erkennbar. Der eigentliche blinde Fleck entsteht jedoch, wenn ein Athlet heimlich seinen eigenen früheren, drogenfreien Urin wiederverwendet. In diesem Fall passt das Steroidmuster perfekt in seine Vorgeschichte, und wenn die Probe in einem anderen Labor oder lange nach der ursprünglichen Abgabe getestet wird, gibt es derzeit keine automatische Methode, um zu bemerken, dass zwei Proben im Wesentlichen identisch sind.

Figure 1
Figure 1.

Urinchemie in durchsuchbare Muster überführen

Die Autoren näherten sich dem Problem, indem sie sich auf den detaillierten „Fingerabdruck“ konzentrierten, der sich aus einer Reihe natürlicher Steroide und deren Verhältnissen im Urin ergibt. Sie sammelten 67.651 Steroidprofile aus einem von der World Anti-Doping Agency (WADA) akkreditierten Labor, die zwischen 2021 und 2023 erhoben wurden und sowohl männliche als auch weibliche Athleten abdecken. Jedes Profil enthält wichtige Hormone wie Testosteron und mehrere verwandte Verbindungen sowie Verhältnisse zwischen diesen. Da echte Fälle von Probenwiederverwendung selten und vertraulich sind, kombinierten die Forscher diese Realwelt-Daten mit sorgfältig erzeugten synthetischen Profilpaaren: Einige Paare wurden durch Hinzufügen kleiner, realistischer Messrauschen „ähnlich“ gemacht, andere durch zufälliges Zusammenführen von Proben unterschiedlicher Athleten „unähnlich“. Dadurch entstand ausgewogenes Trainingsmaterial, mit dem ein Computermodell lernen konnte, wie „beinahe identisch“ in der Praxis wirklich aussieht.

Wie der intelligente Detektor funktioniert

Der Kern des Systems ist eine Form künstlicher neuronaler Netze, bekannt als Konvolutionsnetzwerk, das häufig in der Bilderkennung eingesetzt wird. Hier sind statt Bildern Eingabedaten Paare von Steroidprofilen, die nebeneinander angeordnet werden. Das Netzwerk scannt die Merkmale, um subtile lokale Zusammenhänge zu erfassen, etwa wie zwei Hormone und ihr Verhältnis gemeinsam schwanken. Um die Daten handhabbarer und interpretierbarer zu machen, nutzten die Forscher zudem eine Technik namens Hauptkomponentenanalyse (PCA), um alle Profile in einen dreidimensionalen Raum zu projizieren, in dem einfache Distanzmaße nahe Übereinstimmungen hervorheben können. Während des Trainings lernt das Netzwerk, eine Wahrscheinlichkeit auszugeben, dass zwei Profile aus demselben Urin stammen, und unterscheidet damit echte Ähnlichkeit von normalen biologischen Unterschieden zwischen Athleten und über die Zeit.

Erprobung der Methode

Das Team bewertete seinen Ansatz auf mehreren Ebenen. Zuerst testeten sie ihn an zurückgehaltenen Daten aus jedem Jahr, also Profilen, die während des Trainings nicht gesehen wurden, aber innerhalb der erwarteten Messunsicherheit von 15 % leicht verändert worden waren. Das Konvolutionsnetzwerk erreichte durchgängig sehr hohe Genauigkeit, erkannte ähnliche Paare korrekt und hielt Fehlalarme niedrig, und übertraf dabei traditionellere Methoden wie logistische Regression, Support-Vektor-Maschinen und baumbasierte Modelle. Anschließend stellten sie das System vor die Herausforderung von mehr als 800 „Bestätigungs“-Proben — realen Urinproben, die von Laboren unter leicht abweichenden Verfahren erneut analysiert worden waren. Diese dienen als realistischer Ersatz für wiederholte oder wiederverwendete Proben. Auch hier schnitt das Netzwerk für Männer und Frauen sehr gut ab, mit ausgezeichneter Sensitivität (echte Übereinstimmungen erfassen) und Spezifität (falsche Treffer vermeiden), was darauf hindeutet, dass es mit echtem Laborrauschen und biologischer Variation zurechtkommt.

Figure 2
Figure 2.

Was das für sauberen Sport bedeutet

Für Nicht-Fachleute ist die wichtigste Erkenntnis, dass es mittlerweile praktikabel wird, automatisch riesige Anti-Doping-Datenbanken nach Hinweisen zu durchsuchen, dass eine angeblich neue Urinprobe in Wirklichkeit eine annähernd perfekte Kopie einer älteren ist. Das vorgeschlagene maschinelle Lernsystem ersetzt nicht die bestehenden Tests auf verbotene Substanzen; es ergänzt sie vielmehr durch eine leistungsfähige Hintergrundprüfung, die verdächtig ähnliche Proben zur genaueren forensischen Prüfung markieren kann. Obwohl die Methode teilweise auf simulierten Daten beruht und komplexe „Black-Box“-Modelle verwendet, die nicht vollständig transparent sind, bietet sie Sportbehörden dennoch ein praktisches neues Instrument. Wenn sie in die aktuellen Systeme des Athlete Biological Passport integriert wird, könnte sie den einst kaum nachweisbaren Trick der Wiederverwendung sauberen Urins deutlich riskanter machen und das Vertrauen stärken, dass Medaillen aufgrund von Leistung und nicht durch Manipulation errungen werden.

Zitation: Rahman, M.R., Piper, T., Thevis, M. et al. Detection of sample swapping in anti-doping investigations using machine learning. Sci Rep 16, 9230 (2026). https://doi.org/10.1038/s41598-026-43502-y

Schlüsselwörter: Anti-Doping, Urin-Steroideprofile, Probenvertauschung, maschinelles Lernen, Integrität im Sport