Clear Sky Science · nl

Detectie van samplewisseling in antidopingonderzoeken met behulp van machine learning

· Terug naar het overzicht

Waarom het vangen van slimme valsspelers telt

Top­sport berust op vertrouwen: wanneer een sporter wint, willen we geloven dat de uitslag eerlijk is. Moderne drugtests zijn zeer gevoelig, maar sommige sporters proberen ze te slim af te zijn door stiekem urinemonsters te verwisselen. Deze studie laat zien hoe machine learning kan detecteren wanneer een sporter een eerder afgenomen “schone” urine hergebruikt—een truc die met de huidige routinematige controles bijzonder moeilijk te pakken is. Het werk wijst op nieuwe manieren om fair play te beschermen door stilletjes enorme testdatabases te scannen op verborgen aanwijzingen van manipulatie.

Een verborgen maas in de huidige tests

Antidopinglaboratoria testen doorgaans urine, omdat veel verboden middelen en hun afbraakproducten daar lange tijd detecteerbaar blijven. Profielen van natuurlijke steroïdehormonen bij atleten worden over jaren gevolgd in het Athlete Biological Passport, zodat een plotselinge sprong in deze waarden een onderzoek kan uitlokken. Het verwisselen van iemands urine door die van iemand anders verstoort dit lange-termijnpatroon en is vaak detecteerbaar. Het echte blinde punt ontstaat wanneer een sporter heimelijk zijn eigen eerder afgenomen, medicijnvrije urine hergebruikt. In dat geval past het steroïdepatroon perfect in zijn of haar historie, en als het monster in een ander laboratorium of lang na het oorspronkelijke monster wordt onderzocht, is er momenteel geen automatische manier om op te merken dat twee monsters wezenlijk identiek zijn.

Figure 1
Figuur 1.

Urinechemie omzetten in doorzoekbare patronen

De auteurs pakten dit probleem aan door zich te richten op de gedetailleerde “vingerafdruk” gevormd door een set natuurlijke steroïden en hun verhoudingen in urine. Ze verzamelden 67.651 steroïdeprofielen van een door het World Anti-Doping Agency (WADA) geaccrediteerd laboratorium, verzameld tussen 2021 en 2023, met zowel mannelijke als vrouwelijke atleten. Elk profiel bevat sleutelhormonen zoals testosteron en meerdere verwante verbindingen, plus verhoudingen ertussen. Omdat echte gevallen van hergebruik zeldzaam en vertrouwelijk zijn, combineerde het team deze real-world data met zorgvuldig geconstrueerde synthetische paren profielen: sommige paren werden “gelijk” gemaakt door kleine, realistische meetruis toe te voegen, en andere werden “ongelijk” gemaakt door willekeurig monsters van verschillende atleten te koppelen. Dit leverde gebalanceerd trainingsmateriaal op zodat een computermodel kon leren hoe “bijna identiek” er in de praktijk uitziet.

Hoe de slimme detector werkt

De kern van het systeem is een type kunstmatig neuraal netwerk dat bekendstaat als een convolutioneel netwerk, veelgebruikt in beeldherkenning. Hier is de invoer in plaats van plaatjes een paar steroïdeprofielen die naast elkaar zijn geplaatst. Het netwerk scant over de kenmerken om subtiele lokale verbanden op te pikken, zoals hoe twee hormonen en hun verhouding samen veranderen. Om de data beheersbaarder en interpreteerbaarder te maken, gebruikten de onderzoekers ook een techniek genaamd hoofdcomponentenanalyse (principal component analysis) om alle profielen in een driedimensionale ruimte te projecteren, waar eenvoudige afstandsmaatregelen dichtbij gelegen overeenkomsten kunnen benadrukken. Tijdens het trainen leert het netwerk een waarschijnlijkheid uit te geven dat twee profielen uit dezelfde onderliggende urine afkomstig zijn, waarbij echte gelijkenis wordt onderscheiden van de normale biologische verschillen tussen atleten en in de tijd.

De methode op de proef stellen

Het team evalueerde hun benadering op meerdere fronten. Allereerst testten ze het op achtergehouden data uit elk jaar, met profielen die tijdens de training niet waren gezien maar waren verstoord binnen de verwachte meetonzekerheid van 15%. Het convolutionele netwerk behaalde consequent zeer hoge nauwkeurigheid, identificeerde gelijkende paren correct en hield valse alarmen laag, en het presteerde beter dan meer traditionele methoden zoals logistische regressie, support vector machines en boomgebaseerde modellen. Vervolgens daagden ze het systeem uit met meer dan 800 “bevestigings”-monsters—echte urine­specimens die laboratoria onder iets andere procedures opnieuw hadden geanalyseerd. Deze vormen een realistische proxy voor herhaalde of hergebruikte monsters. Ook hier presteerde het netwerk uitstekend voor zowel mannen als vrouwen, met uitstekende sensitiviteit (echte overeenkomsten detecteren) en specificiteit (vals-positieven vermijden), wat suggereert dat het kan omgaan met echte laboratoriumruis en biologische variatie.

Figure 2
Figuur 2.

Wat dit betekent voor schone sport

Voor niet-specialisten is de belangrijkste conclusie dat het nu steeds haalbaarder wordt om automatisch enorme antidopingdatabases te scannen op aanwijzingen dat een vermeend nieuw urinemonster in feite een bijna perfecte kopie van een ouder monster is. Het voorgestelde machine-learningkader vervangt bestaande tests naar verboden stoffen niet; het voegt eerder een krachtig achtergrondonderzoek toe dat verdacht gelijkende monsters kan signaleren voor nader forensisch onderzoek. Hoewel de methode deels afhankelijk is van gesimuleerde data en complexe “black-box”-modellen gebruikt die niet volledig transparant zijn, biedt ze sportautoriteiten toch een praktisch nieuw instrument. Als het wordt geïntegreerd in bestaande Athlete Biological Passport-systemen, kan het de ooit ondetecteerbare truc van het hergebruiken van schone urine veel riskanter maken, en zo het vertrouwen versterken dat medailles op verdienste en niet op manipulatie berusten.

Bronvermelding: Rahman, M.R., Piper, T., Thevis, M. et al. Detection of sample swapping in anti-doping investigations using machine learning. Sci Rep 16, 9230 (2026). https://doi.org/10.1038/s41598-026-43502-y

Trefwoorden: antidoping, urine-steroïdeprofielen, samplewisseling, machine learning, sportintegriteit