Clear Sky Science · sv
Upptäckt av provbyte i antidopningsutredningar med maskininlärning
Varför det är viktigt att fånga kloka fuskare
Elitidrott bygger på förtroende: när en idrottare vinner vill vi tro att resultatet är rent. Moderna drogtester är mycket känsliga, men vissa idrottare försöker överlista dem genom att i hemlighet byta ut urinprov. Denna studie visar hur maskininlärning kan upptäcka när en idrottare återanvänder ett tidigare insamlat ”rent” prov — ett knep som idag är extremt svårt att fånga med rutinkontroller. Arbetet pekar på nya sätt att skydda rättvis konkurrens genom att tyst skanna stora testdatabaser efter dold bevisning på manipulation.
En dold kryphål i nuvarande testning
Antidopningslaboratorier testar vanligtvis urin eftersom många förbjudna substanser och deras nedbrytningsprodukter är detekterbara där under lång tid. Idrottarprofiler av naturliga steroidhormoner följs över år i Athlete Biological Passport, så ett plötsligt hopp i dessa värden kan utlösa en utredning. Att byta in någon annans urin stör detta långsiktiga mönster och är ofta upptäckbart. Det verkliga blinda fältet uppstår när en idrottare i hemlighet återanvänder sitt eget tidigare, drogfri urin. I det fallet passar steroidmönstret perfekt in i deras historik, och om provet testas i ett annat laboratorium eller långt efter det ursprungliga finns det för närvarande inget automatiskt sätt att märka att två prover i praktiken är samma.

Att omvandla urinkemi till sökbara mönster
Författarna angrep problemet genom att fokusera på det detaljerade ”fingeravtryck” som bildas av en uppsättning naturliga steroider och deras kvoter i urin. De samlade 67 651 steroidprofiler från ett World Anti-Doping Agency (WADA)–ackrediterat laboratorium insamlade mellan 2021 och 2023, som täcker både manliga och kvinnliga idrottare. Varje profil innehåller nyckelhormoner såsom testosteron och flera relaterade föreningar, plus kvoter mellan dem. Eftersom verkliga fall av återanvänt provmaterial är sällsynta och konfidentiella kombinerade teamet dessa verkliga data med noggrant framtagna syntetiska par av profiler: några par gjordes ”lika” genom att lägga till små, realistiska mätstörningar, och andra gjordes ”olik” genom att slumpmässigt para ihop prover från olika idrottare. Detta gav balanserat träningsmaterial för en dator att lära sig vad ”nästan identiskt” verkligen ser ut som i praktiken.
Hur den smarta detektorn fungerar
Kärnan i systemet är en typ av artificiellt neuralt nätverk känt som ett konvolutionsnätverk, brett använt inom bildigenkänning. Här är indata, istället för bilder, ett par steroidprofiler placerade sida vid sida. Nätverket skannar över funktionerna för att plocka upp subtila lokala relationer, såsom hur två hormoner och deras kvot rör sig tillsammans. För att göra datan mer hanterbar och tolkbar använde forskarna även en teknik kallad principal component analysis för att projicera alla profiler i ett tredimensionellt utrymme, där enkla avståndsmått kan framhäva nära matchningar. Under träningen lär sig nätverket att ge en sannolikhet för att två profiler kommer från samma underliggande urin, och skilja verklig likhet från normala biologiska skillnader mellan idrottare och över tid.
Sätta metoden på prov
Teamet utvärderade sitt tillvägagångssätt på flera fronter. Först testade de på hållna bort data från varje år, med profiler som inte setts under träningen men som störts inom den förväntade mätosäkerheten på 15 %. Konvolutionsnätverket uppnådde konsekvent mycket hög noggrannhet, identifierade korrekta likheter samtidigt som falska larm hölls låga, och det överträffade mer traditionella metoder som logistisk regression, support vector machines och träd-baserade modeller. Därefter utmanade de systemet med mer än 800 ”bekräftelse”prover — verkliga urinprov som laboratorier hade omanalyserat under något annorlunda procedurer. Dessa utgör en realistisk motsvarighet till upprepade eller återanvända prover. Återigen presterade nätverket mycket bra för både män och kvinnor, med utmärkt känslighet (fånga verkliga matchningar) och specificitet (undvika felaktiga sådana), vilket antyder att det klarar verkligt laboratoriestörningar och biologisk variation.

Vad detta betyder för ren idrott
För icke-specialister är huvudbudskapet att det nu blir möjligt att automatiskt skanna omfattande antidopingdatabaser efter tecken på att ett påstått nytt urinprov i själva verket är en nästintill perfekt kopia av ett äldre prov. Det föreslagna maskininlärningsramverket ersätter inte befintliga tester för förbjudna ämnen; istället lägger det till en kraftfull bakgrundskontroll som kan flagga misstänkt lika prover för närmare rättsmedicinsk granskning. Även om metoden delvis bygger på simulerade data och använder komplexa ”black-box”-modeller som inte är helt genomskinliga, erbjuder den ändå idrottsmyndigheter ett praktiskt nytt verktyg. Om den integreras i nuvarande Athlete Biological Passport-system kan den göra den tidigare oupptäckbara taktiken att återanvända rent urin avsevärt riskablare och stärka förtroendet för att medaljer förtjänas genom prestation snarare än manipulation.
Citering: Rahman, M.R., Piper, T., Thevis, M. et al. Detection of sample swapping in anti-doping investigations using machine learning. Sci Rep 16, 9230 (2026). https://doi.org/10.1038/s41598-026-43502-y
Nyckelord: antidopning, urin-steroidprofiler, provbyte, maskininlärning, idrottsintegritet