Clear Sky Science · es

Detección de intercambio de muestras en investigaciones antidopaje mediante aprendizaje automático

· Volver al índice

Por qué importa atrapar a los tramposos ingeniosos

El deporte de élite se basa en la confianza: cuando un atleta gana, queremos creer que el resultado es limpio. Las pruebas modernas de detección de drogas son muy sensibles, pero algunos atletas intentan eludirlas intercambiando muestras de orina de forma clandestina. Este estudio muestra cómo el aprendizaje automático puede detectar cuando un atleta reutiliza una muestra previa “limpia”, un truco extremadamente difícil de identificar con los controles rutinarios actuales. El trabajo señala nuevas formas de proteger el juego limpio mediante el análisis silencioso de enormes bases de datos de control en busca de pruebas ocultas de manipulación.

Una laguna oculta en las pruebas actuales

Los laboratorios antidopaje suelen analizar la orina, porque muchas sustancias prohibidas y sus metabolitos permanecen detectables allí durante mucho tiempo. Los perfiles de hormonas esteroides naturales de los atletas se siguen durante años en el Pasaporte Biológico del Deportista, de modo que un salto repentino en estos valores puede desencadenar una investigación. Intercambiar la orina por la de otra persona altera este patrón a largo plazo y suele ser detectable. El verdadero punto ciego surge cuando un atleta reutiliza en secreto su propia orina anterior, libre de sustancias. En ese caso, el patrón de esteroides encaja perfectamente en su historial y, si la muestra se analiza en otro laboratorio o mucho tiempo después de la original, actualmente no existe una forma automática de advertir que dos muestras son esencialmente la misma.

Figure 1
Figura 1.

Convertir la química de la orina en patrones buscables

Los autores abordaron este problema centrándose en la detallada “huella” formada por un conjunto de esteroides naturales y sus ratios en orina. Reunieron 67.651 perfiles de esteroides de un laboratorio acreditado por la Agencia Mundial Antidopaje (WADA) recogidos entre 2021 y 2023, que abarcan atletas masculinos y femeninos. Cada perfil contiene hormonas clave como la testosterona y varios compuestos relacionados, además de sus relaciones. Dado que los casos reales de reutilización de muestras son raros y confidenciales, el equipo combinó estos datos del mundo real con pares sintéticos cuidadosamente creados: algunos pares se hicieron “similares” añadiendo un pequeño ruido de medición realista, y otros se hicieron “diferentes” emparejando aleatoriamente muestras de distintos atletas. Esto proporcionó material de entrenamiento equilibrado para que un modelo informático aprendiera cómo se ve en la práctica un “casi idéntico”.

Cómo funciona el detector inteligente

El núcleo del sistema es un tipo de red neuronal artificial conocida como red convolucional, ampliamente utilizada en el reconocimiento de imágenes. Aquí, en lugar de fotografías, la entrada es un par de perfiles de esteroides dispuesto uno junto al otro. La red explora las características para captar relaciones locales sutiles, como cómo se correlacionan dos hormonas y su ratio. Para hacer los datos más manejables e interpretables, los investigadores también emplearon una técnica llamada análisis de componentes principales para proyectar todos los perfiles en un espacio tridimensional, donde medidas de distancia simples pueden resaltar coincidencias cercanas. Durante el entrenamiento, la red aprende a emitir una probabilidad de que dos perfiles procedan de la misma orina subyacente, distinguiendo la similitud real de las diferencias biológicas normales observadas entre atletas y a lo largo del tiempo.

Poner el método a prueba

El equipo evaluó su enfoque en varios frentes. Primero, lo probaron con datos reservados de cada año, usando perfiles que no se habían visto durante el entrenamiento pero que se perturbaron dentro de la incertidumbre de medición esperada del 15%. La red convolucional consiguió de forma consistente una precisión muy alta, identificando correctamente los pares similares y manteniendo bajas las falsas alarmas, y superó a métodos más tradicionales como la regresión logística, las máquinas de vectores de soporte y modelos basados en árboles. A continuación, desafiaron al sistema con más de 800 muestras de “confirmación”: especímenes de orina reales que los laboratorios habían reanalizado con procedimientos ligeramente distintos. Estas actúan como un sustituto realista de muestras repetidas o reutilizadas. De nuevo, la red funcionó muy bien tanto en hombres como en mujeres, con excelente sensibilidad (detectar coincidencias reales) y especificidad (evitar falsos positivos), lo que sugiere que puede afrontar el ruido real de laboratorio y la variación biológica.

Figure 2
Figura 2.

Qué significa esto para el deporte limpio

Para el público general, la conclusión clave es que ahora resulta factible analizar automáticamente vastas bases de datos antidopaje en busca de señales de que una muestra de orina supuestamente nueva es, de hecho, una copia casi perfecta de otra anterior. El marco de aprendizaje automático propuesto no sustituye las pruebas existentes para sustancias prohibidas; en su lugar, añade una verificación de fondo potente que puede marcar muestras sospechosamente similares para una revisión forense más minuciosa. Aunque el método depende en parte de datos simulados y utiliza modelos complejos de “caja negra” que no son completamente transparentes, sigue ofreciendo a las autoridades deportivas una herramienta práctica nueva. Si se integra en los sistemas actuales del Pasaporte Biológico del Deportista, podría hacer que el truco de reutilizar orina limpia, antes indetectable, sea mucho más arriesgado, fortaleciendo la confianza en que las medallas se ganan por mérito y no por manipulación.

Cita: Rahman, M.R., Piper, T., Thevis, M. et al. Detection of sample swapping in anti-doping investigations using machine learning. Sci Rep 16, 9230 (2026). https://doi.org/10.1038/s41598-026-43502-y

Palabras clave: antidopaje, perfiles de esteroides en orina, intercambio de muestras, aprendizaje automático, integridad deportiva