Clear Sky Science · es

De datos a descubrimiento: El auge de los modelos predictivos informacionales en el desarrollo de fármacos

· Volver al índice

Por qué importa acelerar el descubrimiento de fármacos

Muchas enfermedades graves aún carecen de tratamientos efectivos, y aun cuando se encuentran medicamentos prometedores, el camino desde la idea hasta la estantería de la farmacia es largo y costoso. Este artículo explora cómo modelos informáticos más inteligentes pueden cribar enormes colecciones de datos químicos y biológicos para identificar con mayor rapidez y fiabilidad unos pocos candidatos farmacológicos prometedores. Tomando prestadas ideas de la teoría de la información —la rama matemática que mide cuánto podemos aprender a partir de los datos—, los autores muestran una forma de acotar la búsqueda de nuevos fármacos y comprender mejor qué hace que una molécula sea probable que funcione en el organismo.

Del ensayo y error al diseño guiado por datos

El descubrimiento tradicional de fármacos se ha apoyado en una mezcla de intuición informada, cribados de laboratorio y, a veces, accidentes afortunados como el hallazgo de la penicilina. Hoy, los investigadores pueden evaluar millones de compuestos en ordenador antes de tocar nunca un tubo de ensayo. Las herramientas de cribado virtual clasifican las moléculas según su comportamiento biológico previsto, ayudando a los científicos a centrarse en las más prometedoras. Sin embargo, muchas herramientas existentes tratan cada molécula de forma aislada o sólo dan estimaciones probabilísticas groseras, y con frecuencia tienen dificultades para captar cómo el contexto biológico real —por ejemplo, la manera en que un fármaco se distribuye en el cuerpo— condiciona el éxito o el fracaso.

Figure 1
Figure 1.

Una nueva forma de leer las huellas biológicas

Los autores analizan un gran conjunto de datos público de resultados de cribado biológico para moléculas dirigidas a un receptor de péptidos formilo, una proteína implicada en la inflamación y las defensas inmunitarias. Cada muestra incluye decenas de características medibles, o “descriptores”, como el tamaño molecular, su facilidad para disolverse en grasa o en agua, la capacidad de atravesar la barrera hematoencefálica y la aptitud para formar enlaces de hidrógeno. En lugar de escribir ecuaciones fijas sobre cómo deberían comportarse estas características, el equipo utiliza un sistema automatizado llamado Eidos, que construye modelos predictivos basados en la teoría de la información directamente a partir de los datos. Estos modelos, denominados análisis ASC (sistema automatizado-cognitivo), aprenden cómo las combinaciones de características se relacionan con que una muestra resulte activa (potencialmente útil) o inactiva en las pruebas biológicas.

Limpiar los datos y elegir lo que importa

Los datos de cribado del mundo real son ruidosos: las mediciones pueden ser inconsistentes y algunas muestras pueden no encajar en ningún patrón claro. El sistema Eidos filtra primero estos “artefactos”, eliminando más de mil entradas cuestionables y conservando poco más de dos mil muestras fiables. A continuación examina más de 300 características para ver cuáles ayudan realmente a distinguir entre muestras activas e inactivas. Utilizando conceptos de la teoría de la información, cada característica recibe una puntuación basada en cuánto reduce la incertidumbre sobre el resultado. El análisis revela que solo una minoría de características aporta la mayor parte de la información útil, lo que significa que los investigadores pueden ignorar muchas mediciones y aun así conservar casi todo el poder predictivo. Esta reducción hace que los modelos sean más simples, más fáciles de interpretar y más rápidos de ejecutar.

Figure 2
Figure 2.

Encontrar ganadores raros en un mar de fracasos

En el conjunto de datos estudiado, solo alrededor del 1,4 % de las moléculas son realmente activas, lo que hace difícil detectar los pocos éxitos entre miles de fracasos. Los modelos basados en ASC construyen automáticamente “retratos de información” que muestran con qué intensidad cada característica y combinación de características empuja a una muestra hacia el estado activo o inactivo. De más de tres mil muestras originales, el sistema destaca únicamente dos que sobresalen como candidatas altamente fiables para fármacos dirigidos al receptor de péptidos formilo, con una fiabilidad del modelo que se aproxima al 99,9 % en pruebas retrospectivas. Diagramas de redes visuales muestran qué características moleculares respaldan con más fuerza un estado activo, ofreciendo a los científicos un mapa interpretable de lo que impulsa un comportamiento prometedor.

Cómo se compara este enfoque y qué sigue

Los autores comparan su método con herramientas populares de predicción en etapas tempranas como pkCSM, SwissADME y ADMETlab, que estiman cómo se absorbe, distribuye, metaboliza y excreta un fármaco. Mientras que esos sistemas dependen principalmente de reglas predefinidas o de aprendizaje automático de uso general, el marco ASC mide explícitamente cuánto contribuye cada característica al conocimiento ganado sobre el comportamiento tipo fármaco y puede simular cambios en el contexto biológico. Al mismo tiempo, el estudio señala límites: el conjunto de datos es relativamente pequeño y está fuertemente desequilibrado, y el método hasta ahora se ha aplicado a un único receptor. Los autores sugieren que versiones futuras podrían combinar modelos ASC con aprendizaje profundo y ampliarse a múltiples objetivos.

Qué significa esto para futuros medicamentos

En términos prácticos, este trabajo muestra que los modelos ricos en información pueden convertir datos de cribado desordenados en predicciones claras y verificables sobre qué moléculas merecen más atención. Al limpiar los datos automáticamente, ordenar la importancia de las características y destacar compuestos raros pero prometedores, el enfoque puede reducir el tiempo y el coste necesarios para llegar al laboratorio y, eventualmente, a la clínica. Aunque no sustituye a los estudios en animales ni a los ensayos en humanos, actúa como un filtro y una guía potentes, ayudando a los científicos a avanzar de los datos en bruto a posibles terapias de forma más eficiente y con mayor confianza.

Cita: Saied, H., Alfahad, O., Aljaffer, A.A. et al. From data to discovery: The rise of information-theoretic predictive models in drug development. Sci Rep 16, 12857 (2026). https://doi.org/10.1038/s41598-026-45644-5

Palabras clave: descubrimiento de fármacos, cribado virtual, modelado predictivo, datos de bioensayos, receptor de péptidos formilo