Clear Sky Science · es

Marco híbrido en dos etapas LASSO–HHO para la selección de genes y un diagnóstico preciso de la enfermedad de Alzheimer

2026-04-24 · Volver al índice

Por qué esta investigación importa para la salud cerebral

La enfermedad de Alzheimer priva a las personas de la memoria y la independencia, y aún carecemos de herramientas sencillas y ampliamente disponibles para detectarla de forma temprana. Las técnicas modernas de laboratorio pueden medir la actividad de decenas de miles de genes en una pequeña muestra de tejido cerebral o sangre, pero ese alud de datos resulta difícil de convertir en respuestas claras de sí o no para los médicos. Este artículo presenta un método inteligente, en dos pasos, para cribar esa información genética y seleccionar un conjunto muy reducido de genes que pueden diagnosticar la enfermedad de Alzheimer con una precisión extremadamente alta, manteniendo el método lo bastante rápido y práctico para su uso en el mundo real.

Convertir un pajar de genes en unas pocas pistas

Cada conjunto de datos de expresión génica de Alzheimer utilizado en este estudio contiene más de 20 000 genes pero solo unos pocos cientos de pacientes. Ese desequilibrio es como intentar identificar a una persona a partir de miles de preguntas, con respuestas de solo un pequeño grupo de voluntarios: es fácil interpretar en exceso el ruido aleatorio. Los autores abordan esto aplicando primero una técnica llamada LASSO, que funciona como un filtro potente. Reduce la mayoría de las señales génicas a cero y conserva solo las que realmente ayudan a distinguir a las personas con Alzheimer de los controles sanos. Por sí sola, esta primera pasada suele reducir la lista de genes en más del 99 %, disminuyendo drásticamente la complejidad y la probabilidad de sobreajuste, mientras conserva suficiente información para predecir la enfermedad.

Una segunda pasada inteligente cuando es necesaria

Tras esta poda inicial, el marco lanza condicionalmente un segundo paso basado en una estrategia de búsqueda inspirada en la naturaleza llamada Harris Hawks Optimization. Aquí, cada “halcón” representa un posible subconjunto de genes, y los halcones ajustan repetidamente sus posiciones para buscar combinaciones que lleven a un mejor diagnóstico. Crucialmente, este paso no se usa siempre. Si LASSO por sí solo ya alcanza al menos el 99 % de precisión y el conjunto de genes seleccionado tiene menos de 40 genes, el proceso se detiene ahí. De lo contrario, la búsqueda basada en halcones refina aún más los genes supervivientes, guiada por una regla de puntuación que recompensa fuertemente la alta precisión diagnóstica pero que sigue prefiriendo un número reducido de genes. Este diseño adaptable evita desperdiciar tiempo de cómputo cuando la solución más simple ya es suficientemente buena.

Poner el método a prueba

Los autores evaluaron su marco —denominado LHGS— en cuatro conjuntos de datos públicos de Alzheimer procedentes de diferentes regiones cerebrales y grupos de investigación. Entrenaron un clasificador estándar de aprendizaje automático llamado máquina de vectores de soporte usando únicamente los genes seleccionados, y evaluaron el rendimiento con medidas comunes como precisión, exactitud y sensibilidad. En algunos conjuntos de datos, LASSO por sí solo fue suficiente para alcanzar una precisión perfecta o casi perfecta: un conjunto de datos necesitó solo tres genes para separar correctamente todas las muestras de Alzheimer y las sanas. En conjuntos de datos más difíciles, añadir la búsqueda basada en halcones mejoró la precisión hasta el 100 % manteniendo el conjunto final en torno a entre 11 y 37 genes. En comparación con una variedad de otros métodos de optimización populares, el enfoque en dos etapas fue tanto más preciso como mucho más rápido, porque la búsqueda intensa ocurre solo en el espacio drásticamente reducido creado por LASSO.

Descubriendo marcadores génicos prometedores

Más allá de construir un buen predictor, el estudio también destaca genes concretos que pueden ser especialmente relevantes en la biología del Alzheimer. Al analizar cuánto contribuyó cada gen en la fase LASSO, los autores identificaron una lista corta de genes consistentemente influyentes en cada conjunto de datos. Algunos, como TRPM7 y genes implicados en la señalización del estrés, el control de la inflamación y la comunicación sináptica, ya están vinculados a la salud cerebral y la neurodegeneración. Otros son menos conocidos, lo que sugiere nuevas direcciones para estudios de laboratorio. El hecho de que se pueda lograr un diagnóstico fiable con solo unas pocas decenas o incluso unos pocos genes sugiere que en el futuro las pruebas podrían centrarse en paneles pequeños y específicos en lugar de arrays amplios y costosos.

Qué significa esto para el diagnóstico futuro del Alzheimer

Para un lector no especialista, el mensaje principal es que se está volviendo posible leer la “firma” molecular del Alzheimer a partir de un número sorprendentemente pequeño de genes, escogidos entre decenas de miles mediante un cuidadoso proceso en dos pasos. El marco LHGS demuestra que podemos combinar un filtro estadístico rápido con una segunda pasada selectiva para obtener tanto precisión como velocidad, lo que hace el enfoque más adecuado para herramientas clínicas futuras. Aunque los autores advierten que sus resultados necesitan confirmación en grupos de pacientes más amplios y variados, y que experimentos anteriores pueden haber sobreestimado ligeramente el rendimiento, el trabajo apunta hacia pruebas genéticas en sangre o tejido que podrían señalar la enfermedad de Alzheimer temprano usando un conjunto compacto y bien seleccionado de marcadores génicos.

Cita: Asiry, O., El-Gawady, A., Eltoukhy, M.M. et al. LASSO–HHO two-stage hybrid gene selection framework for accurate Alzheimer’s disease diagnosis. Sci Rep 16, 13393 (2026). https://doi.org/10.1038/s41598-026-48742-6

Palabras clave: Diagnóstico del Alzheimer, expresión génica, selección de características, aprendizaje automático, biomarcadores