Clear Sky Science · es
Un modelo vision transformer para la detección de glaucoma a partir de fotografías del disco óptico
Por qué esto importa para la vista cotidiana
El glaucoma es una de las principales causas de ceguera permanente en todo el mundo, y a menudo avanza sin síntomas hasta que la visión ya está gravemente afectada. La buena noticia es que las fotografías sencillas del fondo de ojo están ampliamente disponibles, incluso en clínicas con equipamiento limitado. Este estudio explora si un programa informático avanzado puede analizar esas imágenes y detectar de forma fiable señales tempranas de glaucoma, mucho antes de que la mayoría de las personas noten problemas.
Una amenaza silenciosa para la vista
El glaucoma daña lentamente el nervio óptico, el haz de fibras que transmite las señales visuales desde el ojo al cerebro. Los médicos buscan cambios en el disco óptico, el punto por donde sale este nervio del ojo, pero interpretar estas formas sutiles es difícil y aun los expertos con frecuencia discrepan. Muchas regiones del mundo también carecen de suficientes especialistas en oftalmología para examinar grandes poblaciones. Como resultado, se estima que aproximadamente la mitad de los casos de glaucoma en el mundo no son diagnosticados, especialmente en países de ingresos bajos y medios, y muchas personas solo descubren que tienen la enfermedad tras haber perdido una parte considerable de su visión.
Enseñar a un ordenador a leer fotos del ojo
Los investigadores reunieron más de mil fotografías del disco óptico de personas con glaucoma en fase temprana tratadas en un centro oftalmológico de EE. UU., junto con cientos de fotos de ojos sanos procedentes de dos bases de imágenes públicas. Especialistas en glaucoma calificaron cada imagen como glaucomatosa o sana basándose únicamente en la apariencia del nervio óptico, excluyendo ojos con otros problemas retinianos. El equipo recortó cada imagen para que el disco óptico ocupara una porción similar del encuadre y aplicó controles de calidad rigurosos y ajustes realistas de la imagen, como ligeras rotaciones, zooms y desenfoque, para ampliar el conjunto de entrenamiento manteniendo la fidelidad a condiciones del mundo real. 
Un nuevo tipo de red neuronal
En lugar de apoyarse en sistemas tradicionales de análisis de imágenes, el equipo construyó su modelo sobre un "vision transformer", una familia más reciente de herramientas de aprendizaje profundo desarrolladas originalmente para reconocer objetos en fotografías cotidianas. Este modelo divide cada imagen del disco óptico en muchos pequeños parches, representa cada parche como un token de datos y luego utiliza capas de bloques de atención para ponderar cómo distintas regiones del disco se relacionan entre sí. La red devuelve una puntuación entre 0 y 1 que refleja la probabilidad de que el ojo tenga glaucoma, considerando positivos los valores iguales o superiores a 0,5. Para aprovechar al máximo los datos disponibles, los investigadores usaron muestreo balanceado, funciones de pérdida ponderadas y validación cruzada, y compararon el transformer con una potente red convolucional llamada EfficientNet. 
Qué tan bien detectó la enfermedad temprana
Cuando se probó con imágenes que no había visto antes, el modelo vision transformer separó casi perfectamente ojos glaucomatosos de ojos sanos. Su medida principal de rendimiento, el área bajo la curva ROC, fue 1,00 en el conjunto de prueba, con una precisión cercana al 99 por ciento, muy alta sensibilidad y una especificidad muy alta. En términos prácticos, el sistema casi no pasó por alto casos de glaucoma y etiquetó muy pocos ojos sanos como enfermos. Cuando los investigadores retaron posteriormente al modelo con casi mil ojos con glaucoma moderado a avanzado, identificó correctamente a todos menos uno. El transformer también superó al enfoque basado en EfficientNet, que mostró menor precisión y más falsas alarmas y fallos.
Qué podría significar esto para la atención ocular
Dado que el modelo funciona con fotografías estándar del disco óptico y se entrenó con un grupo de pacientes racialmente diverso, ofrece una visión realista de cómo la inteligencia artificial podría ayudar en el cribado de glaucoma en muchas partes del mundo. Los autores advierten que su estudio utilizó un tamaño muestral global menor que otros trabajos y dependió de conjuntos de datos externos para muchos controles sanos, lo que podría introducir sesgos ocultos. Señalan que colecciones de imágenes más grandes y variadas, fotografías capturadas con cámaras portátiles e inclusión de información básica del paciente, como edad o grado de miopía, serán pasos importantes a seguir. Aun así, sus hallazgos sugieren que el análisis inteligente de fotos oculares simples podría convertirse en una forma rentable de detectar el glaucoma a tiempo y reducir la ceguera evitable, especialmente donde los especialistas escasean.
Mensaje clave para los lectores
Este trabajo muestra que un modelo informático avanzado puede aprender a identificar las huellas iniciales del glaucoma a partir de fotografías rutinarias del nervio óptico con una precisión muy alta. Aunque se necesitan más pruebas en clínicas reales, estas herramientas podrían en el futuro ayudar a los médicos a clasificar rápidamente a grandes cantidades de pacientes entre los que requieren atención ocular urgente y los que no, haciendo la protección temprana de la visión más accesible en todo el mundo.
Cita: Bouris, E., Leyva, B.K., Odugbo, O.P. et al. A vision transformer model for the detection of glaucoma from optic disc photographs. Sci Rep 16, 14831 (2026). https://doi.org/10.1038/s41598-026-44662-7
Palabras clave: cribado de glaucoma, fotografía del disco óptico, aprendizaje profundo, vision transformer, salud ocular