Clear Sky Science · es

SwinCup-DiscNet: Un marco de transformadores de fusión para el diagnóstico de glaucoma usando características del disco y la copa ópticos

· Volver al índice

Por qué esto importa para salvar la visión

El glaucoma es una de las principales causas mundiales de ceguera irreversible, pero a menudo progresa de forma silenciosa, sin dolor ni señales tempranas. Los oftalmólogos pueden detectar cambios sutiles en la parte posterior del ojo antes de que se pierda la visión, pero hacerlo manualmente para cada paciente es lento y a veces inconsistentes. Este artículo presenta SwinCup-DiscNet, un nuevo sistema de inteligencia artificial (IA) que analiza fotografías retinianas para señalar el glaucoma de forma temprana, combinando pistas clínicas clásicas con aprendizaje profundo moderno.

Figure 1
Figure 1.

Mirando el nervio dentro del ojo

Para entender lo que hace el sistema, conviene saber cómo se detecta habitualmente el glaucoma. Los especialistas examinan la cabeza del nervio óptico, el punto por donde el nervio que transporta la información visual sale del ojo. En el centro de este «disco» hay una depresión más clara llamada «copa». A medida que progresa el glaucoma, la copa tiende a profundizarse y ensancharse, devorando el borde circundante de tejido nervioso. Un número clave es la relación copa-disco, que compara el tamaño de la copa con el del disco. Una relación más alta suele indicar daño. Medir esta relación a mano en miles de fotografías retinianas es tedioso, e incluso los expertos pueden discrepar. SwinCup-DiscNet automatiza tanto la medición de esta relación como el juicio global sobre si un ojo probablemente tiene glaucoma.

Una IA de dos vías que aprecia los detalles y la imagen global

El sistema sigue dos vías paralelas cuando recibe una imagen del fondo de ojo. Primero, una rama de segmentación aísla el disco óptico y la copa central. Emplea una red especializada conocida como Attention U-Net, que aprende a resaltar las estructuras importantes y a ignorar características de fondo distractoras, como vasos sanguíneos y artefactos de iluminación. Una vez identificados los límites de la copa y del disco, el sistema los suaviza y ajusta formas ovaladas limpias, luego mide sus tamaños verticales para calcular la relación vertical copa-disco, un marcador clínico de confianza para el glaucoma.

Aprendiendo patrones más allá de lo que el ojo puede medir

En la segunda vía, una rama basada en transformadores observa la imagen completa sin centrarse en un único número. Esta rama utiliza un Swin Transformer, un modelo moderno de aprendizaje profundo que divide la imagen en pequeños parches y analiza cómo se relacionan entre sí a lo largo de toda la retina. Al hacerlo, capta patrones sutiles en textura, color y estructura alrededor del nervio óptico y las regiones cercanas que pueden estar vinculados al glaucoma pero que son difíciles de cuantificar para los humanos. Desde esta visión global, el modelo genera una probabilidad de que la imagen provenga de una persona con glaucoma.

Figure 2
Figure 2.

Combinando pistas fiables con la intuición de la IA

El núcleo de SwinCup-DiscNet es la forma en que fusiona estas dos fuentes de evidencia. En lugar de confiar únicamente en la relación copa-disco o únicamente en la probabilidad del transformador, el sistema las mezcla usando una regla ponderada. La relación copa-disco se normaliza según su comportamiento en los datos de entrenamiento y se combina con la probabilidad de glaucoma aprendida por el modelo para obtener una puntuación única. Si esa puntuación fusionada supera un umbral, el ojo se clasifica como glaucomatoso; si no, se etiqueta como normal. Este diseño mantiene la decisión anclada en una medida clínica familiar mientras aprovecha los patrones más ricos que la IA puede detectar. El sistema también superpone los contornos ajustados del disco y la copa sobre la imagen original, ofreciendo a los médicos una visualización clara de la región que motivó la decisión.

Poniendo el método a prueba

Los autores evaluaron SwinCup-DiscNet en tres conjuntos de datos públicos ampliamente usados de imágenes retinianas: LAG, ACRIMA y DRISHTI-GS. Estas colecciones varían en tipo de cámara, calidad de imagen y mezcla de pacientes, lo que las convierte en una prueba exigente. En todos ellos, el nuevo sistema igualó o superó a redes convolucionales tradicionales y a métodos que solo segmentan la copa y el disco. Logró una calidad de segmentación muy alta, bajo error en la estimación de la relación copa-disco y precisiones de clasificación cercanas o superiores al 99 por ciento, con curvas de rendimiento sólidas que indican que rara vez confunde ojos sanos y enfermos. Un análisis de los errores mostró que la mayoría de las falsas alarmas restantes se dieron en casos fronterizos donde la copa óptica era naturalmente grande pero no realmente enferma, un compromiso que a menudo es aceptable en cribados.

Qué significa esto para el cribado oftalmológico futuro

En términos simples, SwinCup-DiscNet demuestra que la IA puede tanto «pensar como un médico» usando marcadores establecidos como la relación copa-disco, como «ver más allá de lo obvio» aprendiendo patrones complejos en imágenes retinianas. Al combinar estas fortalezas, el sistema ofrece un cribado de glaucoma preciso y más interpretable que muchos enfoques existentes. Con más pruebas en datos hospitalarios del mundo real y posibles extensiones para graduar la severidad de la enfermedad, este tipo de IA híbrida podría convertirse en un asistente práctico en clínicas oftalmológicas, ayudando a detectar el glaucoma antes y a prevenir ceguera evitable.

Cita: Chilukuri, R., Praveen, P., Gatla, R.K. et al. SwinCup-DiscNet: A fusion transformer framework for glaucoma diagnosis using optic disc and cup features. Sci Rep 16, 7920 (2026). https://doi.org/10.1038/s41598-026-39065-7

Palabras clave: glaucoma, imágenes retinianas, aprendizaje profundo, nervio óptico, cribado médico