Clear Sky Science · pt

SwinCup-DiscNet: Uma estrutura fusion transformer para diagnóstico de glaucoma usando características do disco e da escavação óptica

· Voltar ao índice

Por que isso importa para salvar a visão

O glaucoma é uma das principais causas mundiais de cegueira irreversível, mas muitas vezes avança silenciosamente, sem dor ou sinais precoces. Oftalmologistas podem detectar mudanças sutis na parte posterior do olho antes que a visão seja perdida, mas fazer isso manualmente para cada paciente é lento e às vezes inconsistente. Este artigo apresenta o SwinCup-DiscNet, um novo sistema de inteligência artificial (IA) que analisa fotografias de retina para sinalizar o glaucoma precocemente, combinando sinais clínicos clássicos com aprendizado profundo moderno.

Figure 1
Figure 1.

Observando o nervo dentro do olho

Para entender o que o sistema faz, é útil saber como o glaucoma é normalmente identificado. Especialistas em olhos examinam a cabeça do nervo óptico, o ponto onde o nervo que transporta a informação visual sai do olho. No centro desse “disco” há uma depressão mais clara chamada “escavação” ou “cup”. À medida que o glaucoma progride, a escavação tende a aprofundar-se e alargar-se, consumindo a borda circundante do tecido nervoso. Um número-chave é a razão cup-to-disc (escavação/disco), que compara o tamanho da escavação com o do disco. Uma razão maior frequentemente sinaliza dano. Medir essa razão manualmente em milhares de fotografias de retina é tedioso, e até especialistas podem discordar. O SwinCup-DiscNet automatiza tanto a medição dessa razão quanto o julgamento global sobre se um olho provavelmente tem glaucoma.

Uma IA de dupla via que vê detalhes e o panorama

O sistema segue duas vias paralelas quando recebe uma imagem de fundo de olho. Primeiro, um ramo de segmentação isola o disco óptico e a escavação central. Ele usa uma rede especializada conhecida como Attention U-Net, que aprende a destacar as estruturas importantes e ignorar características de fundo distrativas, como vasos sanguíneos e artefatos de iluminação. Depois de identificar os contornos da escavação e do disco, o sistema os suaviza e ajusta formas ovais limpas, em seguida mede seus tamanhos verticais para calcular a razão vertical cup-to-disc — um marcador clinicamente confiável de glaucoma.

Aprendendo padrões além do que o olho consegue medir

Na segunda via, um ramo baseado em transformer analisa a imagem inteira sem focar em um único número. Esse ramo usa um Swin Transformer, um modelo moderno de aprendizado profundo que divide a imagem em pequenos blocos e analisa como eles se relacionam por toda a retina. Ao fazer isso, capta padrões sutis em textura, cor e estrutura ao redor do nervo óptico e regiões próximas que podem estar ligados ao glaucoma, mas são difíceis de quantificar para humanos. A partir dessa visão global, o modelo produz uma probabilidade de que a imagem pertença a uma pessoa com glaucoma.

Figure 2
Figure 2.

Combinando pistas confiáveis com a intuição da IA

O cerne do SwinCup-DiscNet é como ele funde essas duas fontes de evidência. Em vez de confiar apenas na razão cup-to-disc ou apenas na probabilidade do transformer, o sistema as combina usando uma regra ponderada. A razão cup-to-disc é normalizada com base em seu comportamento nos dados de treinamento, e então combinada com a probabilidade aprendeda de glaucoma do modelo em um único escore. Se esse escore fundido ultrapassar um limiar, o olho é classificado como glaucomatoso; caso contrário, é rotulado como normal. Esse projeto mantém a decisão ancorada em uma medida clínica familiar, ao mesmo tempo em que aproveita os padrões mais ricos que a IA pode detectar. O sistema também sobrepõe os contornos ajustados do disco e da escavação na imagem original, oferecendo aos médicos uma visualização clara da região que motivou a decisão.

Colocando o método à prova

Os autores avaliaram o SwinCup-DiscNet em três conjuntos públicos amplamente usados de imagens retinianas: LAG, ACRIMA e DRISHTI-GS. Essas coleções variam em tipo de câmera, qualidade de imagem e perfil de pacientes, tornando-as um ambiente de teste exigente. Em todos eles, o novo sistema igualou ou superou redes convolucionais tradicionais e métodos que apenas segmentam a escavação e o disco. Alcançou qualidade de segmentação muito alta, baixo erro na estimativa da razão cup-to-disc e acurácias de classificação próximas ou acima de 99%, com curvas de desempenho que indicam raramente confundir olhos saudáveis e doentes. Uma análise dos erros mostrou que a maioria dos falsos positivos restantes ocorreu em casos-limite onde a escavação era naturalmente grande mas não verdadeiramente doente — uma troca frequentemente aceitável em triagens.

O que isso significa para a triagem ocular no futuro

Em termos simples, o SwinCup-DiscNet demonstra que a IA pode tanto “pensar como um médico” ao usar marcadores estabelecidos como a razão cup-to-disc quanto “ver além do óbvio” ao aprender padrões complexos em imagens retinianas. Ao combinar essas forças, o sistema oferece uma triagem de glaucoma mais precisa e mais interpretável do que muitas abordagens existentes. Com testes adicionais em dados hospitalares do mundo real e possíveis extensões para graduar a gravidade da doença, esse tipo de IA híbrida pode se tornar um assistente prático em clínicas oftalmológicas, ajudando a detectar o glaucoma mais cedo e a prevenir cegueira evitável.

Citação: Chilukuri, R., Praveen, P., Gatla, R.K. et al. SwinCup-DiscNet: A fusion transformer framework for glaucoma diagnosis using optic disc and cup features. Sci Rep 16, 7920 (2026). https://doi.org/10.1038/s41598-026-39065-7

Palavras-chave: glaucoma, imagens retinianas, aprendizado profundo, nervo óptico, triagem médica