Clear Sky Science · pt

Um modelo vision transformer para a detecção de glaucoma a partir de fotografias do disco óptico

2026-03-24 · Voltar ao índice

Por que isso importa para a visão do dia a dia

O glaucoma é uma das principais causas de cegueira permanente no mundo, mas muitas vezes avança silenciosamente até que a visão já esteja bastante comprometida. A boa notícia é que fotografias simples do fundo do olho são amplamente disponíveis, mesmo em clínicas com equipamento limitado. Este estudo investiga se um programa computacional avançado pode olhar essas imagens e identificar de forma confiável sinais precoces de glaucoma, muito antes de a maioria das pessoas perceber problemas.

Uma ameaça silenciosa à visão

O glaucoma danifica gradualmente o nervo óptico, o feixe de fibras que transporta sinais visuais do olho para o cérebro. Os médicos procuram mudanças no disco óptico, o ponto onde esse nervo sai do olho, mas interpretar essas formas sutis é difícil e até especialistas frequentemente discordam. Muitas regiões do mundo também não têm especialistas oculares suficientes para rastrear grandes populações. Como resultado, acredita-se que cerca de metade dos casos de glaucoma no mundo não é diagnosticada, especialmente em países de baixa e média renda, e muitas pessoas só descobrem que têm a doença depois de já terem perdido boa parte da visão.

Ensinando um computador a ler fotos do olho

Os pesquisadores reuniram mais de mil fotografias do disco óptico de pessoas com glaucoma inicial tratadas em um centro oftalmológico dos EUA, além de centenas de fotos de olhos saudáveis vindas de dois bancos de imagens públicos. Especialistas em glaucoma classificaram cada imagem como glaucomatosa ou saudável com base apenas na aparência do nervo óptico, excluindo olhos com outros problemas retinianos. A equipe cortou cada imagem para que o disco óptico ocupasse uma porção similar do quadro e usou verificações cuidadosas de qualidade e ajustes realistas nas imagens, como pequenas rotações, zooms e desfoque, para ampliar o conjunto de treinamento sem perder a fidelidade às condições do mundo real.

Figure 1. Sistema de IA analisa fotos simples do olho para distinguir à primeira vista nervos ópticos saudáveis de glaucomatosos.

Um novo tipo de rede neural

Em vez de depender de sistemas tradicionais de análise de imagem, a equipe construiu seu modelo sobre um "vision transformer", uma família mais recente de ferramentas de aprendizado profundo originalmente desenvolvida para reconhecer objetos em fotografias do cotidiano. Esse modelo divide cada imagem do disco óptico em muitos pequenos blocos, representa cada bloco como um token de dados e então usa camadas de blocos de atenção para ponderar como diferentes regiões do disco se relacionam entre si. A rede produz uma pontuação entre 0 e 1 que reflete a probabilidade de o olho ter glaucoma, com pontuações iguais ou superiores a 0,5 contadas como positivas. Para aproveitar ao máximo os dados disponíveis, os pesquisadores usaram amostragem balanceada, funções de perda ponderadas e validação cruzada, e compararam o transformer com uma forte rede convolucional chamada EfficientNet.

Figure 2. A foto do olho é dividida em blocos que passam por processamento em camadas para separar discos ópticos saudáveis dos danificados.

Quão bem o sistema detectou a doença precoce

Ao ser testado em imagens que não havia visto antes, o modelo vision transformer separou quase perfeitamente olhos glaucomatosos dos saudáveis. Sua principal medida de desempenho, a área sob a curva ROC, foi 1,00 no conjunto de teste, com acurácia em torno de 99%, sensibilidade muito alta e especificidade muito alta. Em termos práticos, o sistema deixou escapar quase nenhum caso de glaucoma e rotulou muito poucos olhos saudáveis como doentes. Quando os pesquisadores depois desafiaram o modelo com quase mil olhos com glaucoma moderado a avançado, ele identificou corretamente todos menos um. O transformer também superou a abordagem baseada em EfficientNet, que apresentou menor acurácia e mais falsos positivos e falsos negativos.

O que isso pode significar para o cuidado ocular

Como o modelo funciona com fotografias padrão do disco óptico e foi treinado em um grupo racialmente diverso de pacientes, ele oferece uma visão realista de como a inteligência artificial pode ajudar a rastrear o glaucoma em muitas partes do mundo. Os autores alertam que o estudo usou um tamanho de amostra geral menor do que alguns outros e se apoiou em conjuntos de dados externos para muitos controles saudáveis, o que pode introduzir vieses ocultos. Eles defendem que coleções de imagens maiores e mais variadas, imagens capturadas com câmeras portáteis e a inclusão de informações básicas do paciente, como idade ou grau de miopia, serão passos importantes seguintes. Ainda assim, suas descobertas sugerem que uma análise inteligente de fotos simples do olho pode se tornar uma forma custo-efetiva de detectar o glaucoma cedo e reduzir cegueiras evitáveis, especialmente onde há escassez de especialistas.

Mensagem principal para os leitores

Este trabalho mostra que um modelo computacional avançado pode aprender a identificar as marcas iniciais do glaucoma a partir de fotografias rotineiras do nervo óptico com precisão muito alta. Embora sejam necessários mais testes em clínicas do mundo real, essas ferramentas podem um dia ajudar os médicos a separar rapidamente grandes números de pacientes entre os que precisam de atendimento oftalmológico urgente e os que não precisam, tornando a proteção precoce da visão mais acessível globalmente.

Citação: Bouris, E., Leyva, B.K., Odugbo, O.P. et al. A vision transformer model for the detection of glaucoma from optic disc photographs. Sci Rep 16, 14831 (2026). https://doi.org/10.1038/s41598-026-44662-7

Palavras-chave: triagem de glaucoma, fotografia do disco óptico, aprendizado profundo, vision transformer, saúde ocular