Clear Sky Science · pt

RDE-DR: ensembles profundos robustos de CNNs para detecção automatizada de retinopatia diabética a partir de imagens de fundo de olho

2026-05-17 · Voltar ao índice

Por que exames oculares importam para pessoas com diabetes

A retinopatia diabética é uma complicação do diabetes que danifica lentamente o tecido sensível à luz na parte posterior do olho. Quando detectada cedo, muitas vezes pode ser tratada antes que a visão seja perdida. Mas revisar manualmente milhares de fotografias da retina consome muito tempo dos especialistas. Este estudo explora como uma mistura bem projetada de modelos de inteligência artificial pode ajudar a triagem dessas imagens de modo mais confiável, para que pessoas em risco sejam sinalizadas mais cedo e pacientes saudáveis evitem acompanhamentos desnecessários.

Figure 1. Como modelos de IA combinados triagem fotos oculares para sinalizar danos diabéticos de forma mais confiável.

Procurando sinais de alerta em fotografias do olho

Os pesquisadores focam em fotografias coloridas da retina, conhecidas como imagens de fundo de olho, de uma coleção pública chamada conjunto de dados APTOS 2019. Essas imagens mostram pequenos vasos sanguíneos e pontos de sangramento ou vazamento que indicam dano diabético. A equipe converte as cinco classificações médicas originais em uma pergunta mais simples e relevante para triagem em larga escala: este olho apresenta alguma retinopatia diabética ou não. Isso transforma a tarefa em uma decisão sim/não que um sistema automatizado poderia tomar rapidamente para milhares de pacientes.

Tornando detalhes ocultos mais fáceis de ver para computadores

Fotografias oculares do mundo real variam muito em nitidez, brilho e cor, o que pode confundir modelos computacionais. Para reduzir esse problema, os autores usam uma técnica de realce de contraste chamada CLAHE que ilumina detalhes locais sem exagerar o ruído. Eles redimensionam todas as imagens para um quadrado padrão menor, normalizam as cores e usam rotações e espelhamentos aleatórios durante o treinamento para que o sistema não se ajuste demais a um único ângulo de câmera ou condição de iluminação. O conjunto de dados é dividido de forma que quatro quintos das imagens treinem os modelos e um quinto seja reservado para testar quão bem o sistema generaliza para casos novos.

Muitos olhos em vez de um

Em vez de depender de um único modelo de aprendizado profundo, o estudo treina quatro redes neurais convolucionais populares que foram inicialmente desenvolvidas em uma grande coleção de fotos do cotidiano. Esses modelos, conhecidos na área como VGG16, VGG19, ResNet50 e DenseNet121, são retreinados para reconhecer retinas saudáveis e doentes. Cada um já tem um desempenho muito bom por si só, classificando corretamente cerca de 98% das imagens de teste e errando apenas um pequeno número de olhos doentes. A ideia-chave do trabalho é combinar suas forças por meio de vários esquemas de fusão de decisão, incluindo votação simples, média de confiança e regras mais avançadas inspiradas em lógica fuzzy.

Figure 2. Como imagens oculares aprimoradas passam por múltiplas redes de IA cujos sinais combinados decidem doença ou saúde.

Combinando opiniões dos modelos com cuidado

A equipe estuda de forma sistemática sete formas de mesclar as saídas dos quatro modelos, sempre sob a mesma receita de treinamento. Eles também ajustam finamente o ponto de corte onde uma probabilidade é transformada em previsão sim ou não, em vez de assumir um limiar fixo na metade. Ao varrer muitos limiares, medem como acurácia, sensibilidade e precisão se equilibram, o que é crucial para ferramentas de triagem que devem evitar tanto doenças não detectadas quanto alarmes falsos excessivos. Em seguida, vão além da simples acurácia, examinando com que confiança os modelos separam imagens saudáveis de doentes usando curvas ROC e gráficos de densidade de probabilidade.

O que os resultados significam para a triagem ocular futura

No geral, os métodos em ensemble mantêm ou melhoram levemente os já fortes resultados dos modelos individuais, atingindo cerca de 98,6% de acurácia e uma pontuação muito alta para separação de classes. Esquemas simples como votação da maioria ou média das confidências são notavelmente estáveis, enquanto um dos métodos fuzzy mostra-se mais sensível às escolhas de projeto e produz desempenho menos equilibrado. Para um leigo, a mensagem principal é que combinar vários leitores de imagem bem treinados, após limpar cuidadosamente as imagens e ajustar como seus votos são mesclados, resulta em um assistente automatizado mais confiável. Essa ferramenta não substituirá os oftalmologistas, mas pode ajudá‑los a classificar rapidamente grande número de fotografias de retina, concentrando o tempo clínico precioso nos pacientes cujos olhos mostram sinais iniciais de problema.

Citação: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Palavras-chave: retinopatia diabética, imagens de fundo de olho, aprendizado profundo, modelos em ensemble, triagem médica