Clear Sky Science · pt

Um conjunto multimodal de imagens da retina para detecção de retinopatia diabética usando modelos fundamentais

· Voltar ao índice

Por que detectar danos oculares precocemente é importante

Para pessoas com diabetes, o tecido sensível à luz na parte posterior do olho pode sofrer danos silenciosos por anos antes que a visão comece a ficar visivelmente embaçada. Quando os sintomas aparecem, parte do dano pode ser permanente. Os médicos sabem que exames oculares regulares podem identificar problemas cedo, mas analisar milhares de imagens manualmente é lento e caro. Este estudo apresenta uma grande coleção de imagens retinianas cuidadosamente rotuladas, pensada para ajudar sistemas de inteligência artificial (IA) a aprender a detectar doenças oculares diabéticas com mais precisão e confiabilidade, oferecendo avisos mais precoces a muito mais pacientes.

Figure 1
Figure 1.

Diferentes ângulos da mesma alteração ocular

Oftalmologistas usam vários tipos de câmeras para procurar danos relacionados ao diabetes. Fotografias coloridas padrão da parte de trás do olho mostram uma visão arredondada e avermelhada onde podem surgir pequenos pontos de sangue, depósitos gordurosos e novos vasos frágeis. Imagens ultra‑widefield capturam uma área muito maior, incluindo as bordas distais da retina onde prejuízos iniciais podem se ocultar. Uma terceira ferramenta, a tomografia de coerência óptica (OCT), corta a retina em seção transversal, revelando inchaço e bolsões de fluido ligados ao edema macular que ameaça a visão. Cada método revela peças diferentes do mesmo processo patológico e, juntos, fornecem um quadro mais completo da saúde ocular.

O que há de novo nesta coleção de imagens

Conjuntos de dados públicos existentes impulsionaram muitos sistemas de IA para rastreamento de doenças oculares diabéticas, mas a maioria foca em apenas um método de imagem e oferece rótulos grosseiros, como uma única nota geral da doença. Alguns contêm rótulos ruidosos ou deixam de fora tipos importantes de lesão, e muitos carecem de boa cobertura de imagens widefield ou de informações detalhadas sobre inchaço macular. O novo conjunto MMRDR pretende preencher essas lacunas. Ele reúne 24.460 imagens em três modalidades — fotos coloridas padrão, imagens ultra‑widefield e varreduras OCT — e incorpora anotações especializadas ricas. Para fotos coloridas e imagens widefield, médicos atribuíram o grau geral da doença em uma escala de cinco níveis e registraram sete tipos específicos de lesão, como pequenas dilatações em vasos, hemorragias e descolamento de retina. Para varreduras OCT, descreveram se o edema macular está ausente, presente fora do centro ou afetando diretamente o centro da visão.

Como as imagens foram selecionadas e rotuladas

Os autores extraíram fotografias coloridas padrão de um conjunto de dados público de competição existente e obtiveram imagens widefield e OCT de um grande hospital oftalmológico chinês, com foco em pessoas com diabetes. Removeram imagens de baixa qualidade com desfoque, iluminação ruim ou ausência de regiões centrais para garantir que os exames restantes fossem clinicamente úteis. Quatro oftalmologistas experientes e um especialista sênior em retina desenvolveram regras claras de graduação baseadas em diretrizes internacionais. O especialista primeiro criou um conjunto de referência de imagens; em seguida, os demais graduadores praticaram com esse conjunto até alcançar forte concordância com as decisões do especialista. Depois disso, eles rotularam de forma independente milhares de imagens, remetendo casos incertos de volta ao especialista. A coleção final equilibra rotulagem minuciosa com alta concordância entre médicos, tornando‑a um conjunto de ensino confiável para IA.

Avaliando a IA atual em dados oculares de amanhã

Em seguida, a equipe usou o conjunto para avaliar vários tipos de modelos avançados de IA. Testaram grandes modelos visão‑linguagem originalmente treinados em imagens e textos gerais, classificadores de imagem padrão treinados em fotografias do dia a dia e modelos "fundamentais" mais novos já ajustados em imagens oculares. Em todos os casos, os modelos tiveram mais dificuldade com imagens ultra‑widefield, onde a visão muito maior e os padrões mais complexos reduziram a precisão em comparação com fotos coloridas padrão. Modelos projetados especificamente para imagens oculares demonstraram melhor transferência de padrão para widefield do que sistemas multimodais gerais, sugerindo que o conhecimento da estrutura retiniana realmente importa. Quando os pesquisadores ajustaram finamente um grande modelo multimodal com o MMRDR, seu desempenho melhorou de forma marcante, mostrando que esse conjunto de dados pode ensinar até sistemas de IA muito flexíveis a lidar mais competentemente com doenças oculares.

Figure 2
Figure 2.

O que isso significa para o futuro do cuidado ocular

Em termos práticos, este trabalho entrega uma biblioteca de ensino de alta qualidade para computadores que aprendem a identificar danos oculares diabéticos. Ao combinar três métodos de imagem complementares e rótulos especializados detalhados, o conjunto MMRDR permite que pesquisadores construam e comparem de forma justa ferramentas de IA que graduam a severidade da doença, localizam lesões individuais e acompanham o inchaço macular. Embora essas imagens por si só não curem a cegueira, elas fornecem uma base crucial para sistemas automatizados de triagem mais confiáveis que podem detectar alterações que ameaçam a visão mais cedo e levar cuidados oftalmológicos no nível de especialistas a muito mais pessoas com diabetes.

Citação: Tang, Z., Wang, L., Guo, Z. et al. A multimodal retinal image dataset for diabetic retinopathy detection using foundation models. Sci Data 13, 639 (2026). https://doi.org/10.1038/s41597-026-07005-9

Palavras-chave: retinopatia diabética, imagem da retina, IA médica, modelos fundamentais, OCT ocular