Clear Sky Science · pt

Aplicação de operadores OWA suaves para a classificação da retinose pigmentar

· Voltar ao índice

Por que isso importa para a visão

Perder a visão gradualmente por causa de uma doença hereditária é uma perspectiva assustadora, e diagnosticar essas condições precocemente é crucial para preservar a visão. Este estudo explora como a inteligência artificial moderna pode ajudar médicos a distinguir entre várias doenças retinianas raras, porém graves, incluindo retinose pigmentar, usando fotografias detalhadas do fundo do olho. Ao encontrar uma maneira mais inteligente de combinar os julgamentos de vários modelos computacionais, os pesquisadores mostram que os computadores podem identificar essas doenças de forma muito mais confiável do que antes, mesmo quando há apenas um pequeno número de imagens de pacientes disponíveis.

Figure 1
Figure 1.

Detectando doenças em fotos do olho

A retinose pigmentar é um grupo de condições genéticas que destroem lentamente as células sensíveis à luz na retina. As pessoas frequentemente notam primeiro dificuldade para enxergar à noite, depois perdem a visão periférica e algumas acabam ficando cegas. Distúrbios relacionados, como distrofia cone-bastão e síndrome de Usher, podem parecer semelhantes em imagens oculares e compartilhar padrões visuais sutis. Neste estudo, especialistas de um centro médico em Lublin, Polônia, coletaram imagens ultra-widefield da retina de 186 pacientes com essas condições, além de imagens de olhos saudáveis obtidas de um banco de dados separado. O resultado foi uma tarefa de classificação em cinco categorias: duas variantes genéticas de retinose pigmentar, distrofia cone-bastão, síndrome de Usher e controles saudáveis. O conjunto de dados era pequeno e desequilibrado, refletindo a raridade no mundo real — algumas categorias tinham muito mais exemplos que outras, tornando a tarefa especialmente desafiadora.

Ensinando máquinas a ler a retina

Para interpretar essas imagens, os autores recorreram a sistemas poderosos de reconhecimento de imagens originalmente desenvolvidos para fotografias do dia a dia: redes neurais convolucionais e modelos mais recentes baseados em transformers. Testaram várias arquiteturas, incluindo EfficientNet, ResNet, VGG, Inception e duas versões do Vision Transformer. Cada rede foi inicialmente treinada em um grande banco de imagens de uso geral e então refinada nas imagens retinianas, uma estratégia conhecida como transfer learning. Aumentos de dados padrão, como espelhamento, rotação e pequenas distorções nas imagens, ajudaram os modelos a lidar com diferenças nos aparelhos de imagem e na anatomia dos pacientes. Mesmo com essas técnicas avançadas, a melhor rede isolada classificou corretamente apenas cerca de dois terços dos casos de teste, e o desempenho foi notavelmente pior nas categorias de doenças mais raras.

Deixar muitos modelos votarem juntos

Em vez de confiar em uma única rede, os pesquisadores propuseram: e se tratarmos cada modelo como um especialista em um painel e combinarmos suas opiniões? Essa ideia, chamada agregação ou aprendizado por conjunto, é comum em aprendizado de máquina, mas frequentemente implementada com votação simples ou média. Aqui, a equipe usou uma família mais flexível de ferramentas conhecida como Operadores de Média Ponderada Ordenada (OWA). Para cada possível diagnóstico, a OWA pega as probabilidades produzidas por todas as redes, ordena-as do maior para o menor e então as mistura com um conjunto cuidadosamente escolhido de pesos. Na prática, isso dá mais influência a modelos mais confiantes, sem deixar de considerar os demais. Essa agregação por si só produziu um salto dramático na acurácia geral, de aproximadamente 68% para o melhor modelo individual para mais de 93% quando as saídas das redes foram combinadas com um esquema OWA básico.

Figure 2
Figure 2.

Suavizando o voto para casos difíceis

A principal inovação do estudo foi uma versão refinada chamada OWA Suave (Smooth OWA). Em vez de tratar a probabilidade de cada modelo isoladamente, a Smooth OWA "suaviza" levemente cada valor usando seus vizinhos antes de aplicar a mistura ponderada. As regras de suavização são emprestadas de fórmulas clássicas de integração numérica, conhecidas como quadraturas de Newton–Cotes, normalmente usadas para cálculos precisos de área. Transpostas para este contexto, elas ajudam a uniformizar previsões instáveis ou limítrofes entre os modelos. Embora o ganho adicional sobre a OWA padrão tenha sido modesto — da ordem de meio ponto percentual em acurácia —, foi consistente em testes repetidos e elevou o desempenho para cerca de 94%. Crucialmente, as matrizes de confusão mostraram que as classificações incorretas caíram acentuadamente nas cinco classes, especialmente nas doenças mais raras. Em alguns grupos, as taxas de reconhecimento correto subiram de cerca de dois terços com o melhor modelo isolado para bem acima de 90% com a Smooth OWA.

O que isso significa para pacientes e médicos

Para um não especialista, a mensagem principal é que nenhum modelo de inteligência artificial precisa ser perfeito para ser clinicamente útil. Ao combinar cuidadosamente vários modelos bons, porém imperfeitos, e estabilizar suavemente suas saídas, os pesquisadores transformaram um conjunto de ferramentas "razoavelmente boas" em um auxiliar de decisão muito forte. A abordagem Smooth OWA lidou com um conjunto de dados pequeno e desequilibrado e ainda assim alcançou níveis de desempenho difíceis de alcançar de outra forma. Embora o trabalho ainda esteja em estágio de pesquisa e precise ser validado em estudos maiores e multicêntricos antes de orientar cuidados reais a pacientes, ele sugere um caminho claro a seguir: futuros sistemas diagnósticos para doenças raras do olho podem não depender de um único algoritmo, mas de um "conselho" coordenado de algoritmos cuja avaliação coletiva é tanto mais precisa quanto mais confiável.

Citação: Rachwał, A., Rachwał, A., Powroźnik, P. et al. Application of smooth OWA operators to classification of retinitis pigmentosa. Sci Rep 16, 11995 (2026). https://doi.org/10.1038/s41598-026-41840-5

Palavras-chave: retinose pigmentar, aprendizado profundo, imagens da retina, métodos de conjunto, IA para diagnóstico médico