Clear Sky Science · pt

Uma abordagem de pré-processamento em duas etapas e classificação para detecção precisa de COVID-19 em radiografias

· Voltar ao índice

Por que interpretar radiografias com mais inteligência importa

Durante a pandemia de COVID-19, os médicos confiaram principalmente em exames laboratoriais para confirmar quem estava infectado. Mas equipamentos de laboratório podem ser escassos, e os resultados podem demorar — especialmente em locais com recursos limitados. Radiografias de tórax, por outro lado, são rápidas e amplamente disponíveis, ainda que até radiologistas experientes possam ter dificuldade em detectar as alterações pulmonares frequentemente sutis causadas pela COVID-19. Este artigo explora uma maneira de ensinar computadores a ler radiografias de forma mais confiável, limpando primeiro as imagens e depois aplicando inteligência artificial moderna, com o objetivo de ajudar clínicos a tomar decisões mais rápidas e precisas.

Ver os detalhes importantes em imagens ruidosas

Uma radiografia de tórax contém uma mistura de informações: ossos, tecidos moles, sombras e artefatos da máquina sobrepostos. Sistemas padrão de aprendizado profundo tentam aprender diretamente a partir dessas imagens brutas, o que faz com que a rede tenha de descobrir por conta própria quais partes de cada imagem são importantes. Isso é difícil quando as imagens variam em brilho, contraste e qualidade. Os autores enfrentam esse problema adicionando uma etapa dedicada de pré-processamento antes de as radiografias chegarem à rede neural. Eles usam uma técnica de visão computacional chamada Maximally Stable Extremal Regions (MSER), que varre a imagem em vários níveis de brilho e identifica regiões que permanecem estáveis conforme o limiar muda. Esses fragmentos estáveis frequentemente correspondem a estruturas significativas — como áreas de tecido pulmonar anormal — enquanto ignoram ruídos mais aleatórios.

Figure 1
Figura 1.

Deixando uma matilha virtual de lobos ajustar os parâmetros

MSER é poderoso, porém sensível: seu desempenho depende fortemente de vários parâmetros numéricos que controlam o tamanho máximo de uma região, quanto seu brilho pode variar e quão suaves suas bordas devem ser. Testar manualmente todas as combinações para milhares de radiografias seria tedioso e lento. Para resolver isso, os pesquisadores recorrem a um método de otimização inspirado na natureza chamado Grey Wolf Optimizer. Nesse algoritmo, uma matilha virtual de “lobos” explora diferentes combinações de parâmetros, movendo-se gradualmente em direção àquelas que produzem as regiões mais limpas e informativas nas imagens. A qualidade de cada configuração é avaliada por uma métrica que recompensa regiões que são internamente uniformes e claramente separadas do entorno. Em algumas dezenas de iterações por imagem, a matilha converge para um conjunto de parâmetros que faz as áreas pulmonares suspeitas sobressaírem de forma clara.

Treinando redes neurais com imagens mais limpas

Uma vez que as radiografias são refinadas dessa maneira, elas são enviadas a uma rede neural convolucional profunda — a mesma classe de modelos amplamente usada para reconhecimento facial e carros autônomos. Os autores testaram seu pipeline em duas etapas com três famílias de redes diferentes: uma rede personalizada bem simples, DenseNet (uma arquitetura mais forte e complexa) e MobileNet (um modelo mais leve projetado para dispositivos móveis). Para cada uma delas, compararam o desempenho em dois conjuntos públicos de radiografias de tórax, primeiro usando imagens brutas e depois usando imagens pré-processadas pela combinação MSER–Grey Wolf. Em todos os casos, as imagens pré-processadas levaram a maior acurácia, menos alarmes falsos e treinamento mais rápido. Em um caso, a acurácia subiu de cerca de 90% para quase 99%, enquanto o tempo de treinamento foi reduzido em aproximadamente dois terços.

Figure 2
Figura 2.

Quão robusta é essa abordagem no mundo real?

Para verificar se o método simplesmente memorizou particularidades de um único conjunto de dados, os autores realizaram um teste mais exigente: treinaram seus modelos em uma coleção de radiografias e depois os avaliaram em outra coleção que nunca tinham visto. O desempenho naturalmente caiu, mas os sistemas que usaram o novo pré-processamento resistiram muito melhor do que aqueles treinados apenas com imagens brutas. O estudo também incluiu uma análise de ablação, que mostrou que usar MSER sem ajuste automático não ajudou muito, e uma comparação com um método mais convencional de realce de contraste. Nesses casos, os ganhos praticamente desapareceram. Isso sugere que o ingrediente-chave não é apenas “melhorar” as imagens, mas guiar o algoritmo para isolar, de forma fundamentada e orientada por dados, regiões estáveis e relevantes para a doença.

O que isso significa para pacientes e médicos

O trabalho não substitui testes PCR nem radiologistas especialistas, e os autores apontam limitações: os dados vêm de um conjunto limitado de hospitais, e eles não testaram o método em todas as arquiteturas modernas de rede ou em outras doenças pulmonares. Ainda assim, os resultados mostram que um pré-processamento bem pensado pode tornar sistemas de IA existentes muito mais precisos e eficientes. Ao ajudar redes neurais a se concentrar nas partes mais informativas de cada radiografia de tórax, a abordagem em duas etapas oferece um caminho prático para ferramentas automatizadas de apoio ao diagnóstico de COVID-19 e, potencialmente, de outras condições respiratórias — especialmente em cenários onde decisões rápidas e recursos computacionais limitados são rotina.

Citação: González, A., Gutiérrez, V.G., Cuevas, E. et al. A two-stage preprocessing and classification approach for accurate COVID-19 detection in X-ray images. Sci Rep 16, 13514 (2026). https://doi.org/10.1038/s41598-026-41861-0

Palavras-chave: Diagnóstico de COVID-19 por radiografia, pré-processamento de imagem médica, aprendizado profundo em radiologia, detecção assistida por computador, IA para imagem torácica