Clear Sky Science · pt
Transformador de visão multi-plano para classificação de hemorragia usando dados de RM axial e sagital
Por que esta pesquisa importa para pacientes e médicos
Quando alguém pode estar sofrendo um AVC ou uma hemorragia cerebral, cada minuto conta. Exames cerebrais podem revelar hemorragias perigosas, mas interpretar essas imagens de forma rápida e precisa é desafiador, especialmente para ressonância magnética (RM), que produz muitos tipos de imagens em diferentes ângulos de visualização. Este estudo apresenta um novo método de inteligência artificial (IA) projetado para interpretar exames de RM em múltiplos ângulos de forma mais semelhante a um radiologista experiente, com o objetivo de detectar hemorragias cerebrais de maneira mais confiável nas condições reais de hospital.
O desafio de encontrar sangramentos cerebrais na RM
Hemorragia intracraniana — sangramento dentro do crânio — é uma emergência com risco de vida que exige diagnóstico rápido. Durante décadas, a tomografia computadorizada (TC) tem sido a ferramenta de imagem mais utilizada em suspeitas de hemorragia cerebral porque é rápida e relativamente fácil de interpretar. A RM pode igualar ou até superar a TC na detecção de hemorragias e é melhor para indicar a idade do sangramento e revelar outros problemas, como áreas do cérebro com falta de circulação. Contudo, a RM demora mais, é menos disponível em alguns centros e suas imagens são mais complexas de interpretar. Essa complexidade torna a RM um alvo atraente para ferramentas de IA que podem auxiliar radiologistas triando grande número de exames, sinalizando casos suspeitos e reduzindo o risco de que uma hemorragia sutil, porém crítica, seja perdida.
Por que múltiplas vistas e tipos de exame são difíceis para computadores
No atendimento clínico rotineiro, a RM do crânio costuma ser adquirida com fatias relativamente espessas para encurtar o exame, produzindo imagens que são muito mais nítidas em algumas direções do que em outras. Radiologistas visualizam o cérebro em vários planos — axial (de cima para baixo), sagital (de lado) e às vezes coronal (de frente) — porque algumas hemorragias são mais fáceis de ver em determinados ângulos. Os exames também vêm em vários “contrastes” ou variantes, como FLAIR, difusão e susceptibilidade, cada um destacando propriedades diferentes dos tecidos. A maioria dos sistemas de IA atuais, porém, espera que todas as imagens estejam alinhadas em uma única orientação padrão e na mesma resolução. Para atender a esse requisito, os hospitais precisam girar e redimensionar digitalmente os dados, o que pode borrar detalhes finos e potencialmente ocultar pequenas hemorragias. Conjuntos de dados clínicos reais adicionam outra complicação: nem todo paciente é examinado com o mesmo conjunto de contrastes, então os modelos precisam lidar com peças de informação faltantes.
Um novo modelo de IA multi-plano que preserva mais da imagem
Para enfrentar esses problemas, os autores projetaram um “transformador de visão multi-plano” (MP-ViT), um tipo de IA originalmente desenvolvido para entender imagens naturais. Em vez de forçar todos os dados de RM para um único ângulo de visualização, o MP-ViT tem dois ramos de processamento dedicados: um para imagens axiais e outro para imagens sagitais. Cada ramo divide o cérebro tridimensional em pequenos blocos, converte-os em tokens que o transformador pode processar e então aprende padrões que podem indicar a presença de hemorragia. De forma crucial, esses ramos não apenas operam em paralelo e permanecem separados. O modelo usa um mecanismo de cross-attention para permitir que os dois ramos troquem informações, imitando como um radiologista combina mentalmente vistas de diferentes ângulos para formar uma visão geral mais clara do cérebro.

Lidando com tipos de exame faltantes por meio de um sinal de orientação
Nos fluxos de trabalho hospitalares reais, nem todo paciente tem o mesmo conjunto de contrastes de RM; alguns podem não dispor de sequências específicas sensíveis a sangramentos. Para tornar a IA robusta a essas lacunas, os autores adicionaram um “vetor de indicação de modalidade” — um código simples que informa ao modelo quais tipos de imagens estão presentes e quais estão ausentes para um determinado paciente. Esse vetor é transformado em um conjunto de sinais internos que interagem com as características aprendidas pelo modelo por meio de uma etapa adicional de cross-attention. Na prática, a rede é guiada a ajustar suas expectativas quando certos tipos de informação não estão disponíveis, em vez de ficar confusa ou excessivamente confiante. Esse desenho torna o MP-ViT mais adequado aos dados desordenados e inconsistentes que surgem na prática clínica diária.

Desempenho do novo método
Os pesquisadores treinaram e testaram o MP-ViT em um grande conjunto de dados do mundo real com mais de 12.000 estudos de RM de três grandes fabricantes de aparelhos, rotulados por radiologistas experientes como mostrando hemorragia intracraniana aguda ou subaguda ou não. Em um conjunto de teste independente, o MP-ViT alcançou uma área sob a curva (AUC) de 0,854, uma medida de quão bem ele separa casos com e sem hemorragia ao longo de todos os limiares de decisão possíveis. Essa pontuação foi notavelmente superior à de um transformador de visão padrão operando a partir de um único plano, assim como a várias arquiteturas conhecidas de redes neurais convolucionais, como ResNet e DenseNet. Testes estatísticos confirmaram que esses ganhos dificilmente se deveram ao acaso. Uma análise interna também mostrou que incluir o vetor de indicação de modalidade melhorou o desempenho em mais de um ponto percentual, ressaltando o valor de informar explicitamente ao modelo quais tipos de exame estão disponíveis.
O que isso pode significar para o cuidado futuro
Para um não especialista, a conclusão principal é que este estudo demonstra uma forma mais inteligente para a IA ler exames de RM: o método observa o cérebro de mais de um ângulo, preserva mais detalhes originais e se adapta quando alguns tipos de imagem estão ausentes. Embora o trabalho tenha sido avaliado em um único conjunto de dados interno e tenha se concentrado apenas na classificação em vez do contorno preciso das hemorragias, ele mostra que transformadores bem projetados podem se ajustar melhor à realidade desordenada da imagiologia clínica. Se validados de forma mais ampla e integrados de maneira responsável aos fluxos de trabalho hospitalares, métodos como o MP-ViT podem ajudar radiologistas a detectar hemorragias cerebrais de forma mais confiável, tanto em situações de emergência por AVC quanto em exames ambulatoriais de rotina, potencialmente proporcionando tratamento mais rápido e resultados mais seguros para os pacientes.
Citação: Das, B.K., Zhao, G., Mailhe, B. et al. Multi-plane vision transformer for hemorrhage classification using axial and sagittal MRI data. Sci Rep 16, 9333 (2026). https://doi.org/10.1038/s41598-026-44524-2
Palavras-chave: hemorragia cerebral, RM, IA em imagens médicas, transformador de visão, diagnóstico de AVC