Clear Sky Science · pt
Precisão diagnóstica, equidade e implementação clínica de IA para rastreamento do câncer de mama: resultados de estudos multicêntricos retrospectivos e prospectivos de viabilidade técnica
Triagem mais inteligente para mulheres do dia a dia
O rastreamento do câncer de mama salva vidas, mas também sobrecarrega os sistemas de saúde e pode perder tumores ou provocar falsos alarmes estressantes. Este estudo faz uma pergunta simples com grandes implicações: um programa de inteligência artificial (IA) pode ajudar com segurança a interpretar mamografias no programa nacional de rastreamento do Reino Unido, detectando mais cânceres perigosos enquanto alivia a pressão sobre especialistas ocupados — e fazendo isso de forma justa para mulheres de diferentes origens?

Como a triagem funciona hoje
Em muitos países, incluindo o Reino Unido, mulheres entre 50 e 70 anos são convidadas para mamografias regulares. No Reino Unido, cada exame costuma ser lido de forma independente por dois especialistas humanos; se houver discordância, um painel revisa o caso. Esse sistema de dupla leitura foi projetado para ser seguro, mas consome tempo e depende de ter leitores treinados suficientes — algo com que muitos sistemas de saúde enfrentam dificuldades. Ferramentas computacionais anteriores ofereceram ajuda limitada e às vezes adicionaram ruído em vez de clareza, por isso as autoridades de saúde exigiram evidências sólidas antes de confiar nas IAs modernas em programas nacionais.
Testando a IA em clínicas reais
Os pesquisadores avaliaram a versão atualizada da IA de mamografia do Google em duas fases principais no Serviço Nacional de Saúde do Reino Unido. Primeiro, executaram o sistema em quase 116.000 exames de rastreamento anteriores de cinco regiões diferentes, acompanhando as mulheres por mais de três anos para ver quais cânceres realmente surgiram. Em seguida, compararam o desempenho da IA com o do primeiro leitor humano, do segundo leitor e da decisão final do painel. Na segunda fase, instalaram discretamente a IA em 12 locais de rastreamento e a deixaram processar mais de 9.000 exames novos em tempo real — sem influenciar o atendimento — para estudar como ela se comportava na prática cotidiana e como suas configurações poderiam precisar de ajuste.
O que a IA viu — e o que ela detectou
No amplo conjunto de dados retrospectivo, a IA foi mais sensível que o primeiro leitor humano: identificou mais cânceres no geral mantendo sua taxa de falsos positivos dentro de uma margem de segurança pré‑estabelecida. Se usada como um dos leitores no fluxo de dupla leitura, o sistema teria elevado a taxa de detecção de câncer de cerca de 7,5 para 9,3 cânceres por 1.000 mulheres, e sinalizou corretamente um em cada quatro cânceres que originalmente foram perdidos e só descobertos depois, seja entre exames ou na visita de rotina seguinte. Os ganhos foram especialmente fortes em mulheres no primeiro exame — geralmente o grupo mais difícil de interpretar porque não há imagens anteriores. Nessas visitas iniciais, a IA tanto retornou menos chamadas para novos exames quanto ainda detectou ligeiramente mais cânceres, em particular tumores invasivos que representam a maior ameaça.
Equidade, carga de trabalho e obstáculos do mundo real
A equipe analisou cuidadosamente se a IA tratava diferentes grupos de mulheres de forma equitativa. Considerando idade, densidade mamária, status socioeconômico e os dados limitados de etnia disponíveis, não foram vistos sinais consistentes de viés prejudicial: sensibilidade e especificidade permaneceram dentro de margens estreitas em comparação com leitores humanos, embora alguns subgrupos muito pequenos apresentassem grande incerteza. Também modelaram como o uso da IA como segundo leitor remodelaria o trabalho. O número de leituras humanas antes da revisão do painel poderia cair quase pela metade, reduzindo o tempo do leitor em cerca de um terço, mesmo que mais casos fossem encaminhados ao painel. Na fase de viabilidade ao vivo, a IA entregou resultados em minutos — muito mais rápido que a leitura humana rotineira — mas a equipe identificou uma alteração na aparência das imagens recentes em comparação com os dados de treinamento antigos. Um limiar operacional inicial provou ser sensível demais, causando taxas de retorno mais altas, e precisou ser recalibrado para baixo usando dados locais recentes.

Construindo um sistema de rastreamento pronto para IA
Além da precisão, o estudo expôs barreiras práticas para uma implantação segura. Muitos centros de rastreamento ainda dependem de formulários em papel e software legado que não conseguem armazenar automaticamente os resultados da IA ou explicar por que um exame foi retornado — funcionalidades de que reguladores e clínicos precisam. Os autores defendem que fluxos de trabalho totalmente digitais e padronizados e uma melhor coleta de dados demográficos serão cruciais para monitorar o desempenho e a equidade ao longo do tempo. Eles também enfatizam que limites de IA não podem ser “definidos e esquecidos”: equipamentos de imagem, comportamento dos leitores e a composição populacional mudam, portanto o sistema deve ser continuamente verificado e ajustado, com regras nacionais claras e suporte técnico.
O que isso significa para as pacientes
Os achados sugerem que um sistema de IA cuidadosamente implementado poderia ajudar programas nacionais de rastreamento mamográfico a identificar mais cânceres graves mais cedo, especialmente em mulheres que fazem a primeira mamografia, enquanto aliviaria a carga de trabalho de especialistas sobrecarregados. Ainda assim, os autores enfatizam que o sucesso depende de mais do que um algoritmo preciso. Os serviços de saúde precisarão de calibração contínua, monitoramento rigoroso por deriva e viés, atualização da infraestrutura de TI e integração ponderada nos fluxos de trabalho humanos existentes. Com essas salvaguardas em vigor, a IA poderia se tornar um leitor extra confiável que melhora tanto a eficiência quanto a equidade do rastreamento do câncer de mama, em vez de uma caixa‑preta que adiciona novos riscos.
Citação: Kelly, C.J., Wilson, M., Warren, L.M. et al. Diagnostic accuracy, fairness and clinical implementation of AI for breast cancer screening: results of multicenter retrospective and prospective technical feasibility studies. Nat Cancer 7, 494–506 (2026). https://doi.org/10.1038/s43018-026-01127-0
Palavras-chave: rastreamento do câncer de mama, inteligência artificial médica, mamografia, equidade em saúde, implementação clínica