Clear Sky Science · pt

Comparando o desempenho da inteligência artificial e de profissionais de saúde na análise de vídeos cirúrgicos e intervencionistas: uma revisão sistemática e meta-análise

2026-03-06 · Voltar ao índice

Olhos mais inteligentes na sala de cirurgia

Cada ano, centenas de milhões de pessoas passam por operações e procedimentos minimamente invasivos guiados por vídeo — pense em colonoscopias, cirurgias por vídeo ou pequenas câmeras introduzidas em vasos sanguíneos. Nesses momentos, a capacidade do médico de detectar sinais sutis de alerta na tela pode significar a diferença entre identificar um câncer precocemente ou não. Este estudo faz uma pergunta que interessa a qualquer paciente do futuro: quando vídeos cirúrgicos e intervencionistas são analisados, quão bem os sistemas de inteligência artificial se saem em comparação com os clínicos humanos, e o que acontece quando os dois trabalham juntos?

Organizando uma enxurrada de vídeo cirúrgico

A medicina moderna agora registra um grande número de vídeos de procedimentos, desde endoscopias digestivas até operações assistidas por robô. Essas gravações são ricas em informação: pequenos pólipos no cólon, tumores iniciais no estômago ou esôfago, nervos delicados que devem ser evitados ou etapas de uma operação complexa. Pesquisadores vêm treinando sistemas de IA para vasculhar essas imagens, sinalizar áreas suspeitas e até reconhecer em que etapa do procedimento o cirurgião se encontra. Ainda assim, até agora, a maioria dos estudos colocou IA contra médicos em confrontos artificiais, em vez de perguntar como a tecnologia poderia ser realisticamente usada — como uma ajuda ao lado do clínico. Esta revisão buscou reunir e analisar sistematicamente essas evidências dispersas em várias especialidades.

O que os pesquisadores examinaram

A equipe pesquisou bases de dados médicas e de engenharia importantes e começou com quase 38.000 artigos. Após aplicar critérios rigorosos — apenas estudos primários que usaram IA em vídeos cirúrgicos ou intervencionistas reais e compararam diretamente seu desempenho com o de profissionais de saúde — restaram apenas 146 estudos. Estes cobriram uma ampla gama de procedimentos, especialmente endoscopia gastrointestinal, mas também intervenções pulmonares, da tireoide, do cérebro, do coração e urológicas. A maioria usou métodos modernos de aprendizado profundo, como redes neurais convolucionais, treinadas para detectar doença, reconhecer anatomia, avaliar a limpeza do intestino ou identificar etapas de uma operação. Setenta e seis desses estudos relataram detalhes suficientes para permitir que os autores agregassem resultados e calculassem com que frequência a IA e os humanos acertavam ou erravam.

IA sozinha versus médicos, e IA como companheira

Quando os pesquisadores compararam a IA com clínicos sem auxílio observando os mesmos vídeos, os sistemas de IA geralmente detectaram mais problemas reais (sensibilidade maior) sem causar mais alarmes falsos (especificidade semelhante). Esse padrão se manteve tanto quando os modelos foram testados com dados familiares quanto quando enfrentaram novos conjuntos de dados externos. No entanto, o achado clinicamente mais relevante surgiu quando a IA foi usada como assistente. Em uma ampla gama de tarefas, clínicos que podiam ver as sugestões da IA foram melhores em encontrar doença e menos propensos a classificar erroneamente tecido normal do que aqueles que trabalhavam sozinhos. Esse ganho foi especialmente marcante para não especialistas, como residentes, que mais se beneficiaram da orientação da IA. Para especialistas experientes, a assistência da IA e a IA sozinha apresentaram níveis aproximadamente similares, sugerindo que, em mãos experientes, a combinação humano–máquina pode igualar os melhores algoritmos isolados.

Lacunas entre condições de laboratório e a vida real

Apesar desses números promissores, a revisão destaca uma lacuna entre como a IA é testada atualmente e como ela precisa funcionar em cenários clínicos reais. Muitos estudos limparam seus dados removendo quadros de vídeo borrados ou de baixa qualidade, embora salas de cirurgia e centros de endoscopia frequentemente lidem exatamente com essas imperfeições. Outros analisaram instantâneos isolados em vez de vídeo contínuo, evitando o desafio de acompanhar movimento e temporalidade. Poucos estudos avaliaram a IA em tempo real à beira do leito, e a maioria dependia de equipamentos de ponta que podem não estar disponíveis em hospitais com recursos limitados. As práticas de relato também foram inconsistentes: detalhes-chave sobre como os modelos foram ajustados e validados frequentemente estavam ausentes, dificultando que outros reproduzissem ou julgassem os resultados de forma justa.

Construindo parcerias humano–IA confiáveis

Os autores defendem que a IA em cirurgia e medicina intervencionista deveria ser desenvolvida e testada desde o início como parceira dos clínicos, não como substituta. Isso significa desenhar estudos que reflitam condições do mundo real, compartilhar conjuntos de vídeos diversos entre centros e adotar padrões claros de relato para que outras equipes possam verificar e aprimorar trabalhos publicados. Também implica treinar os clínicos para entender as forças e vieses da IA, em vez de confiar cegamente ou descartar suas sugestões. Embora a meta-análise mostre que a IA já pode igualar ou superar o desempenho humano sem auxílio em muitas tarefas baseadas em vídeo, o benefício mais significativo está em como ela pode aguçar o julgamento humano. Para os pacientes, a conclusão não é que máquinas tomarão conta da sala de cirurgia, mas que equipes humano–IA bem projetadas podem tornar os procedimentos mais seguros, os diagnósticos mais precoces e os desfechos melhores.

Citação: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2

Palavras-chave: vídeo cirúrgico com IA, endoscopia assistida por computador, colaboração humano–IA, análise de imagens médicas, apoio à decisão clínica