Clear Sky Science · pt

Segmentação automatizada de cálculos renais em vídeos de ureteroscopia flexível usando um modelo U‑Net: Um estudo preliminar de viabilidade

· Voltar ao índice

Ajudando Cirurgiões a Ver Cálculos Renais Ocultos

Os cálculos renais são um problema doloroso e cada vez mais comum, e uma das principais formas de tratá‑los é introduzir uma pequena câmera no rim e fragmentar as pedras com um laser. Mas dentro do corpo a visão pode ficar confusa: sangue, poeira proveniente da fragmentação e o movimento da respiração tornam difícil para o cirurgião enxergar com clareza. Este estudo investiga se a inteligência artificial (IA) pode funcionar como um realce em tempo real para os cálculos durante a cirurgia, fazendo com que eles se destaquem mais na tela e potencialmente tornando o tratamento mais rápido e seguro.

Por que os Cálculos Renais São Difíceis de Tratar

Os cálculos renais afetam uma grande parcela de adultos no mundo e podem causar dor intensa, infecções e até insuficiência renal. O tratamento moderno frequentemente utiliza ureteroscopia flexível, em que os médicos guiam um endoscópio flexível com câmera pelo trato urinário até o rim. Lá, usam um laser para fragmentar as pedras em pedaços menores. No entanto, a imagem da câmera está longe de ser perfeita. Sangramentos súbitos, nuvens de poeira geradas pelo laser, variações de iluminação e movimento rápido podem tudo borrar a visão. Os cirurgiões precisam decidir constantemente onde termina a pedra e onde começa o tecido ao redor. Se fragmentos forem perdidos, o paciente pode precisar de procedimentos repetidos; se houver erro de julgamento, o risco de complicações aumenta.

Ensinando um Computador a Detectar Pedras

Para enfrentar esse desafio, os pesquisadores treinaram um programa de computador para contornar automaticamente os cálculos renais no fluxo de vídeo do endoscópio. Eles coletaram 12 gravações completas de cirurgias de diferentes pacientes, totalizando cerca de 11 horas de filmagens em ambiente real. A partir desses vídeos, extraíram milhares de quadros individuais e construíram um sistema semi‑automático para marcar onde estavam as pedras. Primeiro, revisores humanos desenharam caixas simples ao redor das pedras visíveis. Em seguida, uma ferramenta separada gerou formas mais precisas dentro dessas caixas, e especialistas médicos verificaram se essas formas correspondiam às áreas reais das pedras. Essas imagens emparelhadas com as delimitações foram usadas para treinar um modelo de aprendizado profundo baseado na arquitetura U‑Net, um tipo popular de rede para segmentação de imagens que pode indicar exatamente quais pixels pertencem ao cálculo.

Figure 1
Figure 1.

Desempenho do Modelo de IA

A equipe dividiu cuidadosamente seus dados para que algumas cirurgias fossem usadas para treinar o modelo, outras para ajustá‑lo, e algumas fossem mantidas completamente separadas para testar como ele funcionaria em operações novas e não vistas. Nesses vídeos reservados, a IA classificou corretamente a maioria dos pixels em cada quadro e apresentou forte sobreposição entre seus contornos de pedra e as marcações dos especialistas. Em termos simples, quando a pedra estava claramente visível e a imagem da câmera era nítida, o sistema desenhou um limite preciso e ajustado ao redor dela. O modelo também foi rápido: em uma placa gráfica padrão, processou cerca de 30 quadros por segundo, velocidade semelhante a de um fluxo de vídeo ao vivo, sugerindo que o uso em tempo real na sala de operações é tecnicamente viável.

Quando a Visão Fica Confusa

O desempenho caiu quando o vídeo se assemelhava mais a uma nevasca do que a uma imagem clara. Em quadros com sangramento intenso, nuvens espessas de poeira do laser ou forte desfoque por movimento, o modelo às vezes confundiu detritos brilhantes com a pedra real ou deixou de identificar partes do cálculo. Uma análise mais detalhada comparou quadros “claros”, com mínima interferência, a quadros “borrados”, repletos de artefatos. A IA teve desempenho perceptivelmente melhor no grupo claro, confirmando que a baixa visibilidade torna a delimitação precisa mais difícil mesmo para um algoritmo treinado. Como o modelo analisa cada quadro isoladamente, ele ainda não consegue usar informações ao longo do tempo para distinguir uma pedra estável de poeira ou filetes de sangue passageiros.

Figure 2
Figure 2.

O Que Isso Pode Significar para Cirurgias Futuras

Este trabalho é um passo inicial e não uma ferramenta pronta para uso hospitalar. O estudo utilizou um número modesto de vídeos de um único centro, com um conjunto limitado de tipos de câmera, e o processo de anotação pode ainda conter imperfeições humanas e algorítmicas. O sistema ainda não foi incorporado a um fluxo cirúrgico completo, onde confiabilidade, verificações de segurança e limites de hardware são de grande importância. Ainda assim, os resultados mostram que um modelo de IA pode aprender a localizar e contornar cálculos renais diretamente a partir de vídeos cirúrgicos reais e acompanhar velocidades de transmissão ao vivo. Com conjuntos de dados maiores e mais diversos, uso mais inteligente de informações entre quadros consecutivos e testes cuidadosos em salas de cirurgia reais, sistemas semelhantes poderiam eventualmente auxiliar cirurgiões ao tornar cálculos ocultos mais visíveis, reduzindo fragmentos perdidos e melhorando o cuidado ao paciente.

Citação: El Hajj, A., Bou Mrad, A., Malik, E. et al. Automated kidney stone segmentation from flexible ureteroscopy videos using a U-net model: A preliminary feasibility study. Sci Rep 16, 14542 (2026). https://doi.org/10.1038/s41598-026-45143-7

Palavras-chave: cálculos renais, IA cirúrgica, vídeo endoscópico, imagens médicas, aprendizado profundo