Clear Sky Science · zh

使用U‑net模型对柔性输尿管镜视频进行自动肾结石分割:一项初步可行性研究

· 返回目录

帮助外科医生看清隐匿的肾结石

肾结石是一种痛苦且日益常见的问题,常见的治疗方法之一是将微型摄像头送入肾脏并用激光将结石击碎。但体内视野常常混乱:出血、碎石产生的粉尘以及呼吸导致的运动都会干扰外科医生清晰观察手术区域。本研究探讨人工智能(AI)是否能在手术中充当实时标注器,使屏幕上的结石更为突出,从而有可能加快且提高治疗的安全性。

为什么肾结石难以处理

肾结石影响了全球大批成年人,可能导致剧烈疼痛、感染甚至肾功能衰竭。现代治疗常采用柔性输尿管镜,医生将可弯曲的带摄像头的镜子沿泌尿道进入肾脏,然后用激光将结石击成更小的碎片。然而,摄像画面远非完美。突发性出血、激光产生的尘雾、光照变化和快速运动都会使视野模糊。外科医生必须不断判断结石与周围组织的边界。如果遗漏了碎片,患者可能需要重复手术;如果判断失误,发生并发症的风险也会增加。

教计算机识别结石

为应对这一挑战,研究人员训练了一款计算机程序,自动在内镜视频流中勾画出肾结石的位置。他们收集了来自不同患者的12段完整手术录像,总计约11小时的真实手术视频。从这些视频中提取出数千帧图像,并构建了一个半自动的标注流程来确定结石位置。首先,由人工审阅者对可见结石画出简单的矩形框;随后另一个工具在这些框内生成更精确的形状,医务专家再核对这些形状是否匹配真实的结石区域。将这些图像与对应轮廓配对后用于训练基于U‑Net架构的深度学习模型,U‑Net是用于图像分割的常用网络,能够精确标记哪些像素属于结石。

Figure 1
Figure 1.

AI模型的表现如何

团队小心地划分数据:部分手术用于训练模型,部分用于微调,部分完全独立用于测试模型在新未见手术上的表现。在这些保留测试视频上,AI在每帧中正确分类了大部分像素,其预测的结石轮廓与专家标注有较强重叠。简单来说,当结石清晰可见且摄像图像锐利时,系统能画出紧密且准确的边界。该模型运行速度也很快:在标准图形卡上约每秒处理30帧,接近实时视频的帧率,表明在技术层面上有可能实现手术室内的实时应用。

视野变得混乱时

当视频更像“雪花飘落”而非清晰图像时,性能会下降。在存在大量出血、激光产生的浓重尘云或明显运动模糊的帧中,模型有时会将明亮的碎屑误判为结石,或完全漏检结石的部分。更细致的分析将“清晰”帧(杂物最少)与“模糊”帧(充满伪影)进行了比较,结果显示AI在清晰组的表现明显更好,证实可见度差会让即便是训练良好的算法也更难精确勾画。由于模型目前逐帧独立分析,它尚不能利用连续帧的运动信息来区分稳定存在的结石与短暂的尘埃或血迹。

Figure 2
Figure 2.

这对未来手术可能意味着什么

这项工作是早期探索,而非可直接投入医院使用的成熟工具。研究使用的录像数量有限,来自单一中心,且相机类型有限,标注过程仍可能包含人工与算法的误差。该系统尚未嵌入完整的手术流程,后者对可靠性、安全检查和硬件限制有更高要求。不过,结果表明AI模型可以从真实手术视频中学习识别并勾画肾结石,且处理速度可满足实时需求。随着更大规模且更多样化的数据集、对连续帧信息的更智能利用以及在真实手术室中的谨慎测试,类似系统未来有望通过使隐匿的结石更加醒目来协助外科医生,减少遗漏碎片并改善患者护理。

引用: El Hajj, A., Bou Mrad, A., Malik, E. et al. Automated kidney stone segmentation from flexible ureteroscopy videos using a U-net model: A preliminary feasibility study. Sci Rep 16, 14542 (2026). https://doi.org/10.1038/s41598-026-45143-7

关键词: 肾结石, 外科人工智能, 内镜视频, 医学影像, 深度学习