Clear Sky Science · zh
大型语言模型在子宫切除术后阴道穹窿脱垂外科治疗系统综述与荟萃分析中的应用
这为何与日常健康相关
随着女性寿命延长,盆腔器官脱垂——当盆腔器官下垂导致压迫感或突起——变得越来越常见。许多女性在子宫切除术后需要手术治疗此病,但临床上仍然存在关于哪种手术效果最佳且持久的争论。与此同时,医学研究迅速膨胀,使临床医生难以跟上进展。本研究同时应对这两个问题:比较治疗阴道穹窿脱垂的主要外科方案,并检验一种现代人工智能工具——大型语言模型——是否能在专家筛选医学证据时安全地提供帮助。

了解病情与手术选择
阴道穹窿脱垂发生在子宫切除后,阴道顶部下移,常伴有沉重感、可见肿块或排尿和排便功能障碍。外科医生可通过多种方式矫正这一问题。骶骨阴道固定术(sacrocolpopexy, SC)将阴道顶部提拉并固定到下脊柱的一条坚固韧带,通常经腹部进行,可采用开放、腹腔镜或机器人辅助技术。骶棘韧带固定术(sacrospinous fixation, SSF)则通过阴道将阴道固定到盆腔内的一条韧带。经阴道网片(transvaginal mesh, TVM)曾通过在阴道内放置合成材料提供额外支撑,但因网片并发症的担忧,一些国家包括美国已撤回这些产品。尽管使用多年,没有任何一种方法明确成为适用于所有女性的最佳方案。
研究者如何同时使用人力与机器
作者进行了系统综述与荟萃分析,这通常被视为总结医学证据的“金标准”。他们聚焦于随机对照试验——严格的比较治疗效果的研究——中关于子宫切除后阴道穹窿脱垂手术的试验。该研究不寻常之处在于:数据库检索之后的每一步都进行了双重处理:一方面由人工专家完成,另一方面由大型语言模型 ChatGPT 协助完成。该人工智能筛查研究标题与摘要,依据纳入标准检查全文,提取关于手术结果和并发症的详细数据,甚至协助生成统计代码与图表,同时临床医生对所有输出进行了复核。
临床证据对手术的显示
该综述纳入了18项随机试验,共1668名女性,随访时间为1至9年不等。总体而言,SC 对阴道穹窿提供了持久的支持,且开放与腹腔镜版本表现相似。在 SC 与 SSF 的比较中,有迹象表明 SC 可能会导致更少的再次脱垂手术,但差异在统计学上并不十分确定,且试验数量有限。TVM 在解剖学修复方面常常优于 SSF——尤其在三年随访时更明显——但这种收益伴随代价:更高的网片相关问题和再次手术率。所有技术中,大多数女性报告症状显著缓解及生活质量改善,但一些人在解剖学上被视为“失败”却并未出现令人不适的症状,强调成功不仅是医生在体检中看到的指标,也关乎女性日常的感受。

人工智能在与人工审稿者并行时的表现如何
在证据筛查中,人工智能表现出速度快且令人意外的可靠性,但并非万无一失。在筛查标题与摘要时,它与人工审稿者的一致性较高,且能正确排除大多数无关论文,然而它遗漏了近30%的相关试验——这一比例太高,若无监督则无法信任。在全文纳入决策中,一致性提高到94%以上,而在许多类型的数据提取中,准确率达约99%,有时甚至纠正了人工的错误。关于偏倚风险的评估(用于判断每项试验的可信度),总体一致性良好,但也显示出人和 AI 在处理诸如缺失结局或选择性报告等细微问题时都可能遇到困难。重要的是,AI 协助产生的所有统计结果均与传统分析一致,支持了该工作流程在技术上的可靠性。
这对患者与未来研究意味着什么
对于面临阴道穹窿脱垂手术的女性,这项研究强化了若干要点。骶骨阴道固定术仍是一种强有力且持久的选择,无论采取开放还是腹腔镜方法,与骶棘韧带固定相比,可能略微降低未来再次脱垂手术的风险,但确凿证据仍不足。经阴道网片在解剖学支持方面可达到很好的效果,但伴随更高的网片特异性并发症风险,这也解释了其在一些国家使用减少的原因。关键在于,没有一种手术在所有结局上都明显优越。因此,应依据持久性、并发症风险、手术可及性以及每位患者最看重的因素来个体化选择。在数字化方面,经过严格监督的 AI 工具在加速和澄清复杂证据综述方面显示出真实潜力,但尚不足以取代人的判断。相反,临床人员与 AI 的协作可能成为使外科决策与最佳可得证据保持一致的重要方式。
引用: Park, Y., Zhang, HS. & Bai, S.W. Large language models in systematic review and meta-analysis of surgical treatments for vaginal vault prolapse. npj Digit. Med. 9, 262 (2026). https://doi.org/10.1038/s41746-026-02431-w
关键词: 阴道穹窿脱垂手术, 骶骨阴道固定术, 经阴道网片, 系统综述, 医学中的人工智能