Clear Sky Science · zh
UltraReporter:将口头诊断提示转为结构化超声检查报告的深度语言模型方法
把话语变成节省的时间
在医生进行超声检查时,他们必须同时应对两项繁重任务:精心扫描患者和匆忙地通过键入或点击完成详细报告。撰写这些文书工作往往比扫描本身耗时更久,而且容易因疲劳而出现一些虽小但重要的错误。本文介绍了UltraReporter,一种人工智能系统,它能听取医生在检查过程中已经会说出的简短语句,并在约一秒钟内自动将其转化为润色过的、结构化的报告。对患者而言,这意味着更快的就诊和更一致的记录;对临床人员而言,它能帮助挽回时间并减少职业倦怠。
超声室里的新帮手
在许多医院,超声是常用的影像工具,用于肝脏、胆囊、肾脏、甲状腺及其他器官。其速度和安全性导致检查量大幅上升,使超声技师和放射科医师面临强烈的报告压力。传统上,自动化报告的尝试要么是转录长段的口述内容,要么尝试直接解读图像。这两种方法在真实临床环境中都存在困难:完整口述仍需数分钟并需编辑,而仅基于图像的系统常在嘈杂的超声图像上解读错误。UltraReporter 则融入了医生已有的工作流程。当医生扫描时,他们自然而然地会呼喊出诸如“肝囊肿,一点二乘一点一”之类的简短提示。UltraReporter 会听取这些语句,将其转换为文本,然后把它们扩展为完整的、模板化的报告,供检查和签署。

从空中构建数据
设计这样一个系统面临一个关键问题:几乎没有现成的真实口述提示与最终超声报告配对的数据。研究人员通过一个多代理人工智能流水线解决了这个问题,该流水线能有效地从现有文本报告中合成出真实感强的训练数据。一种 AI“提示模拟器”学会将完整报告压缩为简短、类似医生的要点短语。第二种 AI“报告生成器”学会将这些提示扩展回结构良好的叙述。第三种“质量评估器”按准确性、完整性、清晰度等指标对每对合成样本打分,剔除不达标的样本。该过程产生了超过21,000对高质量的提示—报告样本,覆盖数百个身体部位和数千种疾病,为系统提供了丰富的基础,而无需额外的人工标注。
教系统医院的习惯
除了通用医学知识外,真实世界的报告还必须遵循本地的写作习惯:熟悉的标题、偏爱的短语以及描述常见发现的特定方式。为此,团队增加了第二阶段训练,称为模板增强微调。在此阶段,UltraReporter 不仅从提示与报告中学习,还从近200个真实机构模板库中学习,这些模板与相应的器官和疾病相匹配。这会促使模型采用标准措辞和布局,从而提高不同患者和提供者间的一致性。最后一个训练步骤称为缺陷导向的偏好优化,教会系统发现并纠正自身的细微错误。当模型混淆测量值或遗漏关键细节时,另一种 AI 会标记该缺陷并生成明确偏好更正版本的训练示例,从而强化模型的临床推理能力。

从语音到报告只需一秒
为了在繁忙的检查室工作,系统必须处理混乱的真实语音。作者将耐噪的语音识别器与在医学中文上微调的语言模型配对,以避免诸如“门静脉”之类的术语被听错为日常词语。识别出的提示随后传递给训练好的 UltraReporter 模型,几乎即时生成涵盖检查发现和印象的结构化报告。安全性为内建设计:系统会计算每段文本的置信度,尤其是数字和诊断。任何低置信度的片段都会在医生界面中被高亮,提示需要二次核查的地方。在阅片研究中,独立专家常常认为 UltraReporter 的报告与或优于医师撰写的报告,在常规使用中,大多数生成报告被评为与原始报告相当。
这对患者与临床人员意味着什么
UltraReporter 表明:在接受了合适数据并经过精心训练的情况下,相对紧凑的语言模型——远小于许多引人注目的大型系统——可在一个聚焦且实用的任务上达到或超过专家水平。通过将医生已有的简短口述转换为完整、标准化的报告,它有潜力把文书时间缩短到数秒,同时不剥夺临床人员的控制权。对患者而言,这可能意味着更多面对面的时间和更少的文书延误。对医疗系统而言,它提供了一种蓝图:使用分步的 AI 框架、基于本地模板并辅以人工监督,以安全且可扩展的方式改造日常临床流程。
引用: Hao, P., Zhang, J., Zhang, S. et al. UltraReporter for transforming spoken diagnostic cues into structured ultrasound reports with large language models. Sci Rep 16, 13662 (2026). https://doi.org/10.1038/s41598-026-41439-w
关键词: 超声报告, 医疗人工智能, 语音转报告, 临床文书, 大规模语言模型