Clear Sky Science · zh

UltraReporter：将口头诊断提示转为结构化超声检查报告的深度语言模型方法

2026-03-16 · 返回目录

把话语变成节省的时间

在医生进行超声检查时，他们必须同时应对两项繁重任务：精心扫描患者和匆忙地通过键入或点击完成详细报告。撰写这些文书工作往往比扫描本身耗时更久，而且容易因疲劳而出现一些虽小但重要的错误。本文介绍了UltraReporter，一种人工智能系统，它能听取医生在检查过程中已经会说出的简短语句，并在约一秒钟内自动将其转化为润色过的、结构化的报告。对患者而言，这意味着更快的就诊和更一致的记录；对临床人员而言，它能帮助挽回时间并减少职业倦怠。

超声室里的新帮手

在许多医院，超声是常用的影像工具，用于肝脏、胆囊、肾脏、甲状腺及其他器官。其速度和安全性导致检查量大幅上升，使超声技师和放射科医师面临强烈的报告压力。传统上，自动化报告的尝试要么是转录长段的口述内容，要么尝试直接解读图像。这两种方法在真实临床环境中都存在困难：完整口述仍需数分钟并需编辑，而仅基于图像的系统常在嘈杂的超声图像上解读错误。UltraReporter 则融入了医生已有的工作流程。当医生扫描时，他们自然而然地会呼喊出诸如“肝囊肿，一点二乘一点一”之类的简短提示。UltraReporter 会听取这些语句，将其转换为文本，然后把它们扩展为完整的、模板化的报告，供检查和签署。

从空中构建数据

设计这样一个系统面临一个关键问题：几乎没有现成的真实口述提示与最终超声报告配对的数据。研究人员通过一个多代理人工智能流水线解决了这个问题，该流水线能有效地从现有文本报告中合成出真实感强的训练数据。一种 AI“提示模拟器”学会将完整报告压缩为简短、类似医生的要点短语。第二种 AI“报告生成器”学会将这些提示扩展回结构良好的叙述。第三种“质量评估器”按准确性、完整性、清晰度等指标对每对合成样本打分，剔除不达标的样本。该过程产生了超过21,000对高质量的提示—报告样本，覆盖数百个身体部位和数千种疾病，为系统提供了丰富的基础，而无需额外的人工标注。

教系统医院的习惯

除了通用医学知识外，真实世界的报告还必须遵循本地的写作习惯：熟悉的标题、偏爱的短语以及描述常见发现的特定方式。为此，团队增加了第二阶段训练，称为模板增强微调。在此阶段，UltraReporter 不仅从提示与报告中学习，还从近200个真实机构模板库中学习，这些模板与相应的器官和疾病相匹配。这会促使模型采用标准措辞和布局，从而提高不同患者和提供者间的一致性。最后一个训练步骤称为缺陷导向的偏好优化，教会系统发现并纠正自身的细微错误。当模型混淆测量值或遗漏关键细节时，另一种 AI 会标记该缺陷并生成明确偏好更正版本的训练示例，从而强化模型的临床推理能力。

从语音到报告只需一秒

为了在繁忙的检查室工作，系统必须处理混乱的真实语音。作者将耐噪的语音识别器与在医学中文上微调的语言模型配对，以避免诸如“门静脉”之类的术语被听错为日常词语。识别出的提示随后传递给训练好的 UltraReporter 模型，几乎即时生成涵盖检查发现和印象的结构化报告。安全性为内建设计：系统会计算每段文本的置信度，尤其是数字和诊断。任何低置信度的片段都会在医生界面中被高亮，提示需要二次核查的地方。在阅片研究中，独立专家常常认为 UltraReporter 的报告与或优于医师撰写的报告，在常规使用中，大多数生成报告被评为与原始报告相当。

这对患者与临床人员意味着什么

UltraReporter 表明：在接受了合适数据并经过精心训练的情况下，相对紧凑的语言模型——远小于许多引人注目的大型系统——可在一个聚焦且实用的任务上达到或超过专家水平。通过将医生已有的简短口述转换为完整、标准化的报告，它有潜力把文书时间缩短到数秒，同时不剥夺临床人员的控制权。对患者而言，这可能意味着更多面对面的时间和更少的文书延误。对医疗系统而言，它提供了一种蓝图：使用分步的 AI 框架、基于本地模板并辅以人工监督，以安全且可扩展的方式改造日常临床流程。

引用: Hao, P., Zhang, J., Zhang, S. et al. UltraReporter for transforming spoken diagnostic cues into structured ultrasound reports with large language models. Sci Rep 16, 13662 (2026). https://doi.org/10.1038/s41598-026-41439-w

关键词: 超声报告, 医疗人工智能, 语音转报告, 临床文书, 大规模语言模型