Clear Sky Science · zh

作为虚拟现实临床评估偏差来源的沉浸能力

2026-03-09 · 返回目录

为什么虚拟现实考试可能不像看起来那样公平

虚拟现实正在快速进入医院和教室，承诺提供逼真的训练与测试，同时不让真实患者承担风险。但这项研究提出了一个关键问题：当人们在头显中被评判时，我们真的在衡量他们的医疗技能，还是在衡量他们使用技术的能力？研究人员表明，一种他们称之为“沉浸能力”的隐性技能会在虚拟考试中倾斜赛场，这对教育和病患护理有重要影响。

学会在头显中生存

沉浸能力是指在虚拟世界中移动、抓取和控制事物的实际技巧。它包括使用手持控制器、理解三维空间以及应对陌生菜单和反馈。许多 VR 工具假定用户会“自己弄明白”，但这就偏向于那些已经玩电子游戏或使用三维软件的人。在医学和医疗保健领域，VR 现在被用来评估学生甚至诊断患者，这种隐性优势会模糊真正临床技能与纯粹技术熟练度之间的界限。然而，以往对基于 VR 的考试的综述几乎从未检查过这一偏差来源。

对比测试：VR 操作能力与医学表现

为探究这一问题，研究团队开展了一项随机对照试验，纳入 94 名高级医学生，其中 88 人完成了整个研究。学生被分配到三组之一。一组接受了使用抽象任务的通用 VR 训练，例如抓取漂浮物体或绕过障碍物。第二组在此基础上又额外在将用于测试的确切急诊室模拟中进行了练习。第三组只在正式临床场景——管理一名脓毒休克的虚拟患者——之前接受了类似许多 VR 系统当前提供的简短控制器熟悉训练。

训练如何改变虚拟急诊室的结果

关键发现是，只有在特定考试环境中练习的学生在临床核对表上的表现明显优于对照组，优势为中等到大。仅进行抽象 VR 任务的一般练习并未显著提升分数。这些绩效提升与操作效率密切相关：接受综合训练的学生在执行既有练习过的和新的医疗操作时均更快更流畅，尤其是在那些他们以前未见过的任务上。相比之下，传统笔试成绩并不能预测学生在 VR 急诊情境中的表现，强调了虚拟绩效指标捕捉到了超出书本知识的东西。

心理努力、既往经验与隐性不平等

研究还跟踪了学生感觉投入了多少心理努力，并通过皮电导监测了他们的压力反应。令人意外的是，那些没有特殊训练的学生报告在模拟中的认知负荷最低，但却取得了最差的临床结果。报告中等水平心理努力的学生往往表现最好，这表明在用户积极参与任务时，适度的挣扎实际上是有益的。然而，客观的应激测量并不能清晰地解释绩效差异。总体而言，学生在三维应用方面的既往经验非常少，这使得结论不够坚定，但有迹象表明，一旦通过训练消除了基本的交互障碍，具有更多数字经验的学生可能会获得更大的收益——这可能会扩大而非缩小表现差距。

为健康领域设计更公平的虚拟世界

除了数据，学生们报告说他们喜欢这类 VR 考试，并普遍认为只要有足够的练习机会，这种形式是公平的。那些没有专门训练的学生则更容易被笨拙的控制和界面障碍所分心。基于这些结果，作者认为应把沉浸能力视为一个可测量、可训练的因素，否则它会在被忽视时偏倚结果。他们提出了三条防护线：构建更直观、包容性的界面；常规检查绩效数据以发现数字优势的迹象；以及要么以标准化方式训练用户，要么在解释分数时对他们的 VR 技能进行统计校正。

这对患者和学习者意味着什么

对非专业读者来说，结论很直接：当我们把关键决策搬到虚拟空间——无论是给未来医生打分还是测试患者的认知与运动——我们必须确保不是仅仅在评判某人在头显里的舒适度。这项研究表明，在实际 VR 环境中进行短期、有针对性的练习可以显著提升表现，但如果设计不周，也可能放大已有的数字优势。将沉浸能力视为数字健康公平的核心部分，有助于确保 VR 工具成为促进公平评估与更好护理的助手，而不是新的隐性偏见来源。

引用: Schaal, J., Leutritz, T., Lindner, M. et al. Immersive competence as a source of bias in virtual reality clinical assessment. npj Digit. Med. 9, 280 (2026). https://doi.org/10.1038/s41746-026-02482-z

关键词: 虚拟现实评估, 沉浸能力, 医学教育, 数字健康公平, 模拟培训