Clear Sky Science · zh
在树木中寻找森林:使用机器学习与在线认知和知觉测量来预测成年自闭症诊断
为什么识别成年自闭症如此困难
许多自闭症成年人在得到诊断之前要等上数年甚至数十年,部分原因是用于识别成年自闭症的工具过于粗糙。简短的问卷和访谈可能会漏掉那些已学会在社交场合“融入”的人,并且这些方法容易受到偏见和主观判断的影响。这项研究探讨了另一种方法——将客观的在线思维与知觉测试与现代机器学习相结合——能否更好地筛查出可能是自闭症的人,并以一种可通过互联网规模化提供的方式实现。

从简单测验到丰富的数字足迹
成人自闭症的传统筛查很大程度上依赖自我报告表,询问习惯、偏好和社交经历。此类方法有其价值,但也依赖于个体对自身行为的洞察以及文化期望。本文作者采取了另一条路径。他们重用了先前在线实验的数据,这些实验中数百名有与无自闭症的荷兰成年人完成了一系列计算机任务。这些任务涵盖了自闭症中常有差异的三个领域:人们如何整合视觉与听觉信息、如何从面部和声音中识别情绪,以及如何计划、切换和抑制行为——即所谓的执行功能。
测量人们如何看、感受与思考
在这些研究中,参与者观看和聆听短片段,从面部照片或语调中辨认情绪,并进行经典的反应时任务,这些任务要求快速反应或有意抑制。研究者并未仅关注答案的对错,而是提取了54项描述每位受试者表现的细致测量指标。这些指标包括反应速度、准确性随时间的变化、错误类型,以及在多次试验中的表现一致性。研究也纳入了年龄和性别,以公平地考虑这些已知会影响这些能力的因素。
让机器学习发现模式
为了解析这些高维数据,团队使用了一种常见的机器学习方法——随机森林,它构建多棵决策树并汇总它们的投票结果。他们训练模型以区分有自闭症与无自闭症的成年人,然后测试模型对未见个体的分类能力。即使在将组间在年龄和性别上仔细匹配——使任务更具挑战性——的情况下,仅使用基于表现的测量,模型仍大约能在四分之三的病例中正确识别出自闭症。当研究者随后加入一项额外信息——广泛使用的自闭症问卷的总分——组合模型的准确率跃升至约92%,同时漏检的自闭症个体和误报都很少。
任务执行方式中隐藏的线索
有趣的是,模型的成功并不完全依赖于最明显的群体差异。反应时,尤其是在情绪识别任务中的反应时,是重要贡献因素,这与早期研究一致,后者表明自闭症成年人常常能准确识别情绪,但速度较慢。然而,算法还在某些单独平均看似无显著差异的测量中发现了价值。这些包括抑制与工作记忆任务中的特定错误类型以及随时间的细微表现波动。换句话说,与其说某一项明显缺陷决定一切,不如说自闭症相关差异来自多种相互作用特征的星座,强调了行为的“旋律”比任何单一“音符”更重要。

迈向更快、更公平的成人支持
对外行而言,关键讯息是:简短、客观的在线任务——与现有问卷智能结合——能比仅靠问卷更清晰地描绘谁更可能是自闭症者。研究显示,即使传统统计方法只见微小差异,机器学习也能发掘出成年人在视觉、情感与思维方式上的可靠模式。尽管此类工具不能也不应取代完整的临床评估,但它们可帮助优先安排成人接受及时评估、减少对有偏见的自我报告的依赖,并为临床提供更丰富的认知优势与挑战图谱。经过在更多多样群体中的进一步改进与测试,这类可及的互联网筛查工具有望成为缩短漫长等待名单、尽早为自闭症成人提供适当支持的重要辅助。
引用: Van der Burg, E., Jertberg, R.M., Geurts, H.M. et al. Finding the forest in the trees: Using machine learning and online cognitive and perceptual measures to predict adult autism diagnosis. Transl Psychiatry 16, 129 (2026). https://doi.org/10.1038/s41398-026-03823-y
关键词: 成年自闭症诊断, 机器学习, 在线认知测试, 情绪识别, 执行功能