Clear Sky Science · zh
面向儿科近视的神经网络中稳健且可解释的个体层因果推断
这为何对家庭和医生重要
儿童期的近视正在全球,尤其是东亚地区,以惊人的速度上升。父母想知道哪些习惯、身体特征和家庭因素是真正导致孩子视力变差的原因,而不仅仅是与视力不良“同时出现”的关联因素。与此同时,现代人工智能(AI)工具可以预测谁会变成近视,但它们常常像不透明的黑箱。本研究把这两类领域结合起来,展示了如何重新设计神经网络,以逐个儿童、逐项因素地揭示哪些具体因素很可能导致近视发生,从而让医生能够理解并信赖这些结论。

随访数千名儿童的长期研究
研究者分析了安阳儿童眼科研究(Anyang Childhood Eye Study)中的数据,这是一个在中国中部以学校为基础的大型项目,随访了3000多名一年级学生长达六年。每年,儿童都接受详细的眼部检查并回答有关日常生活的问卷。从这份丰富的记录中,研究团队提取出16个关键特征,涵盖行为(如近距离用眼和户外活动时间)、身体测量(如身高和脉搏)、饮食、眼结构(包括眼轴长度和角膜形态)以及家族戴镜史。他们训练了一个标准前馈神经网络来预测孩子在六年随访期间是否会发生近视,预测准确性可与逻辑回归、随机森林等强传统模型相媲美或更好。
把黑箱变成因果路径图
作者没有止步于预测,而是提出了更深层的问题:哪些输入是通过因果路径驱动这些预测的?他们首先使用因果发现算法,仅基于观察数据推断出16个特征之间的有向关系网络。该图与许多已知临床联系一致——例如,父母近视、性别、调节能力和角膜曲率都会影响眼轴长度和屈光度,而眼轴长度又影响光在眼内的聚焦。随后,团队将该因果图覆盖到神经网络的输入层,把每个输入神经元分为三类:不与其他输入发生因果或依赖关系的孤立单元、通过干净中介链发挥作用的纯单元,以及其效应与其他变量交织在一起的混淆单元。
洞察不同类型的输入
对于孤立单元,例如脉搏或某些饮食测量,作者估计仅改变该单一特征会如何将网络输出向“近视”或“非近视”方向移动。较高的脉搏率可能反映更好的血流,其在结果中显示对近视具有保护作用,这与早期医学研究一致。一些其他孤立因素,如碳酸饮料和鸡蛋摄入,呈现出与既往报道相冲突的模式,这可能是由于队列中特定子组饮食不平衡所致。对于纯单元(包括身高、性别、父母近视、调节能力和角膜曲率),团队沿着因果图追踪了直接和间接路径。例如他们证实,身材较高的儿童通常眼轴更长、近视概率更高,但这并非身高本身有害,而是因为眼部生长随身体生长一起发生。

用更聪明的统计方法处理交织影响
最具挑战性的因素——眼轴长度和散瞳屈光度——既是近视的核心因素,又与其他眼部特征高度交织。为了解决这些混淆单元,研究者构建了一个领域自适应的元学习系统,使用类似现代因果推断的技术对数据进行再平衡。通过估计每个儿童落入不同“处理”水平(例如不同眼轴长度或屈光度)的概率,并使用一组基于树的模型的集成,他们能够估计这些测量变化将如何因果性地影响预测的近视风险。所得模式,例如眼轴更长会提高风险、调节能力较弱与更严重的近视相关,均与长期临床认识高度一致。一系列“反驳”测试——加入伪混淆变量、重抽样数据和使用安慰剂变量——表明这些因果估计是稳定的,而非过拟合的伪像。
为更清晰、更公平的医学AI带来的意义
总之,该研究表明,可以将用于儿科近视的深度神经网络拆解为与真实生物学相呼应的有意义模块,而非不透明的数值技巧。通过将输入分类为孤立、纯和混淆三类,然后对每类采用定制的因果方法,该框架揭示了哪些生活方式因素看起来确有保护作用、哪些身体测量可作为早期预警信号,以及模型内部逻辑在哪些地方与医学共识存在冲突。虽然该工作不能替代临床试验,但它为在AI指导医疗之前检查和改进这些工具提供了强有力的视角。更广泛地讲,该方法与模型无关,亦可应用于其他健康问题,推动医学AI走向不仅准确,而且透明、可检验并与精准与公平医疗目标一致的系统。
引用: Jin, Z., Kang, M., Zhao, W. et al. Robust and interpretable unit level causal inference in neural networks for pediatric myopia. npj Digit. Med. 9, 263 (2026). https://doi.org/10.1038/s41746-026-02442-7
关键词: 儿童近视, 因果推断, 可解释人工智能, 神经网络, 数字医学