Clear Sky Science · zh

发展认知神经科学中数据缺失的遗传与环境影响

· 返回目录

婴儿数据缺失为何重要

当科学家研究婴儿的大脑与行为如何发展时,经常会丢失出人意料的大量数据:婴儿移开视线、情绪烦躁,或仪器出现故障。大多数情况下,这些丢失的信息被当作随机噪声处理并简单丢弃。但如果数据缺失本身就揭示了关于儿童或其环境的真实信息呢?本研究探讨遗传与家庭环境是否有助于解释在典型的早期大脑与视觉功能实验中,哪些婴儿会出现不完整的数据。

Figure 1
Figure 1.

关注数据缺失,而不仅仅是结果

研究人员利用一项在瑞典进行的大型双胞胎项目,追踪了近600名五个月大的婴儿。所有参与者均为同性双胞胎,这使团队得以比较基因几乎相同的同卵双胞胎与仅共享约一半基因的异卵双胞胎。在同一天的测试中,每位婴儿参加了三类在发展脑科学研究中常用的实验:佩戴脑电图帽在屏幕上观看运动图案的脑电(EEG)测试;测量婴儿是更注视人脸的眼睛还是嘴部的眼动追踪任务;以及记录瞳孔对短促闪光反应的瞳孔测量任务。

数据消失的两种层面

研究者没有专注于婴儿大脑或眼睛的表现,而是关注什么被遗漏。在“实验层面”,他们询问某个孩子是否因为没有可用数据而被排除在整个实验之外。在“试次层面”,他们在每个实验内统计在严格质量检查后有多少单个试次产生了有效读数。关键在于,他们将缺失的数据本身作为一种性状来处理,并使用双胞胎方法来估算缺失变异中有多少可以追溯到基因、到双胞胎共享的家庭影响,或到每个孩子独特的个体经历。

Figure 2
Figure 2.

基因、家庭与数据点的命运

总体上,大约40%的婴儿在至少一项实验中出现数据缺失,60%的婴儿为所有实验都提供了有效数据。对于这种宽泛的有无参与度量,婴儿之间的差异主要由环境因素解释。家庭内部共享的影响,例如日常作息、父母行为或影响双胞胎双方的测试日特征,解释了相当一部分谁会在实验中缺席。属于单个孩子的独特影响——例如一次性的分心或小范围的技术故障——解释了其余部分。当团队聚焦于单项实验时发现,被排除在EEG任务之外呈现出中等程度的遗传成分,而在两项眼动追踪任务中被排除则主要由家庭共享环境因素决定。

数据质量中的隐性遗传性

当研究者检查逐试次的数据质量时,情形发生了变化。在这一层面上,三项实验中都出现了遗传影响的迹象。对于注视追踪和EEG任务,基因解释了可用试次数差异的中等比例。在瞳孔测量任务中,超过一半的试次级数据质量差异与遗传因素相关,其余由个体特有的经历决定。相比之下,家庭共享环境对这些试次层面的度量并未起到显著影响。有趣的是,三项实验之间的数据质量重叠很少:在一项任务中产生许多有效试次的婴儿,并不一定更可能在其他任务中也有类似表现,即便这些实验通常在同一天、常由同一名测试者完成。

缺失数据真正告诉我们的是什么

为检查常见偏倚来源,作者还测试了缺失情况是否与父母教育、收入、婴儿气质,或对自闭症及后期类自闭特征的遗传易感性等因素相关。在对多重检验进行严格校正后,他们在这份一般人群样本中没有发现强烈证据支持这些关联,尽管他们指出小效应可能未被检测到。总体而言,研究结果表明婴儿大脑与行为研究中的数据缺失并非单纯的随机噪声:它反映了遗传影响与环境经历的混合,而这些影响因方法与分析层次而异。

研究者为何应关注这些空白

对于非专业读者,可得出的要点是:婴儿数据缺失往往有系统性原因,往往与孩子或其情境有关,而不仅仅是运气不好。这意味着常见的假设数据完全随机缺失的分析选择——例如简单删除不完整个案——可能在不知不觉中扭曲研究结论并限制结果的可推广性。作者建议,发展科学研究者应将缺失本身视为有意义的信号,采用能明确处理非随机缺失的更先进统计方法,并改进测试流程以减少可避免的数据空白。简言之,理解信息为何缺失是理解儿童大脑与行为真实发展过程的必要环节。

引用: Bussu, G., Portugal, A.M., Viktorsson, C. et al. Genetic and environmental influences on data missingness in developmental cognitive neuroscience. Commun Psychol 4, 70 (2026). https://doi.org/10.1038/s44271-026-00457-0

关键词: 数据缺失, 婴儿大脑发育, 双胞胎研究, 眼动追踪, 瞳孔测量法