Clear Sky Science · ru

Генетическое и окружениевое влияние на пропуски данных в развитийной когнитивной нейронауке

· Назад к списку

Почему важно, когда данные о младенцах теряются

Когда учёные изучают развитие мозга и поведения младенцев, они нередко теряют внушительную часть данных: ребёнок отвлекается, начинает капризничать или оборудование даёт сбой. Чаще всего эти упущенные сведения рассматривают как случайный шум и просто отбрасывают. Но что если сам факт отсутствия данных сообщает нам нечто важное о ребёнке или его окружении? В этом исследовании спрашивают, помогают ли генетика и семейные обстоятельства объяснить, у каких младенцев оказываются неполные данные в типичных лабораторных тестах ранней работы мозга и визуальных функций.

Figure 1
Figure 1.

Смотрят на потерю данных, а не только на результаты

Исследователи опирались на крупный проект по изучению близнецов в Швеции, в котором участвовали почти 600 пятимесячных младенцев. Все были одно‑полыми парами близнецов, что позволило команде сравнить идентичных (монозиготных) пар, у которых практически совпадают гены, и дизиготных пар, у которых совпадает примерно половина генов. В один тестовый день каждый младенец прошёл три стандартных для исследований развития мозга эксперимента: измерение мозговой активности с помощью EEG‑шапочки во время просмотра двигающихся узоров; задание с отслеживанием взгляда, в котором оценивали, смотрит ли младенец больше на глаза или рот человека; и пупиллометрическое задание, фиксирующее реакцию зрачков на краткие вспышки света.

Два уровня исчезновения данных

Вместо того чтобы сосредотачиваться на том, что делал мозг или глаза младенцев, исследователи сосредоточились на том, чего не хватало. На «уровне эксперимента» они проверяли, исключали ли ребёнка целиком из какого‑то эксперимента из‑за отсутствия пригодных данных. На «уровне проб» они считали, в каждом эксперименте, сколько отдельных проб дали валидные показатели после применения строгих процедур контроля качества. Важно, что они рассматривали само отсутствие данных как признак и использовали методы исследований близнецов, чтобы оценить, какая доля вариации в пропусках объясняется генами, общесемейными факторами, разделяемыми близнецами, или индивидуальными факторами, уникальными для каждого ребёнка.

Figure 2
Figure 2.

Гены, семья и судьба одного фрагмента данных

В целом около 40% младенцев отсутствовали в как минимум одном из трёх экспериментов, а 60% дали пригодные данные во всех. Для этого широкого бинарного показателя участия различия между младенцами лучше всего объяснялись факторами окружения. Влияния, общие для семьи — такие как повседневные рутинные факторы, поведение родителей или особенности тестового дня, затронувшие обоих близнецов — объясняли значительную долю того, кто оказался исключён из эксперимента. На долю уникальных для ребёнка факторов — например однократного отвлечения или небольшого технического сбоя — приходилась остальная часть. При более детальном разборе отдельных экспериментов исключение из EEG‑задания показало умеренную генетическую составляющую, тогда как исключения из двух задач с отслеживанием взгляда в основном определялись разделяемыми семейными факторами.

Скрытая наследственность в качестве данных

Картина изменилась, когда исследователи рассмотрели качество данных на уровне отдельных проб. Здесь генетическое влияние проявилось во всех трёх экспериментах. Для задач по отслеживанию взгляда и EEG гены объясняли умеренную долю различий в числе пригодных проб. Для пупиллометрии более половины вариации качества данных на уровне проб связывали с генетическими факторами, а остальную часть — с индивидуальным опытом ребёнка. В то же время общесемейная среда существенно не влияла на эти показатели на уровне проб. Примечательно, что перекрытие качества данных между тремя экспериментами было очень небольшим: малыш, который дал много хороших проб в одном задании, не обязательно давал их и в других, хотя все эксперименты проводились в один день, часто с одним и тем же тестировщиком.

Что на самом деле говорят пропущенные данные

Чтобы проверить знакомые источники смещения, авторы также исследовали, связана ли пропущенность данных с факторами вроде уровня образования родителей, дохода, темперамента ребёнка или генетического риска аутизма и последующих аутистоподобных черт. После строгой коррекции на множественные сравнения они не обнаружили убедительных связей в этой выборке из общей популяции, хотя отмечают, что небольшие эффекты могли остаться незамеченными. В целом результаты показывают, что пропуски данных в исследованиях мозга и поведения младенцев — это не просто случайный шум: они отражают смесь генетических влияний и влияний окружения, причём эти влияния различаются в зависимости от метода и уровня анализа.

Почему исследователям важно обращать внимание на пробелы

Для неспециалистов вывод таков: когда данные о младенцах пропадают, это часто связано с системными причинами, зависящими от ребёнка или его контекста, а не просто с невезением. Это означает, что распространённые приёмы анализа, предполагающие, что данные отсутствуют полностью случайно — например простое исключение неполных случаев — могут незаметно искажать выводы исследования и ограничивать степень их обобщения. Авторы утверждают, что учёным, работающим с развитием, следует рассматривать пропуски как информативный сигнал, применять более продвинутые статистические методы, которые явно учитывают неслучайную потерю данных, и совершенствовать процедуры тестирования, чтобы уменьшить предотвратимые пробелы. Коротко говоря, понимание причин отсутствия информации — важная часть понимания того, как на самом деле развивается мозг и поведение детей.

Цитирование: Bussu, G., Portugal, A.M., Viktorsson, C. et al. Genetic and environmental influences on data missingness in developmental cognitive neuroscience. Commun Psychol 4, 70 (2026). https://doi.org/10.1038/s44271-026-00457-0

Ключевые слова: пропущенные данные, развитие мозга у младенцев, исследование близнецов, отслеживание взглядов, пупиллометрия