Clear Sky Science · fr

Influences génétiques et environnementales sur les données manquantes en neurosciences cognitives du développement

2026-04-22 · Retour à l’index

Pourquoi il importe que des données d’enfants soient manquantes

Lorsque les scientifiques étudient le développement cérébral et comportemental des bébés, ils perdent souvent une quantité surprenante de données : un bébé détourne le regard, s’agace, ou un appareil connaît un problème. La plupart du temps, ces informations perdues sont traitées comme du bruit aléatoire et simplement écartées. Mais si le fait même que des données soient manquantes révèle quelque chose de réel sur l’enfant ou son environnement ? Cette étude se demande si la génétique et les circonstances familiales aident à expliquer quels nourrissons se retrouvent avec des données incomplètes lors de tests de laboratoire courants sur la fonction cérébrale et visuelle précoce.

Étudier la perte de données, pas seulement les résultats

Les chercheurs se sont appuyés sur un vaste projet de jumeaux en Suède qui a suivi près de 600 bébés de cinq mois. Tous étaient des jumeaux du même sexe, ce qui a permis à l’équipe de comparer des paires identiques, qui partagent essentiellement tous leurs gènes, avec des paires fraternelles, qui n’en partagent qu’environ la moitié. Lors d’une seule journée de test, chaque nourrisson a participé à trois types d’expériences de laboratoire standard en recherche sur le développement du cerveau : un test d’ondes cérébrales avec un casque EEG pendant que l’enfant regardait des motifs en mouvement à l’écran ; une tâche d’eye tracking mesurant si les bébés regardaient plus les yeux ou la bouche d’une personne ; et une tâche de pupillométrie qui suivait la réaction de la pupille à de brefs flashs lumineux.

Deux façons dont les données peuvent disparaître

Au lieu de se focaliser sur ce que faisaient le cerveau ou les yeux des bébés, les chercheurs ont examiné ce qui manquait. Au « niveau expérimental », ils ont demandé si un enfant avait dû être exclu d’une expérience entière parce qu’il n’y avait pas de données utilisables. Au « niveau essai », ils ont compté, au sein de chaque expérience, combien d’essais individuels ont produit des mesures valides après application de contrôles de qualité stricts. Fait crucial, ils ont considéré la donnée manquante elle‑même comme un trait, et utilisé des méthodes basées sur les jumeaux pour estimer dans quelle mesure la variation de cette absence de données pouvait être attribuée aux gènes, à des influences familiales partagées par les jumeaux, ou à des expériences individuelles propres à chaque enfant.

Gènes, famille et destin d’un point de donnée

Globalement, environ 40 % des nourrissons étaient absents d’au moins une des trois expériences, et 60 % ont fourni des données valides pour toutes. Pour cette mesure binaire large de participation, les différences entre enfants s’expliquaient surtout par des facteurs environnementaux. Les influences partagées au sein de la famille, telles que les routines générales, le comportement des parents ou des caractéristiques de la journée de test affectant les deux jumeaux, ont représenté une part notable de ceux qui se sont retrouvés exclus d’expériences. Les influences propres à un enfant — comme une distraction ponctuelle ou un petit problème technique — expliquaient le reste. Lorsque l’équipe s’est penchée sur les expériences individuelles, elle a constaté que l’exclusion de la tâche EEG présentait une composante génétique modérée, tandis que l’exclusion des deux tâches d’eye tracking était surtout déterminée par des facteurs environnementaux partagés.

Héritabilité cachée de la qualité des données

Le tableau a changé lorsque les chercheurs ont examiné la qualité des données essai par essai. Ici, des influences génétiques se sont révélées pour les trois expériences. Pour le suivi du regard et l’EEG, les gènes expliquaient une part modérée des différences du nombre d’essais utilisables. Pour la tâche de pupillométrie, plus de la moitié de la variation de la qualité des données au niveau des essais était liée à des facteurs génétiques, le reste étant dû à des expériences propres à l’individu. En revanche, l’environnement familial partagé n’a pas significativement façonné ces mesures au niveau des essais. Fait intéressant, il y avait très peu de recoupement de la qualité des données entre les trois expériences : un bébé qui produisait beaucoup d’essais valides dans une tâche n’était pas nécessairement plus susceptible d’en produire dans les autres, malgré le fait que toutes aient été réalisées le même jour, souvent avec le même expérimentateur.

Ce que les données manquantes nous disent vraiment

Pour vérifier des sources de biais familières, les auteurs ont également testé si l’absence de données était liée à des facteurs tels que le niveau d’éducation des parents, le revenu, le tempérament de l’enfant, ou la probabilité génétique d’autisme et de traits auto‑similaires ultérieurs. Après correction rigoureuse pour tests multiples, ils n’ont trouvé aucune preuve solide de tels liens dans cet échantillon de population générale, bien qu’ils notent que de faibles effets auraient pu passer inaperçus. Dans l’ensemble, les résultats montrent que les données manquantes dans les études sur le cerveau et le comportement des nourrissons ne sont pas simplement du bruit aléatoire : elles reflètent un mélange d’influences génétiques et d’expériences environnementales, et ces influences diffèrent selon la méthode et le niveau d’analyse.

Pourquoi les chercheurs doivent tenir compte des lacunes

Pour les non‑spécialistes, la conclusion est que lorsqu’un enfant n’a pas de données, c’est souvent pour des raisons systématiques liées à l’enfant ou à son contexte, et pas seulement à la malchance. Cela signifie que des choix analytiques courants qui supposent que les données sont manquantes complètement au hasard — comme l’élimination pure et simple des cas incomplets — peuvent fausser silencieusement les conclusions des études et limiter la généralisabilité des résultats. Les auteurs soutiennent que les scientifiques du développement devraient considérer la donnée manquante comme un signal significatif, adopter des méthodes statistiques plus avancées qui gèrent explicitement les pertes non aléatoires, et affiner les procédures de test pour réduire les lacunes de données évitables. En bref, comprendre pourquoi l’information manque est une part essentielle pour saisir comment le cerveau et le comportement des enfants se développent réellement.

Citation: Bussu, G., Portugal, A.M., Viktorsson, C. et al. Genetic and environmental influences on data missingness in developmental cognitive neuroscience. Commun Psychol 4, 70 (2026). https://doi.org/10.1038/s44271-026-00457-0

Mots-clés: données manquantes, développement cérébral des nourrissons, étude sur des jumeaux, eye tracking, pupillométrie