Clear Sky Science · fr
Un ensemble de données multimodal pour les applications neurophysiologiques et en IA
Pourquoi cela compte pour les enfants qui ont du mal à se concentrer
De nombreuses familles, enseignants et cliniciens savent combien il est difficile de distinguer l’agitation ou la rêverie ordinaires chez un enfant d’un signe de trouble du déficit de l’attention avec ou sans hyperactivité (TDAH). Les diagnostics actuels reposent encore principalement sur des entretiens et des questionnaires, sujets à l’oubli, aux attentes ou au stress. Cette étude présente le jeu de données BALLADEER TDAH, une vaste collection ouverte de mesures cérébrales et corporelles recueillies pendant que des enfants et des adolescents jouent à des jeux centrés sur l’attention. Elle vise à aider les chercheurs à développer des outils plus objectifs pour comprendre et identifier le TDAH — et à le faire de manière transparente et partageable à l’échelle mondiale. 
Du comportement en classe aux signaux du cerveau et du corps
Le TDAH touche environ un enfant scolarisé sur vingt, et influence leur attention, le contrôle des impulsions et le niveau d’activité. Comme ses symptômes se recoupent avec d’autres troubles, le diagnostic peut être délicat. Au cours des dernières décennies, les scientifiques se sont tournés vers les enregistrements cérébraux et d’autres signaux corporels pour chercher des indices biologiques plus nets. L’activité électrique du cuir chevelu (EEG) peut révéler des schémas liés à l’attention ; le suivi oculaire montre où et quand un enfant regarde des éléments importants ; et les variations de conductance cutanée ou du rythme cardiaque reflètent le stress et l’éveil. Toutefois, la plupart des études antérieures utilisaient de petits jeux de données privés, impossibles à vérifier ou à réutiliser librement. De ce fait, de nombreuses découvertes prometteuses n’ont pas pu être testées en profondeur ni transformées en outils fiables du quotidien.
Construire une image riche et partagée de l’attention
Le projet BALLADEER a cherché à changer cela en collectant un jeu de données multimodal — c’est‑à‑dire un ensemble coordonné de mesures issues de plusieurs sources simultanément. L’équipe a enregistré des données de 164 enfants et adolescents âgés de 6 à 18 ans, dont 62 avec un diagnostic de TDAH et 102 sans. Lors de sessions étalées sur deux jours, les participants ont réalisé une batterie de tests papier‑crayon bien connus ainsi que des tâches informatiques et en réalité virtuelle reproduisant des défis d’attention du quotidien. Pendant qu’ils jouaient et résolvaient des exercices, les chercheurs ont enregistré l’activité électrique du cerveau avec des casques EEG, les mouvements oculaires avec une barre de suivi placée sous l’écran, et des signaux tels que la fréquence cardiaque et la conductance cutanée à partir d’un appareil porté au poignet. Le tout a été assorti de journaux détaillés de ce qui se passait à l’écran, seconde par seconde.
Des jeux d’attention qui ressemblent plus au jeu qu’au test
Pour rendre la collecte de données attractive et adaptée aux enfants, l’équipe a conçu des tâches ludiques. Dans « Attention Slackline », les enfants observent des drapeaux sur deux montagnes et appuient sur un bouton lorsque les motifs correspondent ; leurs ondes cérébrales, leur regard et leurs signaux cardiaques sont enregistrés en continu. Dans « Attention Robots », ils balayent des rangées de robots dessinés et ne sélectionnent que ceux présentant des caractéristiques précises, tandis que le système enregistre exactement quel robot ils regardent. Une plateforme commerciale nommée CogniFit propose une variété de courts exercices pour sonder la perception, la coordination et la résolution de problèmes, et un système de réalité virtuelle appelé Nesplora place les enfants dans une classe ou un aquarium simulés pour mesurer leur capacité à suivre des consignes en présence de distractions réalistes. Ensemble, ces tâches visent à solliciter l’attention soutenue, le contrôle des impulsions et la flexibilité mentale — des aptitudes souvent difficiles pour les personnes atteintes de TDAH. 
Comment les données sont capturées et organisées
Dans les coulisses, les chercheurs ont mis en place une configuration logicielle et matérielle dédiée pour synchroniser chaque appareil. Un serveur central basé sur Python démarre et arrête les enregistrements sur les casques EEG et les bracelets au même instant où un niveau de jeu commence et se termine. Les jeux envoient des messages horodatés chaque fois qu’un enfant répond ou qu’un événement clé apparaît à l’écran. Tous les signaux bruts et les journaux d’événements sont stockés sur un disque réseau sécurisé dans des formats simples et largement utilisés (CSV et JSON). La structure partagée comprend des dossiers étiquetés par ID utilisateur anonyme, tâche, date et type d’appareil, ainsi que des fichiers décrivant l’âge, le sexe et le statut TDAH de chaque participant sans révéler d’identités personnelles. Les auteurs ont délibérément évité un prétraitement intensif, afin que d’autres scientifiques puissent appliquer leurs propres méthodes de nettoyage et techniques d’analyse.
Forces, limites et perspectives
Le jeu de données BALLADEER se distingue parce qu’il combine plusieurs types de mesures recueillies simultanément sur un groupe relativement large de jeunes, et qu’il est entièrement ouvert pour téléchargement et analyse. Cela en fait un terrain d’essai précieux pour de nouvelles méthodes d’intelligence artificielle cherchant à repérer des schémas associés au TDAH ou à découvrir de nouveaux « biomarqueurs » numériques susceptibles de compléter le jugement clinique. Les auteurs précisent toutefois ses limites : l’échantillon provient d’une seule région, les sous‑types de TDAH n’ont pas été systématiquement étiquetés, et la taille reste modeste pour entraîner de très grands modèles d’apprentissage profond. Certains enregistrements contiennent du bruit lié aux mouvements, et il n’existe pas de condition de repos séparée. Plutôt que de masquer ces problèmes, l’équipe les documente afin que les utilisateurs puissent concevoir des analyses rigoureuses.
Ce que cela signifie pour les familles et les soins futurs
Concrètement, ce jeu de données ne diagnostique aucun enfant à lui seul. Il offre plutôt aux chercheurs un microscope partagé puissant pour étudier comment les difficultés d’attention se manifestent dans le cerveau, les yeux et le corps lors de tâches réalistes. Avec le temps, les travaux basés sur BALLADEER pourraient aider les cliniciens à aller au‑delà des listes de contrôle et de l’intuition en ajoutant des mesures objectives et fondées sur les données à leur boîte à outils. Cela pourrait conduire à une identification plus précoce et plus précise du TDAH, à un meilleur suivi des réponses au traitement et à des décisions plus équitables dans les écoles et les cliniques. En transformant des activités ludiques en mesures précises et en partageant ces données ouvertement, l’étude jette les bases d’une nouvelle génération de soutiens fondés sur la science pour les enfants qui ont du mal à se concentrer.
Citation: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7
Mots-clés: TDAH, EEG, eye tracking, signaux physiologiques, apprentissage automatique