Clear Sky Science · es
Un conjunto de datos multimodal para aplicaciones neurofisiológicas e IA
Por qué importa para los niños que tienen dificultades para concentrarse
Muchas familias, docentes y clínicos saben lo difícil que puede ser distinguir si la inquietud o la ensoñación de un niño forman parte de la vida cotidiana o son un signo de Trastorno por Déficit de Atención con Hiperactividad (TDAH). Los diagnósticos actuales siguen basándose en gran medida en entrevistas y cuestionarios, que pueden verse afectados por la memoria, las expectativas o el estrés. Este estudio presenta el Conjunto de Datos BALLADEER sobre TDAH, una colección amplia y abierta de mediciones del cerebro y del cuerpo recogidas mientras niños y adolescentes juegan a tareas centradas en la atención. Está diseñada para ayudar a los investigadores a desarrollar herramientas más objetivas para comprender e identificar el TDAH, y hacerlo de forma transparente y compartible a nivel mundial. 
Del comportamiento en el aula a las señales del cerebro y del cuerpo
El TDAH afecta aproximadamente a uno de cada veinte niños en edad escolar, y condiciona cómo prestan atención, controlan los impulsos y regulan sus niveles de actividad. Debido a que sus síntomas se solapan con otras condiciones, el diagnóstico puede ser complicado. En las últimas décadas, los científicos han recurrido a registros cerebrales y otras señales corporales para buscar pistas biológicas más claras. La actividad eléctrica en el cuero cabelludo (EEG) puede revelar patrones vinculados a la atención; el seguimiento ocular muestra dónde y cuándo mira un niño detalles importantes; y cambios en la conductancia de la piel y el ritmo cardíaco reflejan estrés y estado de alerta. Sin embargo, la mayoría de estudios anteriores utilizaron conjuntos de datos pequeños y privados que no podían verificarse ni reutilizarse libremente. Como resultado, muchos hallazgos prometedores no pudieron someterse a pruebas exhaustivas ni convertirse en herramientas fiables de uso cotidiano.
Construir una imagen compartida y rica de la atención
El proyecto BALLADEER se propuso cambiar esto recopilando un conjunto de datos multimodal, es decir, un conjunto coordinado de mediciones procedentes de varias fuentes simultáneamente. El equipo registró datos de 164 niños y adolescentes de entre 6 y 18 años, incluidos 62 con diagnóstico de TDAH y 102 sin él. Durante sesiones repartidas en dos días, los participantes completaron una batería de pruebas tradicionales en papel y lápiz, así como tareas informáticas y de realidad virtual que imitan desafíos atencionales cotidianos. Mientras jugaban y resolvían problemas, los investigadores registraron la actividad eléctrica del cerebro con cascos de EEG, los movimientos oculares mediante una barra de seguimiento situada bajo el monitor, y señales como la frecuencia cardíaca y la conductancia de la piel con un dispositivo de pulsera. Todo esto se combinó con registros detallados de lo que ocurría en la pantalla segundo a segundo.
Juegos de atención que se parecen más al juego que a una prueba
Para que la recogida de datos fuera atractiva y adecuada para niños, el equipo diseñó tareas con aspecto de juego. En “Attention Slackline”, los niños observan banderas en dos montañas y aprietan un botón cuando los patrones coinciden; sus ondas cerebrales, la mirada y las señales cardíacas se registran de forma continua. En “Attention Robots”, escanean filas de robots de dibujos animados, seleccionando solo aquellos con características específicas, mientras el sistema registra exactamente qué robot están mirando. Una plataforma comercial llamada CogniFit presenta una variedad de ejercicios breves para sondear la percepción, la coordinación y la resolución de problemas, y un sistema de realidad virtual llamado Nesplora sitúa a los niños en un aula o un acuario simulados para medir qué tan bien siguen instrucciones en medio de distracciones realistas. En conjunto, estas tareas pretenden captar la atención sostenida, el control de impulsos y la flexibilidad mental: las habilidades que con frecuencia resultan difíciles para las personas con TDAH. 
Cómo se capturan y organizan los datos
Tras bambalinas, los investigadores construyeron una infraestructura de software y hardware dedicada para mantener todos los dispositivos sincronizados. Un servidor central basado en Python inicia y detiene las grabaciones en los cascos de EEG y las pulseras exactamente en el mismo instante en que comienza y termina un nivel del juego. Los juegos envían mensajes con marcas temporales cada vez que un niño responde o aparece un evento clave en pantalla. Todas las señales crudas y los registros de eventos se almacenan en una unidad de red segura en formatos sencillos y de uso común (CSV y JSON). La estructura compartida incluye carpetas etiquetadas por ID de usuario anónimo, tarea, fecha y tipo de dispositivo, junto con archivos que describen la edad, el sexo y el estado de TDAH de cada participante sin revelar identidades personales. Los autores evitaron deliberadamente un preprocesado intensivo, para que otros científicos puedan aplicar sus propios métodos de limpieza y técnicas de análisis.
Puntos fuertes, limitaciones y siguientes pasos
El conjunto de datos BALLADEER destaca porque combina varios tipos de mediciones recogidas simultáneamente en un grupo relativamente numeroso de jóvenes, y está completamente abierto para que otros lo descarguen y analicen. Esto lo convierte en un valioso banco de pruebas para nuevos métodos de inteligencia artificial que intenten detectar patrones vinculados al TDAH o descubrir nuevos “biomarcadores” digitales que puedan complementar el juicio clínico. Al mismo tiempo, los autores son claros sobre sus límites: la muestra procede de una única región, los subtipos de TDAH no se etiquetaron de forma sistemática y el tamaño continúa siendo modesto para entrenar modelos de aprendizaje profundo muy grandes. Algunas grabaciones contienen ruido relacionado con el movimiento y no existe una condición de estado de reposo separada. En lugar de ocultar estos problemas, el equipo los documenta para que los usuarios puedan diseñar análisis cuidadosos.
Qué significa esto para las familias y la atención futura
En términos prácticos, este conjunto de datos no diagnostica a ningún niño por sí solo. En cambio, ofrece a los investigadores un microscopio compartido y potente para estudiar cómo se manifiestan las dificultades de atención en el cerebro, los ojos y el cuerpo durante tareas realistas. Con el tiempo, los trabajos basados en BALLADEER podrían ayudar a los clínicos a ir más allá de las listas de verificación y la intuición, sumando medidas objetivas y basadas en datos a su caja de herramientas. Eso podría conducir a una identificación del TDAH más temprana y precisa, a un mejor seguimiento de cómo responden los niños al tratamiento y a decisiones más justas en escuelas y clínicas. Al convertir actividades parecidas al juego en mediciones precisas y compartir esos datos abiertamente, el estudio sienta las bases para una nueva generación de apoyos basados en la ciencia para los niños que tienen dificultades para concentrarse.
Cita: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7
Palabras clave: TDAH, EEG, seguimiento ocular, señales fisiológicas, aprendizaje automático