Clear Sky Science · pt

Um conjunto de dados multimodal para aplicações neurofisiológicas e de IA

· Voltar ao índice

Por que isso importa para crianças que têm dificuldade de se concentrar

Muitas famílias, professores e clínicos sabem como é difícil distinguir se a inquietação ou o sonho acordado de uma criança faz parte do comportamento cotidiano ou é um sinal de Transtorno do Déficit de Atenção com Hiperatividade (TDAH). Os diagnósticos atuais ainda dependem em grande parte de entrevistas e questionários, que podem ser influenciados pela memória, expectativas ou estresse. Este estudo apresenta o Conjunto de Dados BALLADEER sobre TDAH, uma grande coleção aberta de medições cerebrais e corporais coletadas enquanto crianças e adolescentes jogam jogos focados em atenção. Foi concebido para ajudar pesquisadores a construir ferramentas mais objetivas para entender e identificar o TDAH — e fazê‑lo de modo transparente e compartilhável mundialmente.

Figure 1
Figure 1.

Do comportamento em sala de aula aos sinais do corpo e do cérebro

O TDAH afeta cerca de uma em cada vinte crianças em idade escolar, influenciando como elas prestam atenção, controlam impulsos e regulam os níveis de atividade. Como seus sintomas se sobrepõem a outras condições, o diagnóstico pode ser complexo. Nas últimas décadas, cientistas recorreram a registros cerebrais e outros sinais corporais para buscar pistas biológicas mais claras. A atividade elétrica do couro cabeludo (EEG) pode revelar padrões associados à atenção; o rastreamento ocular mostra onde e quando a criança olha para detalhes importantes; e variações na condutância da pele e no ritmo cardíaco refletem estresse e nível de alerta. Porém, a maioria dos estudos anteriores usou conjuntos de dados pequenos e privados que não podiam ser verificados ou reutilizados livremente. Como resultado, muitos achados promissores não puderam ser testados de forma abrangente nem transformados em ferramentas confiáveis para uso cotidiano.

Construindo um retrato compartilhado e rico da atenção

O projeto BALLADEER buscou mudar esse cenário coletando um conjunto de dados multimodal — isto é, um conjunto coordenado de medições de várias fontes ao mesmo tempo. A equipe registrou dados de 164 crianças e adolescentes entre 6 e 18 anos, incluindo 62 com diagnóstico de TDAH e 102 sem. Durante sessões distribuídas em dois dias, os participantes completaram uma bateria de testes clássicos em papel e lápis, além de tarefas baseadas em computador e em realidade virtual que imitam desafios de atenção do cotidiano. Enquanto jogavam e resolviam problemas, os pesquisadores registraram a atividade elétrica do cérebro usando headsets de EEG, os movimentos oculares com uma barra de rastreamento montada sob o monitor, e sinais como frequência cardíaca e condutância da pele a partir de um dispositivo de pulso. Tudo isso foi emparelhado com registros detalhados do que acontecia na tela segundo a segundo.

Jogos de atenção que parecem mais brincadeira do que teste

Para tornar a coleta de dados envolvente e amigável para crianças, a equipe projetou tarefas em formato de jogo. Em “Attention Slackline”, as crianças observam bandeiras em duas montanhas e apertam um botão quando os padrões coincidem; suas ondas cerebrais, olhar e sinais cardíacos são registrados continuamente. Em “Attention Robots”, elas escaneiam fileiras de robôs em estilo cartoon, selecionando apenas aqueles com características específicas, enquanto o sistema registra exatamente em qual robô estão olhando. Uma plataforma comercial chamada CogniFit apresenta uma variedade de exercícios curtos para avaliar percepção, coordenação e resolução de problemas, e um sistema de realidade virtual chamado Nesplora coloca as crianças em uma sala de aula ou aquário simulados para medir o quanto seguem instruções em meio a distrações realistas. Juntas, essas tarefas visam capturar atenção sustentada, controle de impulsos e flexibilidade mental — habilidades que frequentemente representam desafio para pessoas com TDAH.

Figure 2
Figure 2.

Como os dados são capturados e organizados

Nos bastidores, os pesquisadores construíram uma infraestrutura de software e hardware dedicada para manter todos os dispositivos sincronizados. Um servidor central baseado em Python inicia e para gravações nos headsets de EEG e nas pulseiras no mesmo momento em que um nível de jogo começa e termina. Os jogos enviam mensagens com carimbo de tempo sempre que uma criança responde ou um evento chave aparece na tela. Todos os sinais brutos e os registros de eventos são armazenados em um drive de rede seguro em formatos simples e amplamente usados (CSV e JSON). A estrutura compartilhada inclui pastas rotuladas por ID de usuário anônimo, tarefa, data e tipo de dispositivo, juntamente com arquivos que descrevem a idade, o sexo e o status de TDAH de cada participante sem revelar identidades pessoais. Os autores evitaram deliberadamente pré‑processamento pesado, para que outros cientistas possam aplicar seus próprios métodos de limpeza e técnicas de análise.

Forças, ressalvas e próximos passos

O conjunto de dados BALLADEER se destaca porque combina vários tipos de medições coletadas simultaneamente em um grupo relativamente grande de jovens, e está totalmente aberto para que outros façam download e analisem. Isso o torna um campo de testes valioso para novos métodos de inteligência artificial que tentam identificar padrões ligados ao TDAH ou descobrir novos “biomarcadores” digitais que possam complementar o julgamento clínico. Ao mesmo tempo, os autores são claros sobre seus limites: a amostra provém de uma única região, os subtipos de TDAH não foram rotulados de forma sistemática e o tamanho ainda é modesto para treinar modelos muito grandes de deep learning. Algumas gravações contêm ruído relacionado ao movimento, e não há uma condição separada de estado de repouso. Em vez de ocultar essas questões, a equipe as documenta para que os usuários possam projetar análises cuidadosas.

O que isso significa para famílias e cuidados futuros

Em termos práticos, esse conjunto de dados não diagnostica nenhuma criança por si só. Em vez disso, oferece aos pesquisadores um poderoso microscópio compartilhado para estudar como as dificuldades de atenção se manifestam no cérebro, nos olhos e no corpo durante tarefas realistas. Com o tempo, trabalhos baseados no BALLADEER podem ajudar clínicos a ir além de listas de verificação e impressões subjetivas, adicionando medidas objetivas e orientadas por dados às ferramentas disponíveis. Isso pode levar a identificação mais precoce e precisa do TDAH, melhor acompanhamento de como as crianças respondem a tratamentos e decisões mais justas em escolas e clínicas. Ao transformar atividades com cara de brincadeira em medições precisas e compartilhar esses dados abertamente, o estudo estabelece uma base para uma nova geração de apoio científico às crianças que têm dificuldade de se concentrar.

Citação: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7

Palavras-chave: TDAH, EEG, rastreamento ocular, sinais fisiológicos, aprendizado de máquina