Clear Sky Science · sv

En multimodal datamängd för neurofysiologiska och AI‑tillämpningar

· Tillbaka till index

Varför detta är viktigt för barn som har svårt att fokusera

Många familjer, lärare och kliniker vet hur svårt det kan vara att avgöra om ett barns rastlöshet eller dagdrömmande är en del av vardagen eller ett tecken på uppmärksamhetsstörning med hyperaktivitet (ADHD). Dagens diagnoser bygger fortfarande till stor del på intervjuer och frågeformulär, vilka kan påverkas av minne, förväntningar eller stress. Denna studie presenterar BALLADEER ADHD Dataset, en stor, öppen samling av hjärn‑ och kroppsmätningar insamlade medan barn och tonåringar spelar uppmärksamhetsfokuserade spel. Den är utformad för att hjälpa forskare att bygga mer objektiva verktyg för att förstå och identifiera ADHD — och att göra det på ett sätt som är transparent och delbart över hela världen.

Figure 1
Figure 1.

Från klassrumsbeteende till hjärn‑ och kroppssignaler

ADHD drabbar ungefär en av tjugo skolbarn och påverkar hur de riktar uppmärksamhet, kontrollerar impulser och hanterar aktivitetsnivåer. Eftersom symptomen överlappar med andra tillstånd kan diagnostik vara knepig. Under de senaste decennierna har forskare vänt sig till hjärnregistreringar och andra kroppssignaler för att söka tydligare biologiska ledtrådar. Elektrisk aktivitet från skalpen (EEG) kan visa mönster kopplade till uppmärksamhet; ögonspårning visar var och när ett barn tittar på viktiga detaljer; och förändringar i hudkonduktans och hjärtrytm speglar stress och vakenhetsgrad. Dock använde de flesta tidigare studier små, privata datamängder som inte kunde kontrolleras eller återanvändas fritt. Som en följd kunde många lovande resultat inte prövas noggrant eller bli tillförlitliga, vardagliga verktyg.

Att bygga en rik, delad bild av uppmärksamhet

BALLADEER‑projektet syftade till att ändra detta genom att samla en multimodal datamängd — det vill säga en koordinerad uppsättning mätningar från flera källor samtidigt. Forskarna spelade in data från 164 barn och ungdomar i åldrarna 6 till 18 år, varav 62 med en ADHD‑diagnos och 102 utan. Under sessioner utspridda över två dagar genomförde deltagarna en rad välkända papper‑och‑penna‑test samt datorbaserade och virtuell‑reality‑uppgifter som efterliknar vardagliga uppmärksamhetsutmaningar. Medan de lekte och löste uppgifter registrerade forskarna elektrisk aktivitet från hjärnan med EEG‑headset, ögonrörelser med en ögonspårningslist monterad under en skärm, samt signaler som puls och hudkonduktans från en handledsburen enhet. Allt detta parades med detaljerade loggar över vad som hände på skärmen, sekund för sekund.

Uppmärksamhetsspel som känns mer som lek än test

För att göra datainsamlingen engagerande och barnvänlig utformade teamet spel‑liknande uppgifter. I "Attention Slackline" tittar barn på flaggor på två berg och trycker på en knapp när mönstren stämmer överens; deras hjärnvågor, blick och hjärtsignaler spelas in kontinuerligt. I "Attention Robots" skannar de rader av tecknade robotar och väljer endast dem med specifika egenskaper, medan systemet loggar exakt vilken robot de tittar på. En kommersiell plattform kallad CogniFit presenterar en rad korta övningar för att pröva perception, koordinering och problemlösning, och ett virtuell‑reality‑system kallat Nesplora placerar barn i ett simulerat klassrum eller ett akvarium för att mäta hur väl de följer instruktioner mitt i realistiska störningar. Tillsammans syftar dessa uppgifter till att fånga uthållig uppmärksamhet, impulskontroll och mental flexibilitet — de färdigheter som ofta är utmanande för personer med ADHD.

Figure 2
Figure 2.

Hur data fångas upp och organiseras

Bakom kulisserna byggde forskarna en dedikerad mjuk‑ och hårdvaruuppsättning för att hålla alla enheter synkroniserade. En central Python‑baserad server startar och stoppar inspelningar på EEG‑headset och handledsenheter samtidigt som en spelnivå börjar och slutar. Spelen skickar tidsstämplade meddelanden när ett barn svarar eller en viktig händelse dyker upp på skärmen. Alla råa signaler och händelseloggfiler lagras på en säker nätverksenhet i enkla, allmänt använda format (CSV och JSON). Den delade strukturen innehåller mappar märkta med anonymt användar‑ID, uppgift, datum och enhetstyp, tillsammans med filer som beskriver varje deltagares ålder, kön och ADHD‑status utan att avslöja personliga identiteter. Författarna undvek medvetet omfattande förbehandling, så att andra forskare kan tillämpa egna rengöringsmetoder och analystekniker.

Styrkor, varningar och vad som kommer härnäst

BALLADEER‑datasetet utmärker sig genom att kombinera flera typer av mätningar insamlade samtidigt i en relativt stor grupp unga personer, och det är helt öppet för andra att ladda ner och analysera. Det gör det till en värdefull testplats för nya metoder inom artificiell intelligens som försöker hitta mönster kopplade till ADHD eller upptäcka nya digitala ”biomarkörer” som kan komplettera kliniskt omdöme. Samtidigt är författarna tydliga med dess begränsningar: urvalet kommer från en enda region, ADHD‑subtyper märktes inte systematiskt, och storleken är fortfarande måttlig för att träna mycket stora djupa lärandemodeller. Vissa inspelningar innehåller rörelserelaterat brus, och det finns ingen separat vila‑tillstånds‑condition. I stället för att dölja dessa problem dokumenterar teamet dem så att användare kan utforma noggranna analyser.

Vad detta betyder för familjer och framtida vård

I vardagstermer diagnosticerar inte denna datamängd något barn på egen hand. Istället erbjuder den forskare ett kraftfullt, delat förstoringsglas för att studera hur uppmärksamhetsproblem visar sig i hjärnan, ögonen och kroppen under realistiska uppgifter. Med tiden kan arbete baserat på BALLADEER hjälpa kliniker att gå bortom checklistor och magkänsla genom att lägga till objektiva, datadrivna mått i verktygslådan. Det kan leda till tidigare, mer precisa identifieringar av ADHD, bättre uppföljning av hur barn svarar på behandling och rättvisare beslut i skolor och kliniker. Genom att förvandla lek‑lika aktiviteter till precisa mätningar och dela dessa data öppet lägger studien grunden för en ny generation av vetenskapsbaserat stöd för barn som har svårt att fokusera.

Citering: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7

Nyckelord: ADHD, EEG, ögonspårning, fysiologiska signaler, maskininlärning