Clear Sky Science · ru

Мультимодальная база данных для нейрофизиологических и ИИ‑приложений

· Назад к списку

Почему это важно для детей, которым трудно сосредоточиться

Многим семьям, учителям и клиницистам известно, как сложно понять, является ли беспокойство или мечтательное состояние ребёнка частью обычного поведения или признаком синдрома дефицита внимания и гиперактивности (СДВГ). Современные диагнозы по‑прежнему в основном опираются на интервью и опросники, на которые влияют память, ожидания или стресс. В этом исследовании представлен датасет BALLADEER по СДВГ — большая открытая коллекция измерений активности мозга и тела, собранная во время игр, требующих внимания у детей и подростков. Он предназначен помочь исследователям создать более объективные инструменты для понимания и выявления СДВГ — и сделать это прозрачно и доступно для совместного использования по всему миру.

Figure 1
Figure 1.

От поведения в классе к сигналам мозга и тела

СДВГ встречается примерно у одного из двадцати школьников и влияет на то, как они обращают внимание, контролируют импульсы и управляют уровнем активности. Поскольку симптомы пересекаются с признаками других состояний, диагностика может быть затруднена. За последние десятилетия учёные стали использовать записи активности мозга и другие сигналы тела в поисках более чётких биологических маркеров. Электрическая активность с поверхности головы (ЭЭГ) может показывать паттерны, связанные с вниманием; отслеживание взгляда показывает, куда и когда ребёнок смотрит; а изменения проводимости кожи и ритма сердца отражают уровень стресса и бдительности. Однако большинство ранних исследований опирались на небольшие закрытые наборы данных, которые нельзя было свободно проверить или повторно использовать. В результате многие многообещающие находки не удалось всесторонне протестировать или превратить в надёжные повседневные инструменты.

Создание богатой общей картины внимания

Проект BALLADEER поставил цель изменить это, собрав мультимодальный датасет — то есть скоординированный набор измерений из нескольких источников одновременно. Команда записала данные у 164 детей и подростков в возрасте от 6 до 18 лет, включая 62 с диагнозом СДВГ и 102 без диагноза. В ходе сессий, растянувшихся на два дня, участники проходили батарею известных бумажно‑карандашных тестов, а также компьютерные и виртуальные задания, имитирующие повседневные проблемы с вниманием. Пока они играли и решали задачи, исследователи регистрировали электрическую активность мозга с помощью ЭЭГ‑шапочек, движения глаз с помощью планки трекинга, установленной под монитором, и сигналы, такие как частота сердечных сокращений и проводимость кожи, — с запястьного устройства. Всё это сопровождалось подробными логами того, что происходило на экране в каждую секунду.

Игры на внимание, которые больше похожи на игру, чем на тест

Чтобы сделать сбор данных увлекательным и дружественным для детей, команда разработала игровые задания. В «Attention Slackline» дети наблюдают флаги на двух горах и нажимают кнопку, когда узоры совпадают; при этом непрерывно регистрируются их мозговые волны, взгляд и сердечные сигналы. В «Attention Robots» они просматривают ряды мультяшных роботов, выбирая только тех с определёнными признаками, а система точно фиксирует, на какого робота ребёнок смотрит. Коммерческая платформа CogniFit предлагает набор коротких упражнений для проверки восприятия, координации и решения задач, а виртуальная система Nesplora помещает детей в смоделированный класс или аквариум, чтобы измерить, насколько хорошо они следуют инструкциям среди реалистичных отвлекающих факторов. В совокупности эти задания направлены на оценку устойчивого внимания, контроля импульсов и когнитивной гибкости — тех самых навыков, которые часто вызывают трудности у людей с СДВГ.

Figure 2
Figure 2.

Как данные собираются и организованы

За кулисами исследователи создали специализированную программно‑аппаратную систему, чтобы синхронизировать все устройства. Центральный сервер на Python запускает и останавливает записи с ЭЭГ‑шапочек и браслетов в тот же момент, когда начинается и заканчивается уровень игры. Игры отправляют помеченные временем сообщения всякий раз, когда ребёнок отвечает или на экране появляется ключевое событие. Все необработанные сигналы и журналы событий хранятся на защищённом сетевом диске в простых, широко используемых форматах (CSV и JSON). Общая структура содержит папки, помеченные анонимным идентификатором пользователя, задачей, датой и типом устройства, а также файлы, описывающие возраст, пол и статус по СДВГ каждого участника без раскрытия личной информации. Авторы сознательно избегали сильной предобработки, чтобы другие учёные могли применять собственные методы очистки и анализа.

Сильные стороны, оговорки и дальнейшие шаги

Датасет BALLADEER выделяется тем, что объединяет несколько типов измерений, полученных одновременно в относительно большой группе молодых людей, и он полностью открыт для скачивания и анализа другими исследователями. Это делает его ценным полигоном для новых методов искусственного интеллекта, стремящихся обнаруживать паттерны, связанные с СДВГ, или находить цифровые «биомаркеры», дополняющие клиническую оценку. Вместе с тем авторы прямо указывают на ограничения: выборка собрана в одном регионе, субтипы СДВГ не были систематически промаркированы, и размер всё ещё невелик для обучения очень больших моделей глубокого обучения. Некоторые записи содержат шум, связанный с движением, и нет отдельного условия «покоя». Вместо того чтобы скрывать эти проблемы, команда документирует их, чтобы пользователи могли проектировать аккуратные анализы.

Что это значит для семей и будущей помощи

В повседневном понимании этот набор данных сам по себе не ставит диагноз ребёнку. Вместо этого он даёт исследователям мощный совместный «микроскоп» для изучения того, как трудности с вниманием проявляются в мозге, глазах и теле во время реалистичных заданий. Со временем работа на основе BALLADEER может помочь клиницистам выйти за рамки чек‑листов и интуиции, добавив объективные, основанные на данных показатели в инструментарий. Это может привести к более раннему и точному выявлению СДВГ, лучшему отслеживанию реакции детей на лечение и более справедливым решениям в школах и клиниках. Превращая игровые задания в точные измерения и открыто делясь этими данными, исследование закладывает основу для нового поколения научно обоснованной поддержки детей, которым трудно сосредоточиться.

Цитирование: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7

Ключевые слова: СДВГ, ЭЭГ, трекер взгляда, физиологические сигналы, машинное обучение