Clear Sky Science · ja
神経生理学およびAI用途のためのマルチモーダルデータセット
集中が苦手な子どもたちにとってなぜ重要か
多くの家族や教師、臨床医は、子どもの落ち着きのなさや空想が日常的なものか注意欠如・多動性障害(ADHD)の兆候かを見分けるのがどれほど難しいかを知っています。今日の診断は依然として主に面接や質問票に頼っており、記憶や期待、ストレスの影響を受けやすいことがあります。本研究はBALLADEER ADHDデータセットを紹介します。これは子どもや十代の若者が注意を要するゲームをしている間に取得した脳と身体の計測を大規模に公開したデータ集合で、研究者がADHDを理解・同定するためのより客観的な手法を構築するのに役立つよう設計されており、透明で共有可能な形で提供されています。
教室での行動から脳・身体の信号へ
ADHDは学齢期の子どものおよそ20人に1人に影響を与え、注意の向け方、衝動の制御、活動レベルの管理に影響します。その症状は他の状態と重なるため、診断は難しい場合があります。過去数十年、科学者たちはより明確な生物学的手がかりを求めて脳の記録やその他の身体信号に注目してきました。頭皮からの電気活動(EEG)は注意に関連するパターンを示すことがあり、視線追跡は子どもが重要な詳細をいつどこを見ているかを示します。また皮膚コンダクタンスや心拍の変化はストレスや覚醒状態を反映します。しかし、これまでの多くの研究は小規模で非公開のデータセットを用いており、自由に検証や再利用ができませんでした。その結果、有望な知見の多くが十分に検証されず、日常的に使える信頼できるツールに結びつかないことがありました。
注意に関する豊かで共有可能な図像を構築する
BALLADEERプロジェクトはこれを変えるために、マルチモーダルなデータセット、すなわち複数の情報源から同時に取得した計測の調整された集合を収集しました。研究チームは6歳から18歳の子ども・青少年164名からデータを記録しており、そのうち62名がADHDの診断を受けており、102名が診断なしでした。2日にわたるセッションでは、紙と鉛筆のよく知られた検査に加え、日常の注意課題を模したコンピュータや仮想現実の課題を行いました。プレイや問題解決をしている間、研究者はEEGヘッドセットで脳の電気活動、モニター下に取り付けた視線追跡バーで眼の動き、手首装着デバイスで心拍や皮膚コンダクタンスなどの信号を記録しました。これらはすべて、画面上で何が起きているかを秒単位で記録した詳細なログと組み合わされています。
テストというより遊びに近い注意ゲーム
データ収集を魅力的で子どもに優しいものにするため、チームはゲームのような課題を設計しました。"Attention Slackline"では、子どもたちは二つの山の旗を見てパターンが一致したときにボタンを押します。その間、脳波、視線、心拍の信号が連続して記録されます。"Attention Robots"では、漫画風のロボットの列をスキャンし、特定の特徴をもつものだけを選びます。システムは彼らが正確にどのロボットを見ているかをログに取ります。商用プラットフォームのCogniFitは知覚、協調、問題解決を探るさまざまな短い課題を提供し、仮想現実システムNesploraは子どもを模擬教室や水族館に置き、現実的な気晴らしの中で指示にどれほど従えるかを測定します。これらの課題は持続的注意、衝動制御、柔軟な思考といった、ADHDの人々にしばしば困難をもたらすスキルに働きかけることを目的としています。
データの取得と整理のしかた
裏側では、研究者たちはすべての機器を同期させる専用のソフトウェアとハードウェア環境を構築しました。中央のPythonベースのサーバーが、ゲームレベルの開始と終了と同時にEEGヘッドセットやリストバンドの録音を開始・停止します。ゲームは子どもが反応したときや画面上の重要なイベントが発生したときにタイムスタンプ付きのメッセージを送ります。すべての生データ信号とイベントログは、CSVやJSONといった汎用フォーマットで安全なネットワークドライブに保存されます。共有構造は匿名のユーザーID、課題、日付、デバイスタイプでラベル付けされたフォルダと、参加者の年齢、性別、ADHDの状態を個人を特定しない形で記述したファイルを含みます。著者らは過度な前処理を意図的に避けており、他の研究者が独自のクリーニング手法や解析技術を適用できるようにしています。
強み、注意点、今後の展望
BALLADEERデータセットの特長は、比較的大規模な若年者集団から同時に取得した複数種類の計測を組み合わせ、完全に公開している点にあります。これはADHDに関連するパターンを検出したり、臨床判断を補う新たなデジタル“バイオマーカー”を発見したりするための新しいAI手法の検証に価値ある試験場となります。一方で著者らはその限界も明らかにしています:サンプルは単一の地域に由来しており、ADHDのサブタイプは系統的にラベル付けされていないこと、非常に大規模なディープラーニングモデルを訓練するには規模がまだ控えめであることなどです。記録には運動に起因するノイズが含まれる場合があり、安静時の別条件はありません。これらの問題を隠すのではなく文書化することで、利用者が慎重な解析設計を行えるようにしています。
家族と今後のケアにとっての意味
日常的な観点から言えば、このデータセット自体が子どもを診断するわけではありません。むしろ、現実的な課題中に注意の困難が脳、眼、身体にどのように現れるかを研究するための強力で共有可能な顕微鏡を研究者に提供します。時間が経つにつれて、BALLADEERに基づく研究はチェックリストや経験則を超え、臨床現場に客観的でデータ駆動の指標を加える手助けになる可能性があります。それはより早期で正確なADHDの同定、治療への反応のより良い追跡、学校や診療所での公平な判断につながるかもしれません。遊びに近い活動を精密な計測に変え、それらのデータを公開することで、この研究は集中に悩む子どもたちを支える次世代の科学に向けた基盤を築いています。
引用: Trujillo, J., Ferrer-Cascales, R., Teruel, M.A. et al. A Multimodal Dataset for Neurophysiological and AI Applications. Sci Data 13, 436 (2026). https://doi.org/10.1038/s41597-026-06758-7
キーワード: ADHD, EEG, 視線追跡, 生理信号, 機械学習