Clear Sky Science · ja

脳の表象に導かれた監督を通じた大規模モデルの人間らしい認知的一般化

· 一覧に戻る

AIに人間の思考法を教える意義

現代の人工知能は顔認識や写真のラベリング、流暢な文章生成ができる一方で、人間が日常的に使う柔軟な理解力にはまだ及びません。私たちは一羽の鳥を見てから多様な鳥種を認識したり、ハンモックとベビーカーがどちらも「横になって休む」ことに関係する物だと判断したりします。本稿は、脳活動そのものを学習信号として用いることで、コンピュータモデルをその種の人間らしい思考に近づける新たな方法を探ります。

現行のスマート機械が及ばない点

標準的な深層学習システムは、主にモデルを大きくしデータを増やすことで性能を伸ばしてきました。この手法は写真中の靴下や白鳥、車といった具体的な対象の認識には有効です。しかし著者らは、単にパラメータを増やすだけでは、衣類や鳥、さらには生物と無生物のようなより抽象的な概念の把握にはほとんど改善をもたらさないことを示しています。ワンショット学習の課題で評価すると、モデルが大きくなると個別の対象認識は大きく改善する一方、高次のカテゴリに関してはほとんど改善しないか、場合によっては悪化しました。モデルの内部で概念がどのように分離されているかを解析すると、人間の脳とは異なり、生物を道具や他の物体から自然に分けるような並びにはなっていませんでした。

Figure 1. 脳のパターンがどのようにAIに物体を人間のように分類・理解させ得るか。
Figure 1. 脳のパターンがどのようにAIに物体を人間のように分類・理解させ得るか。

脳に導かせる機械

このギャップに対処するため、研究者らは「心的表象導入型監督(mental representation-guided supervision)」と呼ぶ手法を設計しました。被験者は脳スキャナーに横たわり、多数の自然画像を視認しました。これらの記録から、視覚皮質の高次情報を符号化することで知られる領域における活動パターンを抽出しました。同時に人工ネットワークにも同じ画像を処理させました。鍵となる発想は、モデルの内部における物体間の類似性と差異の構造を脳で観測される構造に合わせることです。著者らは脳とモデルの双方を相互接続された概念のグラフとして扱い、反復的なグラフマッチング手続きによって両者の整合性を高めました。

脳に整合したモデルの振る舞い

この特別な訓練の後、モデルは監督された画像を単に記憶するだけではありませんでした。代わりに、脳に近い人間らしい概念地図を発達させ、脳データと組み合わされなかった多くの新しい物体にも一般化しました。改善されたモデルは抽象カテゴリのワンショット学習で大幅に性能を上げ、動物、乗り物、楽器といった概念のクラスタがより緊密になりました。その内部階層は、モデルが明示的に学習していないにもかかわらず、英語語間の関係を手作業で整理したデータベースであるWordNetの構造に似てきました。三枚の画像のうち "異質な一つ" を選ばせる課題では、脳誘導モデルの選択は大規模な人間の判断集合とより近く一致しました。また、微小だが巧妙に作られた画像の歪みに対して騙されにくくなり、物体のより深く堅牢な把握を示唆しました。

より人間らしい概念空間の窓

著者らはさらに踏み込み、脳誘導モデルに内在する「概念的多様体」つまり低次元マップを調べました。このマップ上を移動して点を自然言語記述にデコードすることで、近接する位置が衣類や車両の異種など意味的に関連するアイデアに対応することを示しました。領域間を補間すると、電子機器から動物へ滑らかに移行し、車両と蹄を持つ哺乳類の間を越えると馬に着地するといった連続的な変化が現れました。システムは複数の関連画像を単一の意味のある文に要約することもでき、馬やオートバイといった要素を加減することでキャプションを調整する、いわば簡単な「概念算術」も人間の直感に沿う形で実行しました。

Figure 2. AIを脳活動に整合させることが、抽象的なカテゴリや新しい状況への対応を改善するように内部構造を書き換える仕組み。
Figure 2. AIを脳活動に整合させることが、抽象的なカテゴリや新しい状況への対応を改善するように内部構造を書き換える仕組み。

将来のAIにとっての意義

日常的な言葉で言えば、この研究は人間の脳からの助推がAIシステムを単なるパターン照合から我々の知識整理方法に近いものへと導く手助けになることを示唆しています。単にモデルを大きくする代わりに、内部の概念空間を脳構造に沿うよう形作ることが、新しく抽象的で異例な状況を扱う能力を高め得ることを本研究は提示します。手法は依然として個人の詳細な脳スキャンに依存しますが、こうした脳情報を取り入れた訓練を拡大すれば、人間の知覚や推論の仕方により適合し、解釈性や適応性に優れる人工システムにつながる可能性があります。

引用: Chen, J., Qi, Y., Wang, Y. et al. Human-like cognitive generalization for large models via mental representation-guided supervision. Nat Commun 17, 4709 (2026). https://doi.org/10.1038/s41467-026-71267-5

キーワード: 脳誘導学習, 抽象概念, 深層ニューラルネットワーク, 概念階層, 認知的一般化