Clear Sky Science · ru

Нейронная сеть для моделирования человеческого формирования, понимания и передачи понятий

· Назад к списку

Как ум превращает зрелища в идеи

Когда вы слышите слово «ужин», вы можете представить себе стол, запахи и звуки, даже не видя еды. Эта способность сворачивать богатые визуальные и звуковые впечатления в компактные идеи и затем извлекать их позже лежит в основе языка, планирования и общего понимания. В статье представлена новая разновидность искусственной нейронной сети, которая пытается воссоздать это повседневное «волшебство» человеческого разума, предлагая представление о том, как мозг может организовывать знания и как будущие машины могли бы мыслить более по-человечески.

Figure 1. Как сжатые кодировки понятий превращают разнообразный визуальный опыт в гибкие решения и общее понимание между системами.
Figure 1. Как сжатые кодировки понятий превращают разнообразный визуальный опыт в гибкие решения и общее понимание между системами.

Упаковка богатого опыта в простые коды

Авторы исходят из простого вопроса: как мозг сжимает подробный сенсорный ввод в меньшее число понятий, а затем гибко использует эти понятия? Современные искусственные сети отлично распознают изображения, но скрывают изученное в миллионах параметров, что затрудняет повторное использование знаний или их обмен с другими системами. Крупные языковые модели, напротив, опираются на уже существующие человеческие слова, а не формируют понятия непосредственно из картинок и звуков. Новая архитектура, названная CATS Net, призвана моделировать и формирование понятий, и их использование в рамках единой системы, начиная лишь с визуальных задач.

Два сотрудничающих модуля для понятий и решений

CATS Net разделяет мышление на две взаимодействующие части. Модуль абстракции понятий изучает короткий числовой код, или «вектор понятия», для каждого типа объектов, например яблок или автобусов, на основе визуальных примеров. Отдельный модуль решения задач получает признаки изображения из стандартного зрительного бэкбона и должен отвечать на простые вопросы «да» или «нет», например «Это яблоко?». Ключевой приём — механизм гейтинга: вектор понятия контролирует, как активность течёт через слои модуля решения задач, перестраивая одну и ту же сеть для обработки разных понятий без изменения её основной проводки. Обучение чередует настройку модулей и корректировку векторов понятий, так что и сеть, и её внутренние понятия постепенно специализируются.

Открытие похожей на человеческую карты значений

После обучения на больших наборах изображений CATS Net не только с высокой точностью классифицирует невидимые изображения, но и развивает организованное «пространство понятий». Близкие коды обычно обозначают связанные вещи: животные группируются вместе, инструменты образуют отдельную группу и т. п. Авторы показывают, что такое расположение не случайно: оно согласуется с паттернами, обнаруженными в исследованиях, где люди оценивают, насколько похожи объекты, а также с языковыми моделями, описывающими значения по множеству измерений, таких как еда, мебель или эмоциональная окраска. Поразительно, что при сравнении внутренних паттернов похожести сети с данными сканирования мозга участников, называвших объекты, слой понятий совпадает с активностью в высокоуровневой зрительной области, а модуль гейтинга напоминает области, вовлечённые в контроль доступа к значению.

Обмен знаниями через одни лишь понятия

Исследование также рассматривает, могут ли низкоразмерные понятия служить общей валютой между разными сетями. Команда обучает отдельные «учительские» и «ученические» версии CATS Net на пересекающихся наборах категорий, затем добавляет небольшой модуль трансляции, переводящий векторы понятий из пространства учителя в пространство ученика. Не меняя основных весов сети, ученик может использовать переведённый вектор понятия для категории, которой он не видел при обучении, и при этом значительно превосходит случайный уровень в задачах «да/нет». В других тестах CATS Net успешно использует пространства понятий, выведённые из языковой статистики и поведенческих данных людей, обращаясь с ними так, как будто это его собственные внутренние коды.

Figure 2. Как вектор понятия управляет слоями нейронной сети, позволяя одной и той же схеме решать разные образно основанные задачи «да/нет».
Figure 2. Как вектор понятия управляет слоями нейронной сети, позволяя одной и той же схеме решать разные образно основанные задачи «да/нет».

Почему это важно для разума и машин

В целом эти результаты предполагают, что компактные коды понятий в сочетании с гибким гейтом сенсорной обработки могут предложить жизнеспособный рецепт человеческого концептуального мышления. Модель показывает, как богатый визуальный опыт можно сжать в переиспользуемые, пригодные для обмена представления, которые соотносятся с паттернами как в человеческом поведении, так и в мозговой активности. Хотя работа сосредоточена на конкретных объектах, которые мы видим и называем, она указывает путь к будущим системам, способным также захватывать более абстрактные идеи, приближая искусственный интеллект к тому, как люди формируют, понимают и передают понятия.

Цитирование: Guo, L., Chen, H., Chen, Y. et al. A neural network for modeling human concept formation, understanding and communication. Nat Comput Sci 6, 497–511 (2026). https://doi.org/10.1038/s43588-026-00956-4

Ключевые слова: формирование понятий, нейронные сети, семантическое познание, согласование с мозгом, передача понятий