Clear Sky Science · ru

Особенности когнитивной заметности улучшают многозадачное глубокое обучение для прагматического рассуждения в разных культурах

2026-03-02 · Назад к списку

Почему важны тонкие значения в разных культурах

Каждый день люди из разных культур обмениваются сообщениями в интернете, в деловой среде и в дипломатии. Большая часть того, что мы действительно имеем в виду, не выражается прямо: намеки, тон и вежливость выполняют основную работу. Компьютеры, которые считывают только буквальное значение слов, легко пропускают эти слои, что может приводить к неловким или даже вредным недоразумениям. В этом исследовании рассматривается, как создать системы ИИ, которые обращают внимание на те же тонкие сигналы, что и люди, чтобы машины лучше понимали, что подразумевается, насколько высказывание вежливо и соответствует ли оно нормам разных культур.

Чтение между строк

Человеческое общение полно косвенных посланий. Фраза вроде «Это может быть сложно» в одной культуре может означать вежливый отказ, а в другой — простое сомнение. Чтобы справиться с этим, авторы сосредотачиваются на «прагматическом рассуждении» — том, как люди выводят намерения из контекста, социальных правил и общего фона знаний, а не только из словарных значений. Они показывают, что культурные различия в прямоте, вежливости и комфортности с неопределённостью делают такое рассуждение особенно сложным для компьютеров. В статье понимание представлено как своего рода вероятностная задача: учитывая слова, ситуацию и культурные ожидания, какая интерпретация наиболее вероятна?

Что привлекает внимание ума

Ключевая идея в исследовании — «когнитивная заметность» — признаки, которые естественно выпадают в глаза и привлекают наше внимание. В разговоре это могут быть оговорки («может быть»), смягчающие слова («пожалуйста»), почётные титулы или необычный порядок слов. Психологи показали, что люди не взвешивают каждую часть сообщения одинаково; некоторые фрагменты обрабатываются быстрее и с приоритетом. Авторы превращают это наблюдение в вычислительный модуль, который выделяет такие важные элементы, снижая значимость остальных. В отличие от стандартных механизмов внимания в ИИ, их дизайн ограничен выводами из исследований мозга и поведения, например тем, как быстро люди реагируют на заметные сигналы и как фокусировка на одном сигнале подавляет другие.

Обучение одной системы множеству социальных умений

Вместо обучения отдельных моделей для каждого социального навыка исследователи создают единую систему глубокого обучения, которая решает четыре задачи одновременно: обнаружение подразумеваемых смыслов, определение типа речевого акта (например, просьба или обещание), оценка вежливости и суждение о культурной уместности. Система сначала кодирует текст с помощью многоязыковой языковой модели. Затем модуль заметности повышает вес вероятных прагматических сигналов. Культурный «шлюз» корректирует, какие сигналы важнее, в зависимости от информации о культурном фоне говорящего. Наконец, общие внутренние слои питуют четыре специализированных головы, по одной на задачу. Процедура обучения тщательно балансирует эти задачи, чтобы одна не доминировала, и преобразует противоречивые сигналы обучения так, чтобы они усиливали друг друга, а не вступали в конфликт.

Тестирование в разных языках и культурах

Для оценки подхода авторы собрали крупный межкультурный набор данных — более 47 000 примеров, охватывающих восемь языковых сообществ, включая английский, китайский, арабский, японский и другие. Каждый пример аннотирован по всем четырём задачам носителями языка с тщательной проверкой согласия и культурных смещений. Новая модель сопоставляется с сильными базовыми системами, такими как многоязычный BERT, и с более традиционными многозадачными настройками. Она достигает общего показателя примерно 83 процента и, что важно, хорошо держится при тестировании на культурах, которых не было в обучающей выборке. Сам модуль заметности даёт заметный прирост в производительности, а изученные шаблоны заметности сильно коррелируют с тем, что помечают как важные слова или фразы человеческие аннотаторы.

Делаем машины лучшими партнёрами по разговору

Для широкой аудитории основная мысль в том, что ИИ может стать более культурно осведомлённым и социально чувствительным, подражая тому, как люди решают, чему стоит уделить внимание в сообщении. Соединив когнитивные представления о заметности, культурные различия в стилях общения и многозадачную обучающую архитектуру, авторы показывают, что машины могут лучше читать между строк в разных языках и культурах. Хотя система всё ещё испытывает трудности с сильно идиоматическими выражениями, иронией и невербальными сигналами, она представляет важный шаг к инструментам перевода, чат-ботам и системам модерации, которые менее «нечувствительны» к тону и лучше улавливают человеческое искусство говорить, не говоря всего напрямую.

Цитирование: Qi, M., Thai, Y.N. Cognitive salience features enhance multitask deep learning for pragmatic reasoning across cultures. Sci Rep 16, 11778 (2026). https://doi.org/10.1038/s41598-026-40809-8

Ключевые слова: межкультурная коммуникация, прагматика, вежливость, многоязычный ИИ, глубокое обучение