Clear Sky Science · ru

Коллективный и дополненный интеллект превосходят искусственный интеллект в тестах на распознавание эмоций

2026-03-24 · Назад к списку

Почему это важно в повседневной жизни

Кто лучше считывает эмоции по одному лишь взгляду на глаза: люди или машины? По мере того как системы искусственного интеллекта проникают в школы, клиники и рабочие места, многие инструменты обещают определять настроение и психическое состояние по лицам. Это исследование показывает, что хотя мощная модель ИИ может превосходить большинство отдельных людей в лабораторных тестах на эмоции, группы людей, работающие независимо, по-прежнему оказываются впереди, а наилучшие результаты достигаются при сочетании человеческих и машинных суждений.

Figure 1. Люди в сочетании с ИИ точнее определяют эмоции по глазам, чем каждый по отдельности.

Как устроены тесты на чтение эмоций

Исследователи сосредоточились на двух широко используемых лабораторных заданиях, в которых участникам предлагается вывести чувства и мысли, глядя только на фотографии области вокруг глаз. В каждом тесте зрители видят изображение и должны выбрать одно из четырёх коротких слов, которое лучше всего соответствует психическому состоянию человека. Один тест использует чёрно‑белые фотографии, взятые в основном из одной этнической группы, тогда как более новая версия включает цветные изображения людей более разнообразного происхождения и использует более простой словарный запас. Десятилетия исследований связывают результаты по этим тестам с социальными навыками и клиническими исходами, хотя они и не являются идеальным отражением эмоциональной жизни в реальном мире.

Как ведущая модель ИИ сравнивается с отдельными людьми

Команда оценила сильную мультимодальную языковую модель под названием GPT-5 mini, способную анализировать изображения и текст. Они запускали модель 100 раз для каждого тестового элемента, не давая примеров для тренировки, чтобы зафиксировать её базовую производительность. По сравнению с данными более чем 27 000 человеческих участников GPT-5 mini давала правильные ответы примерно в 83 процентах случаев в обоих тестах, явно превосходя средние показатели людей в 71 и 63 процента. Детальные анализы по всему диапазону человеческих способностей показали, что ИИ опередил почти всех людей с низкими и средними результатами. Однако в старом тесте лучшие люди чуть вровень или слегка опережали модель, тогда как в новой мультирасовой версии ИИ сохранял преимущество даже на верхнем уровне.

Почему толпы людей обгоняют толпы машин

Далее исследователи поинтересовались, что происходит, когда объединяются многие отдельные ответы. Они смоделировали «толпы», многократно выбирая наборы людей или наборы запусков ИИ и позволяя побеждать наиболее частому ответу — простому правилу, называемому голосованием по большинству. Точность человеческих толп резко возрастала с увеличением размера; когда объединяли ответы 100 человек, точность в одном из тестов приближалась к совершенству. Напротив, толпы из ИИ мало выигрывали при добавлении новых запусков. Разные запросы к одной и той же модели, как правило, повторяли одни и те же ошибки, поэтому группа не могла исправить собственные промахи. По сути, это было похоже на то, чтобы многократно спрашивать одного и того же эксперта одно и то же — вместо того чтобы опираться на разнообразный жизненный опыт.

Лучше всего работают люди и ИИ вместе

Последним шагом было смешивание голосов людей и ИИ. Исследователи создали гибридные толпы, где большинство участников были людьми, а меньшая часть — запуски ИИ, причём каждая сторона независимо давала ответы перед их объединением. Такие дополненные группы последовательно превосходили как только человеческие, так и только машинные толпы. В более новом, более инклюзивном тесте ни люди, ни ИИ поодиночке не могли превысить примерно 95 процентов точности, но смешанные группы достигали около 98 процентов, и делали это при меньших размерах толпы. Такая картина указывает на то, что люди и машины склонны допускать разные типы ошибок, поэтому их сильные стороны естественно дополняют друг друга.

Figure 2. Ошибки людей и ИИ различаются, поэтому объединение их предположений об эмоциях даёт более точное окончательное решение.

Что это значит для использования ИИ в распознавании эмоций

Исследование делает вывод, что сравнение ИИ со «средним человеком» может вводить в заблуждение, поскольку игнорирует силу коллективного человеческого суждения. Мощная модель вроде GPT-5 mini может превзойти большинство отдельных людей в узких лабораторных тестах, но при этом уступать тому, чего могут добиться разнообразные группы людей вместе, особенно если машины просто повторяют одни и те же ошибки. Наиболее надёжный подход к задачам, таким как чтение эмоций по лицу, — не заменять людей ИИ, а сочетать человеческое понимание с машинной согласованностью в тщательно спроектированных системах, которые сохраняют участие человека в цикле.

Цитирование: Akben, M., Gude, V. & Ajjan, H. Collective and augmented intelligence outperform artificial intelligence on emotion recognition tests. Sci Rep 16, 14823 (2026). https://doi.org/10.1038/s41598-026-45331-5

Ключевые слова: распознавание эмоций, коллективный интеллект, сотрудничество человека и ИИ, мультимодальный ИИ, социальное познание