Clear Sky Science · ru
Стандартизованный лексикон личности для улучшения персонализированного взаимодействия человек‑машина
Почему слова, которыми мы о себе говорим, имеют значение
Когда вы общаетесь с виртуальным помощником, просматриваете социальные сети или заполняете онлайн‑форму, язык, который вы используете, скрыто выявляет закономерности вашей личности. В этой статье описывается, как исследователи создали большой, тщательно протестированный словарь слов, связанных с личностью, на китайском языке (с сопоставимой английской версией). Этот ресурс помогает компьютерам лучше понимать стабильные черты человека — например, насколько он общителен, тревожен или открыт — чтобы цифровые инструменты могли отвечать более персонально, полезно и даже поддерживающе с психологической точки зрения.
От повседневных черт к пяти основным темам
Психологи часто описывают личность с помощью «Большой пятерки» черт: склонность к беспокойству (нейротизм), общительность (экстраверсия), любопытство и воображение (открытость опыту), доброжелательность и готовность к сотрудничеству (доброжелательность) и надежность, организованность (добросовестность). Каждая из этих широких черт далее делится на шесть более конкретных фасетов, например, жизнерадостность при экстраверсии или доверчивость при доброжелательности. Поскольку личность так отчетливо проявляется в выборе слов, точная карта, связывающая слова с этими чертами, может дать компьютерам окно в человеческую индивидуальность — особенно в языках, таких как китайский, где существующие инструменты были ограничены или плохо протестированы.
Построение гигантской карты слов личности
Исследователи начали со сбора «посевных» слов из множества авторитетных источников. Они просеяли хорошо известные опросники личности, такие как IPIP‑NEO, NEO‑PI‑R и BFI, более короткие формы оценок, китайские шкалы прилагательных для оценки личности и другие классические методы. Они добавили слова из психологических словарей, таких как LIWC, и большой набор прилагательных личности, а затем включили термины из недавних высокоцитируемых исследований, связывавших конкретные слова с чертами личности. После удаления дубликатов в итоге получилось 6 084 уникальных прилагательных, связанных с личностью. Каждое слово было сохранено в оригинальной китайской форме или тщательно переведено с английского, создав общую межъязыковую базу.

Разметка эмоций и фасетов
Далее обученные исследователи‑психологи отнесли каждое слово к одной из пяти измерений Большой пятерки и к одному из 30 более тонких фасетов, используя стандартные определения из IPIP‑NEO‑120. Они также оценивали, несет ли слово положительную, отрицательную или нейтральную эмоциональную окраску — указывает ли оно на что‑то желательное, например «надежный», неблагоприятное, например «импульсивный», или более нейтральное качество. В результате получилась насыщенная многослойная система разметки: каждое слово получило свое место в определенном фрагменте личности и эмоциональный тон, сигнализирующий о том, как оно может восприниматься у описываемого человека.
Тестирование словаря на реальных людях
Чтобы выйти за пределы экспертного мнения, команда провела два раунда онлайн‑исследований. Добровольцы в возрасте от 18 до 65 лет заполняли стандартную анкету Большой пятерки, а затем оценивали, насколько разные прилагательные им подходят, используя простую шкалу 0–4. Пилотный тест с 50 участниками помог уточнить процедуру; более крупное основное исследование с 329 участниками обеспечило основную доказательную базу. Для каждого слова исследователи сравнивали, насколько сильно оно резонировало у людей с высокими и низкими показателями по соответствующей черте. Если, например, люди с высокой доброжелательностью последовательно отмечали положительные слова, связанные с добротой, а люди с низкой доброжелательностью — нет, то слово считали хорошим «попаданием». По всем измерениям Большой пятерки доли попаданий превышали 0,70, а по всем 30 фасетам — 0,60, что показывает: словарь отражает реальные различия в личности, а не домыслы.

Что это значит для чат‑ботов и психического здоровья
Поскольку этот лексикон личности открыт, детализирован и валидирован на реальных данных, он может сразу использоваться в практических приложениях. Чат‑боты могут подстраивать стиль общения в зависимости от вероятных черт пользователя — например, быть более успокаивающими с тревожными пользователями или более лаконичными с очень организованными. Аналитики могут просматривать посты в соцсетях в поисках паттернов, связанных с высоким нейротизмом или низкой добросовестностью, что связано с рисками для психического здоровья, предоставляя ненавязчивый способ выявить людей, которым может потребоваться поддержка. Крупные языковые модели можно настраивать с помощью подсказок, учитывающих разные профильные черты личности, что делает цифровые системы менее универсальными и более внимательными к индивидуальным особенностям.
Привнесение человеческого начала в машины
Проще говоря, эта работа превращает тысячи слов, описывающих личность, в надежную карту, которую могут «читать» компьютеры. Связывая каждое слово с хорошо изученными чертами и проверяя эти связи по тому, как реальные люди говорят о себе, исследователи создали прочный мост между психологией и языковыми технологиями. В результате будущие приложения, чат‑боты и онлайн‑инструменты смогут отвечать так, чтобы лучше соответствовать тому, кто мы есть, предлагая взаимодействие не просто более умное, но и более ориентированное на человека.
Цитирование: Jin, T., Cai, H., Shi, X. et al. A standardized personality lexicon for enhancing personalized human-machine interaction. Sci Data 13, 579 (2026). https://doi.org/10.1038/s41597-026-06783-6
Ключевые слова: лексикон личности, черты Большой пятерки, обработка естественного языка, персонализированные чат‑боты, данные на китайском языке