Clear Sky Science · zh

用于增强个性化人机交互的标准化人格词典

2026-03-03 · 返回目录

我们如何谈论自己，这些词为何重要

当你与虚拟助手对话、浏览社交媒体或填写在线表单时，你使用的语言会悄然揭示人格的模式。本文介绍了研究人员如何构建一个大规模、经严格测试的中文人格相关词典（并配有对应的英文版本）。该资源帮助计算机更好地理解人们的稳定特质——例如外向、焦虑或开放程度——从而使数字工具能够以更个性化、更有帮助、甚至更具心理支持性的方式作出响应。

从日常特质到五大主题

心理学家常用“大五”人格来描述个性：易于担忧的程度（神经质）、外向程度（外倾性）、好奇与想象力（开放性）、温暖与合作性（宜人性）以及可靠与有组织程度（尽责性）。这些宽泛特质又可以细分为六个更具体的面向，例如外倾性下的愉快性或宜人性下的信任。由于人格在语言选择中表现得尤其明显，将词语与这些特质精确对应的映射可以为计算机提供洞察人类个体性的窗口——尤其是在诸如中文这样现有工具受限或未经充分检验的语言中。

构建人格词语的大型图谱

研究人员首先从许多可信来源收集“种子词”。他们查阅了著名的人格问卷，如 IPIP-NEO、NEO-PI-R 和 BFI，以及较短的评分表、中文人格形容词量表和其他经典量表。他们还加入了来自心理学词典（如 LIWC）和大量人格形容词的词条，并从近年的高被引研究中补充了与特定人格特质相关联的词语。去重后，研究团队得到了 6,084 个与人格相关的独特形容词。每个词要么保持原有中文形式，要么由英文经过谨慎翻译，从而形成一个跨语言的共享基础。

为情感和面向贴标签

接着，受过训练的心理学研究人员将每个词分别归入五大维度之一及 30 个更细的面向之一，采用 IPIP-NEO-120 的标准定义。他们还判断每个词是否带有正面、负面或中性的情感色彩——比如暗示“可靠”这样的可取特质、“冲动”这样的不可取特质，或更中性的品质。由此生成了一个丰富的分层标注系统：每个词既有其在特定人格空间中的位置，也有表明其情感基调的标签，提示被描述者可能的感受含义。

用真实人群检验词典

为了超越专家意见，团队开展了两轮在线研究。18 至 65 岁的志愿者先完成标准的大五人格问卷，然后使用简单的 0–4 量表评估不同形容词与自己的匹配程度。50 人的试点测试优化了流程；329 人的主研究提供了有力证据。对于每个词，研究人员比较该词对在相应特质上得分高低人群的共鸣程度。例如，如果高宜人性的人群一致认同与善良相关的正面词汇，而低宜人性的人群则不认同，那么该词被视为有效“命中”。在所有五大维度上的命中率均高于 0.70，而在 30 个面向上的命中率均高于 0.60，表明该词典捕捉到的是实际的人格差异而非猜测。

对聊天机器人与心理健康的意义

由于该人格词典是公开的、细粒度的并且经过实证验证，它可以立即支持实用应用。聊天机器人可以根据用户的可能特质调整表达风格——例如对焦虑用户更具安抚性，对高度有组织的用户更为简洁。分析人员可以扫描社交媒体帖子，识别与高神经质或低尽责性相关的模式，这些模式与心理健康风险有关，为非侵入性地提示可能受益于支持的人群提供了一种途径。大型语言模型也可以通过考虑不同人格档案的提示进行微调，使数字系统显得不那么千篇一律、更加贴合个体。

给机器带来人的温度

通俗地说，这项工作将成千上万描述人格的词语转化为计算机可读的可靠地图。通过将每个词与研究充分的特质关联，并将这些关联与真实人群如何描述自己进行比对，研究人员在心理学与语言技术之间构建了坚实的桥梁。因此，未来的应用、聊天机器人和在线工具能够以更符合我们自身特点的方式作出响应，提供不仅更智能而且更具人性意识的交互体验。

引用: Jin, T., Cai, H., Shi, X. et al. A standardized personality lexicon for enhancing personalized human-machine interaction. Sci Data 13, 579 (2026). https://doi.org/10.1038/s41597-026-06783-6

关键词: 人格词典, 大五人格特质, 自然语言处理, 个性化聊天机器人, 中文数据