Clear Sky Science · fr
Un lexique de personnalité standardisé pour améliorer l’interaction personnalisée homme‑machine
Pourquoi les mots que nous utilisons pour parler de nous importent
Quand vous discutez avec un assistant virtuel, faites défiler les réseaux sociaux ou remplissez un formulaire en ligne, le langage que vous employez révèle discrètement des motifs de votre personnalité. Cet article explique comment des chercheurs ont construit un grand dictionnaire de mots liés à la personnalité en chinois (avec une version anglaise correspondante), soigneusement testé. Cette ressource aide les ordinateurs à mieux comprendre les traits stables des personnes — par exemple à quel point elles sont sociables, anxieuses ou ouvertes d’esprit — afin que les outils numériques puissent répondre de manière plus personnelle, utile et même favorable au bien‑être mental.
Des traits quotidiens aux cinq grands thèmes
Les psychologues décrivent souvent la personnalité à l’aide des « Big Five » : la tendance à s’inquiéter (névrosisme), l’extraversion, la curiosité et l’imagination (ouverture), la chaleur et la coopération (amabilité), et la fiabilité et l’organisation (conscience). Ces grands traits se déclinent chacun en six facettes plus spécifiques, comme la gaieté pour l’extraversion ou la confiance pour l’amabilité. Parce que la personnalité se manifeste de façon si nette dans les mots choisis par les gens, une cartographie précise reliant les mots à ces traits peut offrir aux ordinateurs une fenêtre sur l’individualité humaine — en particulier dans des langues comme le chinois, où les outils existants étaient limités ou peu testés.
Construire une carte géante des mots de la personnalité
Les chercheurs ont commencé par rassembler des « mots‑semences » provenant de nombreuses sources fiables. Ils ont passé au crible des questionnaires de personnalité bien connus tels que l’IPIP‑NEO, le NEO‑PI‑R et le BFI, des formulaires d’évaluation plus courts, des échelles d’adjectifs de personnalité en chinois et d’autres mesures classiques. Ils ont ajouté des mots issus de dictionnaires psychologiques comme le LIWC et d’un large ensemble d’adjectifs de personnalité, puis ont intégré d’autres termes tirés de recherches récentes et très citées liant certains mots à des traits de personnalité. Après suppression des doublons, ils ont obtenu 6 084 adjectifs uniques liés à la personnalité. Chaque mot a été conservé dans sa forme chinoise d’origine ou soigneusement traduit depuis l’anglais, créant une base partagée interlingue.

Étiqueter émotions et facettes
Puis, des chercheurs formés en psychologie ont assigné chaque mot à l’une des cinq dimensions du Big Five et à l’une des 30 facettes plus fines, en utilisant les définitions standard de l’IPIP‑NEO‑120. Ils ont également évalué si chaque mot portait une connotation émotionnelle positive, négative ou neutre — s’il suggérait quelque chose de souhaitable comme « fiable », indésirable comme « impulsif », ou une qualité plus neutre. Cela a produit un système d’étiquetage riche et stratifié : chaque mot occupe désormais une place dans une tranche particulière de l’espace de la personnalité et possède une tonalité émotionnelle indiquant la manière dont il peut être perçu par la personne décrite.
Tester le dictionnaire avec de vraies personnes
Pour dépasser l’avis d’experts, l’équipe a mené deux séries d’études en ligne. Des volontaires âgés de 18 à 65 ans ont rempli un questionnaire standard du Big Five puis ont évalué dans quelle mesure différents adjectifs leur correspondaient, en utilisant une échelle simple de 0 à 4. Un test pilote avec 50 personnes a affiné le protocole ; une étude principale plus large avec 329 participants a apporté les preuves substantielles. Pour chaque mot, les chercheurs ont comparé à quel point il résonnait chez les personnes ayant des scores élevés ou faibles sur le trait correspondant. Si, par exemple, les personnes fortement amicales approuvaient systématiquement des mots positifs liés à la gentillesse, tandis que les personnes peu amicales ne le faisaient pas, le mot était considéré comme un bon « hit ». Sur l’ensemble des dimensions du Big Five, les taux de « hit » dépassaient 0,70, et sur les 30 facettes ils dépassaient 0,60, montrant que le dictionnaire capturait de véritables différences de personnalité plutôt que des suppositions.

Ce que cela signifie pour les chatbots et la santé mentale
Parce que ce lexique de personnalité est public, finement détaillé et validé avec des données réelles, il peut alimenter des applications pratiques immédiatement. Les chatbots peuvent ajuster leur style en fonction des traits probables de l’utilisateur — par exemple, se montrer plus rassurants avec des personnes anxieuses ou plus concis avec des personnes très organisées. Les analystes peuvent scruter les publications sur les réseaux sociaux à la recherche de motifs liés à un fort névrosisme ou à une faible conscience, associés à des risques pour la santé mentale, offrant une manière non intrusive d’identifier des personnes susceptibles de bénéficier d’un soutien. Et les grands modèles de langage peuvent être adaptés avec des invites qui respectent différents profils de personnalité, aidant les systèmes numériques à paraître moins génériques et plus à l’écoute de l’individu.
Apporter une touche humaine aux machines
Concrètement, ce travail transforme des milliers de mots décrivant la personnalité en une carte fiable que les ordinateurs peuvent lire. En reliant chaque mot à des traits bien étudiés et en vérifiant ces liens par rapport à la façon dont de vraies personnes parlent d’elles‑mêmes, les chercheurs ont créé un pont solide entre la psychologie et la technologie linguistique. En conséquence, les applications, chatbots et outils en ligne futurs pourront répondre d’une manière mieux adaptée à ce que nous sommes, offrant des interactions non seulement plus intelligentes, mais aussi plus attentives à l’humain.
Citation: Jin, T., Cai, H., Shi, X. et al. A standardized personality lexicon for enhancing personalized human-machine interaction. Sci Data 13, 579 (2026). https://doi.org/10.1038/s41597-026-06783-6
Mots-clés: lexique de personnalité, traits du Big Five, traitement du langage naturel, chatbots personnalisés, données en langue chinoise