Clear Sky Science · fr
Nommer les Confucian(s) dans Ngram Viewer : une approche DH-CL de l’identité confucéenne dans le discours anglophone
Pourquoi cette étude compte pour les lecteurs d’aujourd’hui
Quand nous cherchons des idées comme le confucianisme en ligne, nous avons tendance à faire confiance aux graphiques et aux outils de recherche qui indiquent la fréquence des mots dans les livres. Cet article pose une question simple mais puissante : qui contrôle réellement ces représentations du passé, et que suggèrent-elles discrètement au sujet de la pensée et de l’identité chinoises ? En retraçant le mot « Confucian » dans des millions de livres en anglais, les auteurs montrent comment les outils numériques peuvent amplifier des biais culturels tout en paraissant neutres et objectifs.
Comment un mot est devenu une étiquette culturelle
L’identité confucéenne faisait à l’origine référence aux Ru, une longue tradition de penseurs, enseignants et institutions chinois. Dans l’anglais moderne, cependant, « Confucian » est souvent traité comme un label fourre-tout pour la culture chinoise ou est-asiatique. Les débats antérieurs sur qui compte comme confucianischen étaient entravés par des définitions vagues et des données rares. Cette étude aborde ces débats avec des preuves numériques à grande échelle, soutenant que, en pratique, « Confucian » fonctionne moins comme une catégorie philosophique et davantage comme un marqueur ethnoculturel appliqué de l’extérieur.
Utiliser le big data pour suivre la piste des mots
Les auteurs combinent trois approches : humanités numériques, linguistique de corpus et analyse critique du discours. Ils utilisent Google Books Ngram Viewer, un outil fondé sur la plus grande collection numérisée de livres au monde, pour voir comment les mots liés à « Confucian » sont apparus dans les publications en anglais entre 1973 et 2022. Ils collectent 260 mots voisins et 214 partenaires syntaxiques, puis regroupent leurs sens à l’aide d’un logiciel spécialisé. Cette « double triangulation » leur permet de recouper les tendances numériques, les structures linguistiques et l’interprétation historique afin qu’aucune méthode ou jeu de données unique ne domine le récit.

Ce que révèlent les chiffres sur la nomination et le sens
Les résultats montrent que « Confucian » et « Confucians » dominent largement d’autres étiquettes anglaises possibles pour les Ru, comme « Ruist » ou « Confucianist ». Autrement dit, un terme forgé en Occident a effectivement imposé la norme globale. En examinant le contexte dans lequel « Confucian » apparaît en phrase, l’étude constate qu’il se regroupe fortement avec des mots concernant les nations, les dynasties et les périodes — par exemple « Chinese », « Song », « Ming », « early » et « neo ». Il apparaît également aux côtés de références à d’autres philosophies et religions comme le taoïsme, le bouddhisme et le christianisme. Bien moins fréquents sont les mots quotidiens relatifs à la croyance, à l’éthique ou à l’apprentissage, ce qui suggère que l’étiquette est davantage ancrée dans la géographie et l’histoire que dans les idées ou les pratiques.
Comment la distance et l’altérité sont intégrées au langage
Au-delà des simples fréquences, l’étude examine comment les pronoms et les noms cadrent qui parle et de qui l’on parle. Dans les ouvrages anglais examinés, les confucians sont généralement « they » ou « them », et non « we ». Les références les situent dans des temps et des lieux éloignés, souvent enveloppés de noms dynastiques ou de descriptions comme « early » et « last ». Même des figures modernes célébrées, telles que Liang Shuming, sont présentées comme « the last Confucian », comme si la tradition avait pris fin. Les auteurs qualifient ce schéma de forme d’« orientalisme des données », où les systèmes numériques et les interfaces de recherche poussent subtilement les lecteurs à voir le confucianisme comme un objet exotique et ancien plutôt que comme une identité vivante et autodéfinie.

Repenser nos miroirs numériques de la culture
Pour les non-spécialistes, le message central est que nos miroirs numériques de la culture les plus confiés, tels que Ngram Viewer et Google Books, ne se contentent pas de refléter le monde ; ils contribuent à le façonner. Cette étude montre que l’identité confucéenne moderne, telle qu’elle apparaît dans les livres anglais globaux, est principalement cadrée comme un label ethnique et historique chinois ou est-asiatique, construit de l’extérieur plutôt que par les confucéens contemporains eux-mêmes. Les auteurs incitent lecteurs et chercheurs à traiter les grands jeux de données culturelles avec esprit critique, à constituer des corpus plus équilibrés et à prêter une attention accrue à la manière dont des classiques comme les Entretiens sont lus. Ce faisant, nous pouvons tendre vers des outils numériques qui éclairent la compréhension interculturelle plutôt que de renforcer discrètement d’anciennes divisions.
Citation: Gui, X., Kaur, S. Nominating Confucian(s) in Ngram Viewer: a DH-CL approach to Confucian identity in Anglophone discourse. Humanit Soc Sci Commun 13, 736 (2026). https://doi.org/10.1057/s41599-026-07161-8
Mots-clés: Identité confucéenne, humanités numériques, Google Books, biais culturel, discours anglophone