Clear Sky Science · fr
Intégration de la théorie sociale cognitive et de l’apprentissage automatique pour prédire les comportements sexuels MSM‑femmes : étude multicentrique de développement d’un modèle random forest en Chine
Pourquoi les « ponts » sexuels cachés sont importants
Les experts en santé publique s’inquiètent des comportements de « pont » qui relient discrètement des groupes à risque élevé de VIH à la population générale. En Chine, certains hommes ayant des rapports sexuels avec des hommes (MSM) ont aussi des rapports avec des femmes, souvent en cachant leur comportement homosexuel. Ce schéma peut exposer involontairement des partenaires féminines à une infection et complique fortement la prévention. L’étude résumée ici pose une question pratique : peut‑on combiner des connaissances issues de la psychologie avec les outils modernes de science des données pour repérer tôt ce comportement caché, d’une manière qui soutient les personnes plutôt que de les stigmatiser ?

Un examen approfondi d’une communauté difficile à atteindre
Les chercheurs ont travaillé avec des organisations communautaires dans six villes chinoises pour enquêter anonymement 2 403 hommes ayant eu des rapports sexuels avec des hommes au cours des six derniers mois. Ils ont demandé non seulement les contacts sexuels avec des hommes et des femmes, mais aussi des informations sur l’humeur, l’estime de soi, la consommation de substances, les relations, le travail, le niveau d’éducation et la situation de logement. Environ 17 % des participants ont déclaré avoir eu des rapports avec une femme au cours du dernier semestre. La plupart étaient de jeunes adultes, fortement diplômés, et nombreux étaient ceux ayant migré hors de leur ville d’origine. Cette approche communautaire a permis à l’équipe d’atteindre des personnes qui auraient sinon pu éviter les enquêtes officielles en raison de la stigmatisation ou de la crainte d’être identifiées.
Comment psychologie et algorithmes ont été combinés
L’étude s’appuyait sur la théorie sociale cognitive, un cadre qui considère le comportement comme le produit d’une interaction continue entre pensées et ressentis personnels, actions quotidiennes et environnement social. Avec ce prisme, l’équipe a regroupé 28 facteurs mesurés en trois grands domaines : l’état personnel (par exemple dépression, anxiété, estime de soi), le comportement (par exemple rapports de groupe entre hommes ou consommation de drogues avant le sexe) et l’environnement (par exemple niveau d’éducation, état civil, migration). Plutôt que de laisser un ordinateur examiner aveuglément toutes les combinaisons, les auteurs ont d’abord sélectionné des variables que la théorie suggère importantes, puis ont utilisé une méthode d’apprentissage automatique connue sous le nom de random forest pour classer celles qui contribuaient réellement le plus à la prédiction des rapports avec des femmes.
Construction d’un score de risque compact
À partir des 28 mesures initiales, l’algorithme a identifié un ensemble compact de neuf variables qui portaient l’essentiel du pouvoir prédictif : anxiété, dépression, estime de soi, âge, niveau d’éducation, état civil, orientation sexuelle, rapports de groupe récents avec des hommes et consommation de drogues avant le sexe. Ces neuf facteurs ont ensuite été intégrés dans un modèle statistique plus simple qui fournit une probabilité qu’un homme donné ait récemment eu des rapports avec une femme. Grâce à des entraînements et tests répétés sur différents sous‑ensembles de données, le modèle a pu distinguer avec une précision raisonnablement élevée les MSM ayant déclaré ou non des rapports avec des femmes : environ 80 % sur une mesure de performance standard. Il a aussi produit des estimations de risque bien calibrées, c’est‑à‑dire que les probabilités prédites correspondaient globalement aux fréquences observées sans biais systématique vers le haut ou le bas.

Ce que le modèle révèle sur les profils de risque
Les signaux les plus forts provenaient de l’état civil et de la manière dont les participants définissaient leur orientation sexuelle, suivis par la détresse psychologique et certains comportements. Les hommes mariés, ou ceux s’identifiant comme homosexuels ou bisexuels plutôt que « incertains », avaient plus de chances de déclarer des rapports avec des femmes. Des scores plus élevés d’anxiété et de dépression et une estime de soi plus faible étaient également associés à une plus grande probabilité de rapports avec des personnes de l’autre genre, tout comme des rapports de groupe récents entre hommes et l’usage de drogues avant le sexe. Un âge plus jeune et un niveau d’éducation inférieur tendent à accroître le risque. De manière importante, le modèle fonctionnait de façon similaire à travers différents âges, niveaux d’éducation, situations matrimoniales et entre migrants et résidents locaux, ce qui suggère que le score de risque n’est pas limité à un sous‑groupe étroit.
Transformer les chiffres en un outil pratique et non stigmatisant
Pour rendre les résultats utilisables en dehors d’un laboratoire statistique, l’équipe a converti les neuf prédicteurs clés en un tableau de score simple, ou nomogramme. Un conseiller, clinicien ou travailleur de terrain peut utiliser ce tableau pour attribuer des points aux scores d’humeur d’une personne, à son statut relationnel, à son niveau d’éducation, à ses comportements récents, etc. ; le total des points se traduit par une estimation de la probabilité que la personne ait aussi des rapports avec des femmes. Les auteurs soulignent que cet outil est conçu pour des entretiens confidentiels et bienveillants et pour la prévention précoce — afin de mieux cibler le conseil, le dépistage et les ressources pour des pratiques sexuelles plus sûres chez ceux qui pourraient servir de ponts cachés — plutôt que pour étiqueter des individus ou accroître la stigmatisation.
Citation: Liu, S., Gao, Y., Xu, H. et al. Integrating social cognitive theory with machine learning to predict MSM-women sexual behavior: a multicenter random forest model development study in China. Sci Rep 16, 6029 (2026). https://doi.org/10.1038/s41598-026-36202-0
Mots-clés: Prévention du VIH, Comportement bisexuel, Apprentissage automatique, Santé mentale, MSM en Chine