Clear Sky Science · zh

将社会认知理论与机器学习结合用于预测MSM与女性的性行为:中国多中心随机森林模型开发研究

· 返回目录

为何隐秘的性桥梁重要

公共卫生专家担心那些悄然将高艾滋病风险群体与更广泛人群连接起来的“桥梁”行为。在中国,一些与男性发生性关系的男性(MSM)同时也与女性发生性关系,且常常对其同性行为保密。这种模式可能无意中使女性伴侣暴露于感染风险之下,也使预防工作变得更加困难。这里总结的研究提出了一个务实的问题:我们能否将心理学见解与现代数据科学结合,及早识别这种隐秘行为,以支持受影响者而非指责他们?

Figure 1
Figure 1.

深入研究一个难以触及的群体

研究人员与中国六个城市的社区组织合作,匿名调查了2,403名在过去六个月内有与男性发生性行为的男性。他们不仅询问了与男性和女性的性接触情况,还收集了情绪、自尊、药物使用、关系状况、工作、教育和居住情况等信息。大约17%的参与者报告在最近半年来与女性发生过性行为。大多数为青年、高学历,且许多人已离开家乡。基于社区的这一方法使研究团队能够触及那些可能因污名或担心被识别而回避官方调查的人群。

心理学与算法如何结合

该研究以社会认知理论为指导,这一框架将行为视为个人想法与感受、日常行为和周围社会世界之间持续互动的产物。基于此视角,团队将28个测量因素分为三大类:个人状态(如抑郁、焦虑和自尊)、行为(如与男性的群体性行为或性前使用药物)和环境(如教育水平、婚姻状况和迁移情况)。作者没有让计算机盲目地搜索所有模式,而是先选择理论上应当重要的变量,然后使用称为随机森林的机器学习方法来排序哪些变量在预测与女性发生性行为方面最有帮助。

构建紧凑的风险评分

从最初的28项指标中,算法识别出九个携带大部分预测信息的紧凑变量:焦虑、抑郁、自尊、年龄、教育水平、婚姻状况、性取向、近期与男性的群体性行为以及性前使用药物。将这九个因素输入更简单的统计模型,该模型输出某个男性最近与女性发生性行为的概率。通过在不同数据子集中反复训练与测试,模型能够以相当高的准确率区分报告与未报告与女性发生性行为的MSM:在常用性能尺度上约为80%。它还产生了与观察到的频率相匹配的风险估计,意味着预测概率整体上既不过高也不过低。

Figure 2
Figure 2.

模型揭示的风险模式

最强的信号来自婚姻状况和参与者对其性取向的标识,其次是心理困扰和某些行为。已婚者,或自我认同为同性恋或双性恋而非不确定者,更可能报告与女性发生性行为。较高的焦虑和抑郁评分以及较低的自尊也与更高的跨性别性行为可能性相关,近期与男性的群体性行为和性前使用药物亦如此。年轻年龄和较低教育水平往往会增加风险。重要的是,该模型在不同年龄、教育水平、婚姻状况以及流动人口与本地居民之间表现相似良好,表明风险评分并不限于狭窄的亚群体。

将数字转化为实用且不带指责的工具

为了使结果在统计实验室之外可用,团队将九个关键预测因子转换为一个简单的评分图表或列线图(nomogram)。咨询人员、临床医生或外展工作人员可以使用该图表为每个人的情绪评分、关系状况、教育、近期行为等分配点数;总分对应该人也与女性发生性行为的估计概率。作者强调,该工具旨在用于保密、支持性的对话和早期预防——帮助将咨询、检测和安全性资源定位到可能成为隐秘桥梁的人群——而不是用于标签化个人或增加污名。

引用: Liu, S., Gao, Y., Xu, H. et al. Integrating social cognitive theory with machine learning to predict MSM-women sexual behavior: a multicenter random forest model development study in China. Sci Rep 16, 6029 (2026). https://doi.org/10.1038/s41598-026-36202-0

关键词: 艾滋病预防, 双性行为, 机器学习, 心理健康, 中国 MSM