Clear Sky Science · es
Integrando la teoría social cognitiva con el aprendizaje automático para predecir el comportamiento sexual de HSH‑mujeres: un estudio multicéntrico de desarrollo de un modelo de bosque aleatorio en China
Por qué importan los puentes sexuales ocultos
Los expertos en salud pública se preocupan por las conductas «puente» que conectan de forma discreta a grupos con alto riesgo de VIH con la población general. En China, algunos hombres que tienen relaciones sexuales con hombres (HSH) también mantienen relaciones con mujeres, con frecuencia ocultando su conducta homosexual. Este patrón puede exponer sin querer a las parejas femeninas a la infección y dificulta mucho la prevención. El estudio resumido aquí plantea una pregunta práctica: ¿podemos usar conocimientos de la psicología junto con la ciencia de datos moderna para detectar este comportamiento oculto de manera temprana, apoyando a las personas en lugar de culpabilizarlas?

Una mirada más cercana a una comunidad de difícil acceso
Los investigadores trabajaron con organizaciones comunitarias en seis ciudades chinas para encuestar de forma anónima a 2.403 hombres que habían tenido sexo con hombres en los seis meses anteriores. Preguntaron no solo sobre contactos sexuales con hombres y mujeres, sino también sobre estado de ánimo, autoestima, consumo de sustancias, relaciones, trabajo, educación y situación de vivienda. Alrededor del 17 % de los participantes informó haber tenido sexo con una mujer en el último medio año. La mayoría eran adultos jóvenes, con alto nivel educativo, y muchos se habían desplazado fuera de su ciudad natal. Este enfoque comunitario permitió al equipo llegar a personas que, de otro modo, podrían evitar encuestas oficiales por estigma o temor a ser identificadas.
Cómo se combinaron psicología y algoritmos
El estudio se guió por la Teoría Social Cognitiva, un marco que considera el comportamiento como producto de la interacción continua entre los pensamientos y sentimientos personales, las acciones cotidianas y el entorno social. Con esta perspectiva, el equipo agrupó 28 factores medidos en tres áreas amplias: estado personal (como depresión, ansiedad y autoestima), comportamiento (como sexo en grupo con hombres o uso de drogas antes del sexo) y entorno (como nivel educativo, estado civil y migración). En lugar de dejar que un ordenador buscando ciegamente explore todos los patrones, los autores primero escogieron variables que la teoría sugiere que deberían importar y luego usaron un método de aprendizaje automático conocido como bosques aleatorios para clasificar cuáles realmente ayudaban más a predecir el sexo con mujeres.
Construcción de una puntuación de riesgo compacta
De las 28 medidas originales, el algoritmo identificó un conjunto compacto de nueve que concentraban la mayor parte del poder predictivo: ansiedad, depresión, autoestima, edad, nivel educativo, estado civil, orientación sexual, sexo en grupo reciente con hombres y uso de drogas antes del sexo. Estos nueve factores se introdujeron luego en un modelo estadístico más simple que arroja una probabilidad de que un hombre dado hubiera tenido sexo con una mujer recientemente. Usando entrenamiento y prueba repetidos en distintos subconjuntos de los datos, el modelo pudo distinguir con bastante precisión a los HSH que sí y no informaron sexo con mujeres: alrededor del 80 % en una escala estándar de rendimiento. También produjo estimaciones de riesgo que coincidían bien con las frecuencias observadas, lo que significa que las probabilidades predichas no eran sistemáticamente demasiado altas ni demasiado bajas.

Lo que el modelo revela sobre los patrones de riesgo
Las señales más fuertes provinieron del estado civil y de cómo los participantes etiquetaron su orientación sexual, seguidas por el malestar psicológico y ciertas conductas. Los hombres casados, o que se identificaban como homosexuales o bisexuales en lugar de inseguros, tenían mayor probabilidad de informar sexo con mujeres. Puntuaciones más altas de ansiedad y depresión y una menor autoestima también se asociaron con una mayor probabilidad de sexo con parejas de distinto género, al igual que el sexo en grupo reciente con hombres y el uso de drogas antes del sexo. La edad más joven y un menor nivel educativo tendían a aumentar el riesgo. Es importante que el modelo funcionara de forma similar a través de diferentes edades, niveles educativos, estados civiles y entre migrantes y residentes locales, lo que sugiere que la puntuación de riesgo no se limita a un subgrupo estrecho.
Convertir los números en una herramienta práctica y sin culpabilizar
Para hacer los resultados utilizables fuera de un laboratorio de estadística, el equipo convirtió los nueve predictores clave en una tabla de puntuación simple, o nomograma. Un consejero, clínico o trabajador de alcance puede usar esta tabla para asignar puntos según las puntuaciones de ánimo de cada persona, su situación relacional, educación, conductas recientes, etc.; el total de puntos se traduce en una probabilidad estimada de que la persona también mantenga relaciones con mujeres. Los autores enfatizan que esta herramienta está diseñada para conversaciones confidenciales y de apoyo y para la prevención temprana—ayudando a orientar el asesoramiento, las pruebas y los recursos de sexo más seguro hacia quienes podrían actuar como puentes ocultos—en lugar de etiquetar a individuos o aumentar el estigma.
Cita: Liu, S., Gao, Y., Xu, H. et al. Integrating social cognitive theory with machine learning to predict MSM-women sexual behavior: a multicenter random forest model development study in China. Sci Rep 16, 6029 (2026). https://doi.org/10.1038/s41598-026-36202-0
Palabras clave: Prevención del VIH, conducta bisexual, aprendizaje automático, salud mental, HSH en China