Clear Sky Science · it

Integrazione della teoria cognitiva sociale con il machine learning per prevedere il comportamento sessuale di MSM con donne: uno studio multicentrico di sviluppo di un modello random forest in Cina

· Torna all'indice

Perché i ponti sessuali nascosti contano

Gli esperti di sanità pubblica sono preoccupati per i comportamenti «ponte» che collegano silenziosamente gruppi ad alto rischio di HIV alla popolazione più ampia. In Cina, alcuni uomini che hanno rapporti sessuali con uomini (MSM) hanno anche rapporti con donne, spesso mantenendo segreto il loro comportamento con persone dello stesso sesso. Questo schema può esporre involontariamente le partner femminili all’infezione e rende la prevenzione molto più difficile. Lo studio qui riassunto pone una domanda pratica: possiamo usare intuizioni della psicologia insieme alle moderne tecniche di data science per individuare precocemente questo comportamento nascosto, in modo che supporti le persone invece di colpevolizzarle?

Figure 1
Figura 1.

Uno sguardo ravvicinato a una comunità difficile da raggiungere

I ricercatori hanno collaborato con organizzazioni comunitarie in sei città cinesi per somministrare in forma anonima un sondaggio a 2.403 uomini che avevano avuto rapporti sessuali con uomini nei sei mesi precedenti. Hanno indagato non solo i contatti sessuali con uomini e donne, ma anche umore, autostima, uso di sostanze, relazioni, lavoro, istruzione e situazione abitativa. Circa il 17% dei partecipanti ha dichiarato di aver avuto rapporti con una donna nell’ultimo semestre. La maggior parte erano giovani adulti, con alto livello di istruzione e molti si erano trasferiti dal loro luogo d’origine. Questo approccio basato sulla comunità ha permesso al team di raggiungere persone che altrimenti potrebbero evitare sondaggi ufficiali a causa dello stigma o della paura di essere identificate.

Come sono state combinate psicologia e algoritmi

Lo studio è stato guidato dalla Teoria Cognitiva Sociale, un quadro che considera il comportamento come il prodotto di un’interazione continua tra pensieri e sentimenti personali, azioni quotidiane e mondo sociale circostante. Con questa lente, il team ha raggruppato 28 fattori misurati in tre aree ampie: stato personale (come depressione, ansia e autostima), comportamento (come sesso di gruppo con uomini o uso di droghe prima del sesso) e ambiente (come livello di istruzione, stato civile e migrazione). Invece di lasciare che un computer cercasse ciecamente ogni possibile pattern, gli autori hanno prima selezionato variabili che la teoria suggerisce essere rilevanti, quindi hanno usato un metodo di machine learning noto come random forest per classificare quali di queste contribuivano maggiormente a prevedere i rapporti con donne.

Costruire un punteggio di rischio compatto

Dalle 28 misure originali, l’algoritmo ha individuato un insieme compatto di nove fattori che contenevano la maggior parte del potere predittivo: ansia, depressione, autostima, età, livello di istruzione, stato civile, orientamento sessuale, sesso di gruppo recente con uomini e uso di droghe prima del sesso. Questi nove fattori sono stati poi inseriti in un modello statistico più semplice che restituisce una probabilità che un dato uomo abbia recentemente avuto rapporti con una donna. Utilizzando ripetuti cicli di addestramento e test su diversi sottoinsiemi dei dati, il modello è stato in grado di distinguere con una precisione ragionevole gli MSM che avevano dichiarato rapporti con donne da quelli che non lo avevano fatto: circa l’80% su una scala di performance standard. Ha inoltre prodotto stime di rischio ben calibrate rispetto alle frequenze osservate, il che significa che le probabilità previste non erano sistematicamente troppo alte o troppo basse.

Figure 2
Figura 2.

Cosa rivela il modello sui pattern di rischio

I segnali più forti provenivano dallo stato civile e da come i partecipanti definivano il proprio orientamento sessuale, seguiti dal disagio psicologico e da certi comportamenti. Gli uomini sposati, o che si identificavano come omosessuali o bisessuali piuttosto che incerti, avevano maggiori probabilità di riferire rapporti con donne. Punteggi più elevati di ansia e depressione e una minore autostima erano anch’essi associati a una maggiore probabilità di rapporti con persone di genere diverso, così come sesso di gruppo recente con uomini e uso di droghe prima del sesso. Età più giovane e livello di istruzione più basso tendevano ad aumentare il rischio. È importante che il modello abbia funzionato in modo simile attraverso diverse età, livelli di istruzione, situazioni coniugali e tra migranti e residenti locali, suggerendo che il punteggio di rischio non è limitato a un sottogruppo ristretto.

Trasformare i numeri in uno strumento pratico e non colpevolizzante

Per rendere i risultati utilizzabili al di fuori di un laboratorio statistico, il team ha convertito i nove predittori chiave in una semplice tabella di punteggio, o nomogramma. Un consulente, un clinico o un operatore di sensibilizzazione può usare questa tabella per assegnare punti in base ai punteggi dell’umore della persona, allo stato relazionale, all’istruzione, ai comportamenti recenti e così via; il totale dei punti si traduce in una stima della probabilità che la persona abbia anche rapporti con donne. Gli autori sottolineano che questo strumento è pensato per conversazioni riservate e di supporto e per la prevenzione precoce—aiutando a indirizzare consulenza, test e risorse per il sesso più sicuro verso persone che potrebbero fungere da ponti nascosti—piuttosto che per etichettare individui o aumentare lo stigma.

Citazione: Liu, S., Gao, Y., Xu, H. et al. Integrating social cognitive theory with machine learning to predict MSM-women sexual behavior: a multicenter random forest model development study in China. Sci Rep 16, 6029 (2026). https://doi.org/10.1038/s41598-026-36202-0

Parole chiave: Prevenzione dell'HIV, comportamento bisessuale, apprendimento automatico, salute mentale, MSM in Cina