Clear Sky Science · sv
Integrering av social kognitiv teori med maskininlärning för att förutse sexuella beteenden hos MSM med kvinnor: en multicenterstudie för att utveckla en random forest-modell i Kina
Varför dolda sexuella broar är viktiga
Folkhälsoexperter oroar sig för så kallade ”bro”-beteenden som tyst förbinder grupper med hög HIV-risk med den bredare befolkningen. I Kina har vissa män som har sex med män (MSM) även sex med kvinnor, ofta samtidigt som de håller sina homosexuella kontakter hemliga. Detta mönster kan oavsiktligt utsätta kvinnliga partners för smitta och gör förebyggande mycket svårare. Studien som sammanfattas här ställer en praktisk fråga: kan vi använda insikter från psykologin tillsammans med modern dataanalys för att tidigt upptäcka detta dolda beteende, på ett sätt som stödjer människor snarare än skyller på dem?

En närmare titt på en svårnådd grupp
Forskarna samarbetade med lokala community‑organisationer i sex kinesiska städer för att anonymt undersöka 2 403 män som haft sex med män under de senaste sex månaderna. De frågade inte bara om sexuella kontakter med män och kvinnor, utan också om stämningsläge, självkänsla, substansbruk, relationer, arbete, utbildning och boendesituation. Omkring 17 % av deltagarna rapporterade sex med en kvinna under den senaste halvåret. De flesta var unga vuxna med hög utbildningsnivå, och många hade flyttat från sina hemorter. Denna community‑baserade ansats gjorde det möjligt för teamet att nå personer som annars kanske undviker officiella undersökningar på grund av stigma eller rädsla för att bli identifierade.
Hur psykologi och algoritmer kombinerades
Studien vägleddes av Social kognitiv teori, en ram som ser beteende som en produkt av kontinuerlig interaktion mellan personliga tankar och känslor, vardagliga handlingar och den omgivande sociala världen. Med detta perspektiv grupperade teamet 28 uppmätta faktorer i tre breda områden: personlig status (såsom depression, ångest och självkänsla), beteende (såsom gruppsex med män eller droganvändning före sex) och miljö (såsom utbildningsnivå, civilstånd och migration). Istället för att låta en dator blint söka igenom alla mönster valde författarna först variabler som teorin antyder är viktiga, och använde sedan en maskininlärningsmetod känd som random forests för att rangordna vilka som faktiskt bidrog mest till att förutsäga sex med kvinnor.
Att bygga en kompakt riskpoäng
Från de ursprungliga 28 måtten identifierade algoritmen en kompakt uppsättning av nio som bar största delen av den prediktiva förmågan: ångest, depression, självkänsla, ålder, utbildningsnivå, civilstånd, sexuell läggning, nyligen gruppsex med män och droganvändning före sex. Dessa nio faktorer matades sedan in i en enklare statistisk modell som ger en sannolikhet att en viss man nyligen haft sex med en kvinna. Genom upprepade tränings‑ och testprocedurer på olika delmängder av datamaterialet kunde modellen skilja de MSM som rapporterade sex med kvinnor från de som inte gjorde det med relativt hög noggrannhet: omkring 80 % på en standardprestandaskala. Den gav också riskuppskattningar som väl stämde överens med observerade frekvenser, vilket betyder att de förutsagda sannolikheterna inte systematiskt var för höga eller för låga.

Vad modellen avslöjar om riskmönster
De starkaste signalerna kom från civilstånd och hur deltagarna betecknade sin sexuella läggning, följt av psykologisk stress och vissa beteenden. Män som var gifta, eller som identifierade sig som homosexuella eller bisexuella snarare än osäkra, rapporterade i större utsträckning sex med kvinnor. Högre poäng för ångest och depression och lägre självkänsla var också kopplade till större sannolikhet för kors‑könligt sex, liksom nyligen gruppsex med män och droganvändning före sex. Yngre ålder och lägre utbildning tenderade att öka risken. Viktigt är att modellen presterade ungefär lika bra över olika åldrar, utbildningsnivåer, civilstånd och mellan migranter och bofasta invånare, vilket tyder på att riskpoängen inte är begränsad till en snäv undergrupp.
Att omvandla siffror till ett praktiskt, icke‑dömande verktyg
För att göra resultaten användbara utanför statistiklaboratoriet konverterade teamet de nio nyckelprediktorerna till ett enkelt poängschema, en så kallad nomogram. En rådgivare, kliniker eller uppsökande arbetare kan använda detta schema för att tilldela poäng för varje persons stämningspoäng, relationsstatus, utbildning, nyliga beteenden med mera; totalt antal poäng översätts till en uppskattad sannolikhet att personen också har sex med kvinnor. Författarna betonar att detta verktyg är utformat för konfidentiella, stödjande samtal och tidig prevention — för att hjälpa rikta rådgivning, testning och säkrare‑sex‑resurser till dem som kan fungera som dolda broar — snarare än för att stigmatisera eller märka individer.
Citering: Liu, S., Gao, Y., Xu, H. et al. Integrating social cognitive theory with machine learning to predict MSM-women sexual behavior: a multicenter random forest model development study in China. Sci Rep 16, 6029 (2026). https://doi.org/10.1038/s41598-026-36202-0
Nyckelord: HIV-prevention, bisexuellt beteende, maskininlärning, psykisk hälsa, Kina MSM