Clear Sky Science · it

Classificazione basata su apprendimento automatico delle mutilazioni genitali femminili in 11 paesi dell’Africa subsahariana utilizzando dati dei Demographic and Health Survey

· Torna all'indice

Perché questa ricerca è importante

In alcune aree dell’Africa e del mondo, milioni di ragazze sono ancora soggette alla mutilazione genitale femminile, una pratica profondamente dannosa con conseguenze fisiche ed emotive che durano tutta la vita. Governi e comunità vogliono fermarla, ma le risorse sono limitate e ottenere dati affidabili su dove le ragazze sono più a rischio può essere difficile. Questo studio mostra come gli strumenti moderni di scoperta di pattern, noti come apprendimento automatico, possano analizzare grandi indagini sanitarie per evidenziare quali madri, famiglie e comunità sono più propense a perpetuare la pratica — e dove gli sforzi di prevenzione potrebbero salvare più ragazze dal subire danni.

Comprendere una pratica nascosta

La mutilazione genitale femminile (MGF) consiste nel danneggiare intenzionalmente o rimuovere parti dei genitali esterni femminili per ragioni non mediche. È riconosciuta come una violazione dei diritti umani ed è collegata a gravi problemi a breve termine come dolore, emorragie intense, infezioni e perfino morte, oltre a complicazioni a lungo termine come difficoltà durante il parto, infertilità e traumi psicologici. Sebbene molti Paesi abbiano leggi contro la MGF, la pratica resta diffusa in parti dell’Africa subsahariana, dove la pressione sociale, le tradizioni e le credenze su religione e matrimonio possono avere più peso delle norme ufficiali. Per progettare programmi di prevenzione più efficaci, i decisori hanno bisogno di strumenti in grado di individuare pattern su chi è maggiormente a rischio, andando oltre semplici medie nazionali.

Big data dalle famiglie di tutti i giorni

I ricercatori hanno utilizzato i Demographic and Health Surveys, vaste indagini nazionali rappresentative che visitano migliaia di famiglie per intervistare le donne sulla loro vita e salute. Hanno combinato dati recenti delle indagini (2015–2023) provenienti da 62.249 donne in 11 paesi dell’Africa orientale e occidentale. Tutte avevano età compresa tra 15 e 49 anni e avevano almeno una figlia. A ogni madre è stato chiesto se una qualsiasi delle sue figlie avesse subito la MGF. Il gruppo ha inoltre raccolto informazioni sull’età della madre, se viveva in area rurale o urbana, sul livello di istruzione e sulla ricchezza della famiglia, chi fosse il capo famiglia, lo stato di circoncisione della madre stessa, l’accesso ai media, il paese di residenza e le sue attitudini e convinzioni riguardo alla MGF, incluso se la considerasse richiesta dalla sua religione o se pensasse che dovesse continuare o cessare. Queste numerose informazioni hanno costituito il materiale grezzo per i modelli informatici che avrebbero imparato a distinguere le famiglie le cui figlie erano state mutilate da quelle in cui non lo erano.

Figure 1
Figura 1.

Insegnare alle macchine a riconoscere il rischio

Per trasformare questo dataset ricco ma disomogeneo in qualcosa da cui un computer potesse apprendere, il team ha pulito, standardizzato e codificato le risposte in modo che numeri e categorie fossero comprensibili agli algoritmi. Hanno impiegato una tecnica chiamata SMOTE per evitare che i modelli imparassero semplicemente a favorire il gruppo numericamente più grande di famiglie in cui le figlie non erano state mutilate. Hanno quindi testato sette tipi diversi di modelli di classificazione, includendo approcci semplici come la regressione logistica e modelli più flessibili come alberi decisionali, foreste casuali, macchine a vettori di supporto, k‑nearest neighbors, Naive Bayes e XGBoost. Ogni modello è stato addestrato sull’80% dei dati e valutato sul restante 20%, utilizzando diversi punteggi di performance che misurano quanto spesso il modello ha ragione, quanto bene evita di mancare i casi veri e quanto chiaramente separa le famiglie a rischio più alto da quelle a rischio più basso.

Il modello migliore e cosa guida le sue scelte

Tra tutti gli approcci testati, il modello a foresta casuale — un metodo che combina molti alberi decisionali in un predittore unico e più stabile — ha ottenuto le migliori prestazioni. Ha classificato correttamente le madri in circa l’85% dei casi ed è stato particolarmente efficace nell’identificare quelle le cui figlie erano state sottoposte a MGF, con un’elevata capacità di distinguere i livelli di rischio nella popolazione. Ma l’accuratezza da sola non basta; i funzionari della sanità pubblica hanno anche bisogno di capire perché il modello fa le sue predizioni. Per aprire questa scatola nera, gli autori hanno usato un metodo di interpretabilità chiamato SHAP, che assegna a ciascun fattore un contributo alla decisione del modello. Quattro elementi sono emersi con chiarezza: l’opinione della madre sul fatto che la MGF debba continuare, il paese in cui vive, se lei stessa è stata sottoposta a MGF e se ritiene che la pratica sia richiesta dalla religione. Le madri che sostenevano la continuazione della MGF, che vivevano in paesi ad alta prevalenza, che erano esse stesse mutilate o che vedevano la pratica come richiesta dalla religione avevano una probabilità molto più alta di dichiarare che le loro figlie fossero state mutilate.

Figure 2
Figura 2.

Dai numeri all’azione

Questi risultati si traducono in indicazioni chiare per chi lavora per porre fine alla MGF. Il modello suggerisce che cambiare le attitudini delle madri — specialmente quelle che sono state mutilate e quelle che subiscono pressioni religiose per continuare la pratica — potrebbe avere un effetto potente nel proteggere le ragazze. Mettono inoltre in evidenza come il rischio vari nettamente tra i paesi, sottolineando la necessità di strategie adattate al contesto nazionale piuttosto che campagne uguali per tutti. Pur avvertendo che i dati trasversali non possono dimostrare relazioni causa‑effetto e che qualsiasi classificazione del rischio deve essere usata con cautela per evitare di stigmatizzare le comunità, gli autori mostrano come l’apprendimento automatico possa aiutare a individuare dove interventi educativi, coinvolgimento comunitario e iniziative basate sulla fede siano più urgentemente necessari. In questo modo, gli strumenti avanzati di analisi dei dati possono diventare alleati silenziosi ma importanti nello sforzo globale per porre fine alla MGF e salvaguardare la salute e i diritti delle ragazze.

Citazione: Gebrehana, A.K., Demoze, L., Yitageasu, G. et al. Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data. Sci Rep 16, 9944 (2026). https://doi.org/10.1038/s41598-026-40723-z

Parole chiave: mutilazione genitale femminile, apprendimento automatico, Africa subsahariana, dati di sanità pubblica, diritti delle donne