Clear Sky Science · fr

Classification par apprentissage automatique de l’excision féminine dans 11 pays d’Afrique subsaharienne à partir des données des enquêtes démographiques et de santé

2026-02-19 · Retour à l’index

Pourquoi cette recherche est importante

Dans certaines régions d’Afrique et ailleurs dans le monde, des millions de filles sont encore exposées à l’excision féminine, une pratique profondément nuisible aux conséquences physiques et émotionnelles tout au long de la vie. Les gouvernements et les communautés veulent y mettre fin, mais les ressources sont limitées et il peut être difficile d’obtenir des données fiables indiquant où les filles sont le plus à risque. Cette étude montre comment des outils modernes d’analyse de motifs, appelés apprentissage automatique, peuvent passer au crible de larges enquêtes de santé pour mettre en évidence quelles mères, familles et communautés sont les plus susceptibles de perpétuer la pratique — et où les efforts de prévention pourraient sauver le plus grand nombre de filles.

Comprendre une pratique dissimulée

L’excision féminine (FGM) consiste à blesser intentionnellement ou à retirer des parties des organes génitaux externes féminins pour des raisons non médicales. Elle est reconnue comme une atteinte aux droits humains et est associée à de graves problèmes à court terme tels que douleur, hémorragies abondantes, infections et même décès, ainsi qu’à des complications à long terme comme des difficultés lors de l’accouchement, l’infertilité et des traumatismes psychologiques. Bien que de nombreux pays disposent de lois interdisant l’excision, elle reste courante dans certaines régions d’Afrique subsaharienne, où la pression sociale, la tradition et des croyances liées à la religion et au mariage peuvent l’emporter sur les règles officielles. Pour concevoir des programmes de prévention plus intelligents, les décideurs ont besoin d’outils capables de repérer les schémas indiquant qui est le plus à risque, au‑delà des simples moyennes nationales.

Des mégadonnées issues des ménages

Les chercheurs ont exploité les Enquêtes démographiques et de santé, de larges études nationales représentatives qui visitent des milliers de ménages pour interroger les femmes sur leur vie et leur santé. Ils ont combiné des données d’enquête récentes (2015–2023) provenant de 62 249 femmes dans 11 pays d’Afrique de l’Est et de l’Ouest. Toutes avaient entre 15 et 49 ans et au moins une fille. À chaque mère on a demandé si l’une de ses filles avait subi une excision. L’équipe a également rassemblé des informations sur l’âge de la mère, le fait de vivre en zone rurale ou urbaine, son niveau d’éducation et la richesse du ménage, la personne à la tête du foyer, son propre statut d’excision, l’accès aux médias, le pays de résidence, ainsi que ses attitudes et croyances sur l’excision, notamment si elle la considère comme exigée par sa religion ou si elle pense qu’elle devrait continuer ou cesser. Ces nombreuses informations ont constitué la matière première pour des modèles informatiques qui apprendraient à distinguer les familles dont les filles avaient été excisées de celles qui ne l’avaient pas été.

Apprendre aux machines à reconnaître le risque

Pour transformer cet ensemble de données riche mais désordonné en quelque chose qu’un ordinateur pouvait exploiter, l’équipe a nettoyé, standardisé et encodé les réponses afin que nombres et catégories soient compréhensibles par des algorithmes. Ils ont utilisé une technique appelée SMOTE pour s’assurer que les modèles n’apprennent pas simplement à favoriser le groupe majoritaire de familles dont les filles n’avaient pas été excisées. Ils ont ensuite testé sept types de modèles de classification différents, incluant des approches simples comme la régression logistique et des méthodes plus flexibles telles que les arbres de décision, les forêts aléatoires, les machines à vecteurs de support, les k plus proches voisins, le Naive Bayes et XGBoost. Chaque modèle a été entraîné sur 80 % des données et évalué sur les 20 % restants, en utilisant plusieurs scores de performance mesurant la fréquence des bonnes prédictions, la capacité à ne pas manquer les cas réels et la clarté avec laquelle le modèle sépare les familles à risque élevé de celles à risque faible.

Le modèle remarquable et ce qui motive ses choix

Parmi toutes les approches testées, le modèle de forêt aléatoire — une méthode qui combine de nombreux arbres de décision en un prédicteur unique et plus stable — a donné les meilleurs résultats. Il a correctement classé les mères dans environ 85 % des cas et a été particulièrement performant pour identifier celles dont les filles avaient subi une excision, avec une forte capacité à distinguer les niveaux de risque au sein de la population. Mais la précision seule ne suffit pas ; les responsables de santé publique doivent aussi comprendre pourquoi le modèle fait ses prédictions. Pour ouvrir cette « boîte noire », les auteurs ont utilisé une méthode d’interprétabilité appelée SHAP, qui attribue à chaque facteur une contribution à la décision du modèle. Quatre éléments se sont distingués : l’opinion de la mère sur la poursuite de l’excision, le pays de résidence, le fait qu’elle ait elle‑même été excisée et la croyance que la pratique est exigée par la religion. Les mères favorables à la continuité de l’excision, vivant dans des pays à forte prévalence, ayant elles‑mêmes été excisées ou considérant l’excision comme une obligation religieuse étaient beaucoup plus susceptibles de déclarer que leurs filles avaient été excisées.

Des chiffres à l’action

Ces résultats se traduisent par des recommandations claires pour les acteurs qui œuvrent à l’élimination de l’excision. Le modèle suggère que changer les attitudes des mères — en particulier celles qui ont été excisées elles‑mêmes et celles qui subissent une pression religieuse à poursuivre la pratique — pourrait avoir un effet important pour protéger les filles. Il souligne également que le risque varie fortement d’un pays à l’autre, ce qui met en lumière la nécessité de stratégies adaptées à chaque pays plutôt que des campagnes uniformes. Les auteurs rappellent toutefois que leurs données transversales ne peuvent pas prouver la causalité, et que toute classification de risque doit être utilisée avec prudence pour éviter de stigmatiser des communautés. Leur travail montre néanmoins comment l’apprentissage automatique peut aider à cibler les endroits où l’éducation, l’engagement communautaire et les actions de sensibilisation religieuse sont les plus urgents. Ainsi, les outils avancés d’analyse de données peuvent devenir des alliés discrets mais importants dans l’effort mondial pour mettre fin à l’excision et protéger la santé et les droits des filles.

Citation: Gebrehana, A.K., Demoze, L., Yitageasu, G. et al. Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data. Sci Rep 16, 9944 (2026). https://doi.org/10.1038/s41598-026-40723-z

Mots-clés: excision féminine, apprentissage automatique, Afrique subsaharienne, données de santé publique, droits des femmes