Clear Sky Science · fr
Prédiction de la mortalité des moins de cinq ans à l’aide d’algorithmes d’apprentissage supervisé dans 23 pays d’Afrique subsaharienne
Pourquoi cette étude compte pour les familles
Dans de nombreuses régions d’Afrique subsaharienne, trop d’enfants meurent encore avant leur cinquième anniversaire, malgré les progrès mondiaux en matière de survie infantile. Cette étude pose une question porteuse d’espoir : les outils informatiques modernes peuvent-ils parcourir d’importantes enquêtes sanitaires pour repérer, suffisamment tôt, les enfants les plus à risque afin que les soignants et les autorités puissent intervenir ? En mêlant santé publique et apprentissage automatique, les chercheurs cherchent à transformer des données existantes en recommandations pratiques susceptibles de sauver des vies de jeunes enfants.
Reprendre un problème tenace sous un nouvel angle
La mortalité infantile en Afrique subsaharienne reste la plus élevée au monde, avec de grandes différences d’un pays à l’autre. Ces écarts reflètent un accès inégal aux centres de soins, une pauvreté profonde et des limites des services pour les mères et les nouveau-nés. Les tentatives antérieures pour prédire quels enfants sont les plus vulnérables utilisaient souvent de petits échantillons ou des méthodes simples, rendant leurs résultats difficiles à généraliser ou à appliquer à grande échelle. L’équipe de cette étude s’est donné pour objectif de construire des outils de prédiction plus solides et plus fiables, qui reflètent la réalité de millions de familles dans la région.
Transformer de grandes enquêtes en image du risque
Les chercheurs ont combiné des données récentes des enquêtes démographiques et de santé (DHS) de 23 pays, couvrant près de 191 000 enfants nés au cours des cinq années précédant chaque enquête. Pour chaque enfant, ils ont pris en compte un large éventail d’informations : l’âge et le niveau d’éducation de la mère, la richesse du ménage, la taille de la famille, le lieu de résidence, le type d’emploi des parents, l’âge à la première maternité, l’utilisation des soins prénataux et postnataux, le lieu d’accouchement et la difficulté d’accès aux services de santé. Ils ont soigneusement préparé les données, équilibré le groupe beaucoup plus restreint d’enfants décédés avec ceux qui ont survécu, et utilisé une méthode de sélection de variables pour se concentrer sur les facteurs les plus informatifs avant d’entraîner plusieurs modèles informatiques.

Laisser les algorithmes apprendre des motifs
Sept algorithmes d’apprentissage supervisé différents ont été testés, y compris des outils familiers comme la régression logistique et les arbres de décision, ainsi que des méthodes d’« ensemble » plus puissantes qui combinent de nombreux modèles simples. Chaque algorithme a appris à distinguer les enfants ayant survécu de ceux décédés avant l’âge de cinq ans, et a été évalué sur sa justesse globale, sa capacité à identifier les cas réellement à haut risque et sur la clarté avec laquelle il séparait les situations à risque élevé et faible. L’approche par forêt aléatoire, qui construit de nombreux arbres de décision et moyenne leurs résultats, est apparue comme la grande gagnante. Elle a correctement classé les enfants dans environ 94 % des cas et a montré une excellente capacité à distinguer le risque élevé du risque faible.
Comprendre le « boîte noire »
Pour rendre les décisions du modèle compréhensibles aux planificateurs de santé et aux cliniciens, l’équipe a utilisé une technique appelée SHAP qui montre comment chaque facteur pousse une prédiction vers un risque plus élevé ou plus faible. Dans l’ensemble de la région, plusieurs thèmes se sont dégagés. Les enfants de familles rapportant de grandes difficultés pour accéder aux soins, ceux nés de mères ayant eu leur première naissance avant 18 ans, et ceux vivant dans les ménages les plus pauvres présentaient un risque prédit nettement plus élevé. À l’inverse, les enfants de mères dans la vingtaine, ceux nés en établissements de santé et ceux dont les familles avaient pu bénéficier des soins prénataux et postnataux recommandés présentaient une probabilité prédite de décès plus faible. Des graphiques SHAP individuels illustraient comment un mélange précis d’obstacles et de protections se conjugue pour produire un profil de risque personnel.

Des chiffres à l’action
L’étude montre que, lorsqu’ils sont alimentés par des données d’enquête larges, récentes et représentatives, les modèles d’apprentissage automatique peuvent fournir une alerte précoce fiable sur les enfants les plus susceptibles de mourir avant cinq ans en Afrique subsaharienne. Tout aussi important, les outils d’interprétabilité mettent en évidence des leviers d’action connus mais puissants : faciliter l’accès aux centres de soins, retarder les maternités très précoces et réduire la pauvreté extrême. Pour le lecteur non spécialiste, le message est clair : les ordinateurs ne remplacent pas les médecins ou les infirmières, mais ils peuvent aider à orienter des ressources rares vers les familles qui en ont le plus besoin, transformant les données en feuille de route pratique pour sauver des vies d’enfants.
Citation: Asnake, A.A., Gebrehana, A.K., Asmare, Z.A. et al. Prediction of under-five mortality using supervised machine learning algorithms in the 23 sub-Sharan African countries. Sci Rep 16, 9131 (2026). https://doi.org/10.1038/s41598-026-40401-0
Mots-clés: mortalité des moins de cinq ans, Afrique subsaharienne, apprentissage automatique, facteurs de risque en santé infantile, prévision en santé publique