Clear Sky Science · it

Predizione della mortalità sotto i cinque anni usando algoritmi di apprendimento supervisionato in 23 paesi dell’Africa subsahariana

· Torna all'indice

Perché questo studio conta per le famiglie

In molte aree dell’Africa subsahariana, ancora troppi bambini muoiono prima del quinto compleanno, nonostante i miglioramenti globali nella sopravvivenza infantile. Questo studio pone una domanda piena di speranza: gli strumenti informatici moderni possono setacciare grandi indagini sanitarie per individuare, con sufficiente anticipo, i bambini più a rischio, permettendo così a operatori sanitari e governi di intervenire? Combinando sanità pubblica e apprendimento automatico, i ricercatori mirano a trasformare i dati esistenti in indicazioni pratiche che potrebbero contribuire a salvare vite di bambini.

Uno sguardo nuovo a un problema ostinato

Le mortalità infantili nell’Africa subsahariana restano le più alte al mondo, con vaste differenze tra paesi. Questi divari riflettono accesso diseguale alle cliniche, gravi difficoltà economiche e limiti nei servizi per madri e neonati. I tentativi precedenti di prevedere quali bambini siano più vulnerabili spesso si sono basati su campioni piccoli o su metodi semplici, rendendo i risultati poco affidabili o difficili da applicare su larga scala. Il team dietro questo studio si è posto l’obiettivo di costruire strumenti di previsione più solidi e attendibili, che rispecchino la realtà di milioni di famiglie nella regione.

Trasformare grandi indagini in un quadro del rischio

I ricercatori hanno combinato i dati recenti delle Demographic and Health Surveys di 23 paesi, coprendo quasi 191.000 bambini nati nei cinque anni precedenti a ciascuna indagine. Per ogni bambino hanno considerato un ampio ventaglio di dettagli: età e livello di istruzione della madre, ricchezza del nucleo familiare, dimensione della famiglia, area di residenza, tipo di lavoro dei genitori, età materna alla prima gravidanza, uso di cure prenatali e postnatali, luogo del parto e difficoltà di accesso ai servizi sanitari. Hanno preparato i dati con cura, bilanciato il gruppo molto più piccolo di bambini deceduti rispetto a quelli sopravvissuti e utilizzato un metodo di selezione delle caratteristiche per concentrarsi sui fattori più informativi prima di addestrare diversi modelli computazionali.

Figure 1
Figure 1.

Lascare che gli algoritmi imparino dai modelli

Sono stati testati sette diversi algoritmi di apprendimento supervisionato, inclusi strumenti familiari come la regressione logistica e gli alberi decisionali, oltre a metodi più potenti di tipo “ensemble” che combinano molti modelli semplici. Ogni algoritmo ha imparato a distinguere tra i bambini sopravvissuti e quelli deceduti prima dei cinque anni, ed è stato valutato in base a quanto spesso risultava corretto, quanto bene identificava i veri casi ad alto rischio e quanto chiaramente separava complessivamente rischi alti e bassi. L’approccio random forest, che costruisce molti alberi decisionali e ne media i risultati, è emerso come il chiaro vincitore. Ha classificato correttamente i bambini in circa il 94% dei casi e ha mostrato un’ottima capacità di distinguere tra situazioni ad alto e basso rischio.

Guardare dentro la scatola nera

Per rendere le decisioni del modello comprensibili ai pianificatori sanitari e ai clinici, il team ha utilizzato una tecnica chiamata SHAP che mostra come ciascun fattore spinge una previsione verso un rischio più alto o più basso. Nella regione sono emersi alcuni temi ricorrenti. I bambini le cui famiglie segnalavano grandi problemi nell’accesso alle cure, quelli nati da madri che hanno avuto il primo figlio prima dei 18 anni e quelli che vivono nelle famiglie più povere presentavano un rischio predetto marcatamente più elevato. Al contrario, i figli di madri nella metà dei vent’anni, quelli nati in strutture sanitarie e quelli le cui famiglie hanno potuto ottenere le cure raccomandate in gravidanza e nel postnatalità avevano una probabilità predetta inferiore di morire. I grafici SHAP per singoli bambini hanno illustrato come una specifica combinazione di barriere e fattori protettivi si sommi in un profilo di rischio personale.

Figure 2
Figure 2.

Dai numeri all’azione

Lo studio dimostra che, alimentati con dati di indagine ampi, recenti e rappresentativi, i modelli di apprendimento automatico possono fornire un avvertimento precoce affidabile su quali bambini siano più a rischio di morire prima dei cinque anni nell’Africa subsahariana. Altrettanto importante, gli strumenti di interpretabilità evidenziano leve note ma potenti per il cambiamento: rendere le cliniche più facilmente raggiungibili, ritardare gravidanze molto precoci e ridurre la povertà estrema. Per un lettore non specialistico, il messaggio è semplice: i computer non sostituiscono medici o infermieri, ma possono aiutare a indirizzare risorse scarse verso le famiglie che ne hanno più bisogno, trasformando i dati in una mappa pratica per salvare vite infantili.

Citazione: Asnake, A.A., Gebrehana, A.K., Asmare, Z.A. et al. Prediction of under-five mortality using supervised machine learning algorithms in the 23 sub-Sharan African countries. Sci Rep 16, 9131 (2026). https://doi.org/10.1038/s41598-026-40401-0

Parole chiave: mortalità sotto i cinque anni, Africa subsahariana, apprendimento automatico, fattori di rischio per la salute infantile, predizione in sanità pubblica