Clear Sky Science · it

Tenere il passo con le regioni: un quadro ibrido di machine learning per stimare le tavole input-output regionali

· Torna all'indice

Perché le economie regionali contano

Quando una fabbrica chiude, un nuovo ospedale apre o un porto viene ampliato, gli effetti si propagano ben oltre il luogo di lavoro immediato. Gli economisti usano dettagliate tavole «input–output» per tracciare come denaro e posti di lavoro circolano tra settori come l’agricoltura, l’industria e i servizi. Tuttavia, per la maggior parte delle regioni all’interno dei paesi costruire queste tavole è così costoso e richiede così tanti dati che vengono aggiornate raramente, se non mai. Questo articolo presenta un nuovo modo per stimare quelle mappe economiche regionali usando il moderno machine learning, promettendo strumenti più rapidi e accurati per pianificatori, analisti e chiunque sia interessato a come le economie locali sono connesse.

Figure 1
Figure 1.

Il problema di mappare i legami economici locali

Le tavole input–output descrivono chi compra cosa da chi in un’economia: quanto acciaio acquistano i produttori di automobili, quanti servizi legali utilizzano le imprese manifatturiere e così via. Esistono tavole nazionali per molti paesi, ma le versioni locali — per stati, province o aree metropolitane — spesso mancano perché richiedono indagini ampie e costose. Per aggirare questo problema, gli economisti partono tipicamente dalla tavola nazionale e la rimodellano con ricette matematiche semplici in modo che corrisponda ai totali regionali noti, come l’occupazione o la produzione per settore. Scorciatoie popolari, con nomi come location quotients e RAS, sono economiche e veloci ma possono distorcere schemi cruciali, in particolare la tendenza delle industrie a procurarsi molto dallo stesso settore o da pochi partner chiave. Queste distorsioni possono fuorviare decisioni su infrastrutture, politiche climatiche o preparazione agli shock.

Fondere l’economia tradizionale con nuovi algoritmi

Gli autori propongono un quadro ibrido che unisce la struttura economica classica con l’intelligenza artificiale all’avanguardia. Al centro c’è un tipo di modello generativo chiamato GAN, comunemente usato per creare immagini realistiche. Qui, invece delle immagini, il GAN impara a creare intere tavole input–output che somigliano a quelle osservate nei dati storici. Uno strato interno speciale obbliga ogni tavola generata a rispettare regole contabili rigorose: i totali di righe e colonne devono corrispondere alle cifre regionali conosciute e le voci non possono essere negative. Questo mantiene il modello di machine learning ancorato ai principi economici di base invece di lasciarlo inseguire esclusivamente schemi statistici.

Rifinire il progetto preliminare

Anche un GAN ben addestrato tende a compiere piccoli errori sistematici — per esempio, sottostimare leggermente quanto certi settori commerciano con se stessi. Per correggere questo, gli autori aggiungono una seconda fase nota come residual boosting. Dopo che il GAN produce la sua migliore ipotesi, un ensemble separato di modelli ad albero decisionale impara gli errori tipici commessi e predice una correzione. La tavola corretta viene quindi regolata con cautela per evitare valori irrealistici. Questo progetto in due passaggi sfrutta l’abilità del GAN nel cogliere il quadro d’insieme — come la forma complessiva e la concentrazione dei flussi — mentre il booster affina i dettagli locali. Il metodo è inoltre informato dal fatto che le economie reali presentano pochi flussi molto grandi e molti molto piccoli, un pattern asimmetrico che il modello è esplicitamente incoraggiato a imitare.

Figure 2
Figure 2.

Mettere il metodo alla prova

Per verificare se questo approccio ibrido funziona nella pratica, gli autori lo testano su due grandi set di dati: una raccolta di tavole nazionali di molti paesi e un insieme di tavole input–output mondiali che descrivono le catene globali di approvvigionamento attraverso decine di industrie e regioni. Poiché in questi casi le tavole vere sono note, i ricercatori possono confrontare direttamente le loro stime con la realtà e con versioni migliorate del metodo RAS tradizionale. Su un’ampia gamma di misure — adattamento complessivo, errori medi, quanto bene viene riprodotta la diagonale principale e quanto fedelmente viene preservata la distribuzione diseguale di flussi grandi e piccoli — il metodo ibrido risulta superiore. Nel dataset nazionale migliora la misura standard di bontà di adattamento di quasi nove punti percentuali rispetto al RAS migliorato, e più che raddoppia la precisione con cui viene catturato l’autoutilizzo all’interno dei settori. Sulle tavole globali ottiene un accordo ancora più stretto, riproducendo quasi perfettamente la struttura sottostante.

Cosa significa per le decisioni nel mondo reale

Per i non specialisti, il messaggio chiave è che ora possiamo costruire ritratti delle economie regionali molto più affidabili senza mandare squadre di intervistatori porta a porta. Il modello ibrido mantiene la logica contabile familiare di cui gli analisti politici si fidano ma permette al machine learning avanzato di scoprire regolarità sottili che gli strumenti più vecchi perdono. Tavole input–output regionali migliori si traducono in stime più credibili di come si propagano gli shock locali, quali settori sono più critici e come le politiche riverbereranno su occupazione, redditi ed emissioni. Pur dipendendo ancora da buoni dati di addestramento e da più potenza di calcolo rispetto agli approcci tradizionali, la forte performance suggerisce che la scienza dei dati moderna può affilare significativamente le lenti attraverso cui osserviamo lo sviluppo regionale, la resilienza e il cambiamento strutturale.

Citazione: De Pretis, F., Tortoli, D. & Caria, S. Keeping up with the regions: a hybrid machine learning framework for estimating regional input-output tables. Sci Rep 16, 10893 (2026). https://doi.org/10.1038/s41598-026-45382-8

Parole chiave: tavole input-output regionali, reti economiche, machine learning, modelli generativi, sviluppo regionale