Clear Sky Science · nl

Bijblijven met de regio's: een hybride machine learning-kader voor het schatten van regionale input–outputtabellen

2026-03-27 · Terug naar het overzicht

Waarom regionale economieën ertoe doen

Wanneer een fabriek sluit, een nieuw ziekenhuis opent of een haven wordt uitgebreid, strekken de effecten zich veel verder uit dan de directe werkplek. Economen gebruiken gedetailleerde "input–output"-tabellen om na te gaan hoe geld en banen tussen sectoren zoals landbouw, industrie en diensten stromen. Voor de meeste regio's binnen landen zijn deze tabellen echter zo kostbaar en data-intensief om op te stellen dat ze zelden, zo niet nooit, worden bijgewerkt. Dit artikel presenteert een nieuwe manier om die regionale economische kaarten te schatten met moderne machine learning, wat snellere en nauwkeurigere hulpmiddelen belooft voor planners, analisten en iedereen die wil weten hoe lokale economieën met elkaar verbonden zijn.

De puzzel van het in kaart brengen van lokale economische verbindingen

Input–outputtabellen beschrijven wie wat van wie koopt in een economie: hoeveel staal autofabrikanten afnemen, hoeveel juridische diensten producenten gebruiken, enzovoort. Nationale tabellen bestaan voor veel landen, maar lokale versies—voor staten, provincies of stadsregio's—ontbreken vaak omdat ze grote, dure enquêtes vereisen. Om dit te omzeilen, beginnen economen doorgaans met de nationale tabel en herschikken die met eenvoudige wiskundige recepten zodat deze overeenkomt met bekende regionale totalen, zoals werkgelegenheid of productie per sector. Populaire snelkoppelingen, met namen als location quotients en RAS, zijn goedkoop en snel maar kunnen cruciale patronen vertekenen, vooral de neiging van industrieën om veel van zichzelf en van enkele sleutelpartners te betrekken. Deze vertekeningen kunnen leiden tot misleidende beslissingen op het gebied van infrastructuur, klimaatbeleid of voorbereiding op schokken.

Oude economie combineren met nieuwe algoritmen

De auteurs stellen een hybride kader voor dat klassieke economische structuren verbindt met state-of-the-art kunstmatige intelligentie. Centraal staat een type generatief model dat een GAN wordt genoemd, algemeen gebruikt om realistische beelden te creëren. Hier leert de GAN, in plaats van plaatjes, hele input–outputtabellen te genereren die lijken op die in historische data. Een speciale interne laag dwingt elke gegenereerde tabel om harde boekhoudregels te respecteren: rij- en kolomtotaal moeten overeenkomen met bekende regionale cijfers en waarden mogen niet negatief zijn. Dit houdt het machine learning-model verankerd in basisprincipes van economie in plaats van het puur statistische patronen na te laten jagen.

De ruwe schets verfijnen

Zelfs een goed getrainde GAN maakt vaak kleine, systematische fouten—bijvoorbeeld het iets te laag inschatten hoe sterk bepaalde sectoren met zichzelf handelen. Om dit te herstellen voegen de auteurs een tweede fase toe die bekend staat als residual boosting. Nadat de GAN zijn beste inschatting heeft geproduceerd, leert een aparte ensemble van beslissingboommodellen de typische fouten die het maakt en voorspelt een correctie. De gecorrigeerde tabel wordt vervolgens voorzichtig aangepast om onrealistische waarden te vermijden. Dit tweestapsontwerp benut het vermogen van de GAN om het grote geheel vast te leggen—zoals de algemene vorm en concentratie van stromen—terwijl de booster de lokale details verscherpt. De methode houdt ook rekening met het feit dat echte economieën enkele zeer grote stromen en veel kleine stromen hebben, een scheve verdeling die het model expliciet wordt aangemoedigd na te bootsen.

De methode op de proef stellen

Om te onderzoeken of deze hybride aanpak in de praktijk werkt, testen de auteurs haar op twee grote datasets: een verzameling nationale tabellen uit veel landen en een set wereldwijde input–outputtabellen die wereldwijde toeleveringsketens over tientallen industrieën en regio's beschrijven. Omdat de werkelijke tabellen in deze gevallen bekend zijn, kunnen de onderzoekers hun schattingen direct vergelijken met de realiteit en met verbeterde versies van de traditionele RAS-methode. Over een breed scala aan maatstaven—algemene fit, gemiddelde fouten, hoe goed de hoofddiagonaal wordt gereproduceerd en hoe nauwgezet de ongelijkmatige spreiding van grote en kleine stromen behouden blijft—komt de hybride methode als beste uit de bus. In de nationale dataset verbetert zij de standaard goodness-of-fit maatstaf met bijna negen procentpunten ten opzichte van verbeterde RAS, en verdubbelt ze ruim de nauwkeurigheid waarmee zelfgebruik binnen sectoren wordt vastgelegd. Op de mondiale tabellen bereikt zij nog nauwere overeenstemming en reproduceert bijna perfect de onderliggende structuur.

Wat dit betekent voor beslissingen in de praktijk

Voor niet-specialisten is de kernboodschap dat we nu veel betrouwbaardere beelden van regionale economieën kunnen bouwen zonder enquêteurs huis-aan-huis te sturen. Het hybride model behoudt de vertrouwde boekhoudlogica waarop beleidsanalisten vertrouwen maar laat geavanceerde machine learning subtiele regelmatigheden ontdekken die oudere hulpmiddelen missen. Betere regionale input–outputtabellen vertalen zich in geloofwaardigere schattingen van hoe lokale schokken zich verspreiden, welke sectoren het meest kritiek zijn en hoe beleid doorwerkt in banen, inkomens en emissies. Hoewel de methode nog steeds afhankelijk is van goede trainingsdata en meer rekenkracht vereist dan traditionele benaderingen, suggereert de sterke prestatie dat moderne datawetenschap de lens kan aanscherpen waarmee we regionale ontwikkeling, veerkracht en structurele verandering bekijken.

Bronvermelding: De Pretis, F., Tortoli, D. & Caria, S. Keeping up with the regions: a hybrid machine learning framework for estimating regional input-output tables. Sci Rep 16, 10893 (2026). https://doi.org/10.1038/s41598-026-45382-8

Trefwoorden: regionale input–outputtabellen, economische netwerken, machine learning, generatieve modellen, regionale ontwikkeling