Clear Sky Science · nl

Multimodale grote taalmodellen, streetviewbeelden en stedelijk beleidsinzicht: het achterhalen van de duurzaamheidsgevolgen van redlining

· Terug naar het overzicht

Waarom stadsstraten en oude kaarten vandaag nog steeds van belang zijn

Veel steden proberen armoede te verminderen en mensen tegen hitte te beschermen, maar hebben vaak geen actuele, blok-voor-blok informatie over waar hulp het hardst nodig is. Deze studie laat zien hoe moderne kunstmatige intelligentie gewone straatfoto’s kan lezen om te onthullen waar lage inkomens en weinig boomdekking nog steeds samen voorkomen, vooral in buurten die in Phoenix (Arizona) door de historische praktijk van redlining zijn gevormd.

Figure 1. AI leest straatfoto’s van de stad om in kaart te brengen waar armoede en weinig boomdekking nog steeds samen voorkomen in Phoenix-wijken die door redlining zijn gevormd.
Figure 1. AI leest straatfoto’s van de stad om in kaart te brengen waar armoede en weinig boomdekking nog steeds samen voorkomen in Phoenix-wijken die door redlining zijn gevormd.

Oude huisvestingsclassificaties en de ongelijkheid in de huidige straten

In de jaren 1930 labelden federale huisvestingskaarten sommige buurten als “gevaarlijk” voor hypotheken, een proces dat bekendstaat als redlining. Deze gebieden, vaak met meer inwoners van kleur en oudere woningen, kregen decennialang minder publieke en private investeringen. In Phoenix, de heetste grote stad in de Verenigde Staten, blijft die geschiedenis belangrijk omdat gebieden met minder geld en minder bomen te maken hebben met gevaarlijkere hitte en slechtere leefomstandigheden. De auteurs richten zich op twee eenvoudige pijlers van wijkenwelzijn: hoeveel inwoners in armoede leven en hoeveel boomdekking schaduw biedt.

Straatfoto’s omzetten in wijk-rapportcijfers

De onderzoekers verzamelden bijna twintigduizend Google Street View-afbeeldingen verspreid over meer dan duizend kleine buurten. Vervolgens bouwden ze twee soorten tools om deze beelden te “lezen”. De ene tool gebruikt een multimodaal groot taalmodel, GPT-4o, dat naar een hele scène kijkt en in gewone taal redeneert over aanwijzingen zoals woningkwaliteit, zichtbaar onderhoud en groen, en die redenering daarna omzet in numerieke scores voor armoede en boomdekking. De andere tool is een standaard computervisiemodel dat individuele pixels classificeert in categorieën zoals weg, gebouw of boom en vervolgens telt hoeveel van elk aanwezig is. Voor elke buurt middelen de onderzoekers de resultaten van veel beelden en vergeleken ze deze AI-gebaseerde maten met officiële gegevens van de Amerikaanse volkstelling over armoede en met Google’s Environmental Insights Explorer voor boomdekking.

AI toetsen aan officiële cijfers en het nalatenschap van redlining

Het team testte vervolgens of de AI-schattingen hetzelfde verhaal vertelden als de officiële statistieken over de aanhoudende effecten van redlining. Met verschillende statistische modellen die rekening houden met lokale kenmerken, verschillen in stedelijke dienstverlening en overspilling tussen naburige buurten, vergeleken ze historisch geredlinede gebieden met twee referentiegroepen: “ideale” gebieden met hoge inkomens en “stabiele of afnemende” gebieden die niet als gevaarlijk waren gemarkeerd. In bijna alle modelversies reproduceerden beide AI-benaderingen een bekend patroon: geredlinede buurten hebben nog steeds hogere armoede en minder boomdekking dan vergelijkingsgebieden. Cruciaal is dat GPT-4o’s schattingen van deze verschillen vrijwel identiek waren aan de officiële gegevens, terwijl het pixel-tellende model de mate waarin armoede met redlining samenhangt doorgaans onderschatte.

Waarom holistisch straatbegrip beter werkt

Om dit te begrijpen onderzochten de auteurs hoe goed elke methode de variatie in de officiële armoede- en boomdekcijfers verklaarde. GPT-4o alleen ving ongeveer evenveel van het armoedepatroon op als een uitgebreide set demografische en opleidingsstatistieken, en veel meer dan het segmentatiemodel. Het voordeel was vooral sterk in de meest benadeelde of meest boomrijke buurten, waar beleidsvragen vaak het meest urgent zijn. Dit suggereert dat armoede niet alleen sporen nalaat in geïsoleerde objecten, zoals het aantal bomen, maar ook in bredere aanwijzingen zoals onderhoud, gebouwvorm en verwaarlozing van infrastructuur. GPT-4o’s vermogen om de hele scène te overzien stelt het in staat die subtiele signalen op te pikken die eenvoudige pixel-tellingen mogelijk missen, terwijl het toch goed presteert voor boomdekking, waar het tellen van bladerdak het meest relevant is.

Figure 2. Twee naast elkaar geplaatste AI-methoden zetten straatfoto’s om in kleurenkaarten die verschillen in armoede en boomdekking zichtbaar maken.
Figure 2. Twee naast elkaar geplaatste AI-methoden zetten straatfoto’s om in kleurenkaarten die verschillen in armoede en boomdekking zichtbaar maken.

Nieuwe hulpmiddelen voor eerlijkere, groenere steden

De studie concludeert dat zorgvuldig ontworpen prompts voor een multimodaal groot taalmodel veelvoorkomende straatbeelden kunnen omzetten in actuele, buurtschaalindicatoren van armoede en boomschaduw die sterk overeenkomen met betrouwbare bronnen. Omdat deze aanpak niet vereist dat voor elke stad een nieuw model wordt getraind en uitgevoerd kan worden door niet-specialisten met de juiste controles, biedt het een praktische manier voor planners, instanties en gemeenschapsorganisaties om in kaart te brengen waar sociale en milieugaten samenvallen, te volgen of lokale programma’s werken en middelen opnieuw toe te wijzen naarmate behoeften veranderen — terwijl mensen toezicht houden.

Bronvermelding: Howell, A., Wu, N., Bagchi-Sen, S. et al. Multimodal large language models, street view images and urban policy-intelligence: recovering the sustainability effects of redlining. npj Urban Sustain 6, 79 (2026). https://doi.org/10.1038/s42949-026-00380-7

Trefwoorden: stedelijke duurzaamheid, redlining, street view-beelden, multimodale AI, boomdekking