Clear Sky Science · ja

マルチモーダル大規模言語モデル、ストリートビュー画像、都市政策インテリジェンス:レッドライニングの持続可能性への影響を取り戻す

· 一覧に戻る

なぜ都市の通りと古い地図が今でも重要なのか

多くの都市は貧困削減や熱からの保護を進めようとしていますが、どのブロックで最も支援が必要かという最新の詳細な情報が不足しがちです。本研究は、現代の人工知能が日常的な街路写真を読み取り、特にアリゾナ州フェニックスでレッドライニングの歴史に起因する地域で、低所得と低い樹木被覆がどこにまだ集積しているかを明らかにできることを示します。

Figure 1. AIが都市の街路写真を読み取り、レッドライニングの影響を受けたフェニックスの地域で貧困と低い樹木被覆がどこに重なって残っているかを地図化する。
Figure 1. AIが都市の街路写真を読み取り、レッドライニングの影響を受けたフェニックスの地域で貧困と低い樹木被覆がどこに重なって残っているかを地図化する。

昔の住宅格付けと今日の不均一な街並み

1930年代、連邦の住宅地図は一部の地域を住宅ローンの「危険」地域として指定しました。これがレッドライニングと呼ばれるプロセスです。こうした地域は、より多くの有色人種居住者や古い住宅を抱えることが多く、数十年にわたり公的・民間の投資が少なかった。米国で最も暑い大都市であるフェニックスでは、その歴史が今なお影響を及ぼしています。資金や樹木が少ない地域はより危険な熱や劣悪な生活環境にさらされるからです。著者らは、地域の健全性を示す二つの単純な柱──住民の貧困率と日陰を提供する樹木被覆の量──に着目しています。

街路写真を地域の評価票に変える

研究者らは1000を超える小規模地域から約2万枚のGoogleストリートビュー画像を収集しました。次に、これらの画像を「読み取る」ための二種類の手法を構築しました。一つはマルチモーダル大規模言語モデルであるGPT-4oで、場面全体を見渡して住宅の質、目に見える手入れ状態、緑地などの手がかりについて自然言語で推論し、その推論を貧困と樹木被覆の数値スコアに変換します。もう一方は標準的なコンピュータビジョンモデルで、個々のピクセルを道路、建物、樹木などのカテゴリに分類し、それぞれの占有割合を数えます。各地域について、多数の画像から得られた結果を平均化し、これらのAIベースの指標を米国国勢調査の貧困データやGoogleのEnvironmental Insights Explorerの樹木被覆データと比較しました。

AIを公式数値とレッドライニングの遺産に照らして検証する

続いて研究チームは、AIの推定値がレッドライニングの持続的影響に関する公式統計と同じ物語を語るかどうかを検証しました。地域特性や市のサービス差、近隣地域間の影響を考慮した複数の統計モデルを用い、歴史的にレッドライニングされた地域を二つの参照群と比較しました。参照群は、高所得の「理想的」地域と、危険地域としては指定されなかった「安定または衰退」地域です。ほぼ全てのモデルで、両方のAI手法はおなじみのパターンを再現しました:レッドライニングを受けた地域は比較地域よりも貧困率が高く、樹木被覆が低いのです。重要なのは、GPT-4oの推定する格差が公式データとほぼ一致したのに対し、ピクセルカウント型モデルは貧困とレッドライニングの結びつきを過小評価する傾向があったことです。

なぜ全体的な街の理解がより有効なのか

その理由を探るため、著者らは各手法が公式の貧困率や樹木被覆の変動をどれだけ説明できるかを調べました。GPT-4o単独で、豊富な人口統計や教育統計と同程度の貧困パターンを捉え、セグメンテーションモデルよりもはるかに多くの説明力を示しました。その優位性は、政策上最も重要となることが多い、最も不利な地域や最も樹木が豊かな地域で特に強く現れました。これは、貧困が単に樹木の数のような個別の物体だけでなく、維持管理、建物の形態、インフラの放置といったより広い手がかりにも痕跡を残すことを示唆します。GPT-4oは場面全体を考慮できるため、単純なピクセル数では見落としがちな微妙な信号を拾える一方で、樹木被覆のようにカウントが重要な領域でも良好に機能します。

Figure 2. 街路写真を色分けマップに変換して貧困と樹木被覆の差異を明らかにする、2種類のAI手法の並列比較。
Figure 2. 街路写真を色分けマップに変換して貧困と樹木被覆の差異を明らかにする、2種類のAI手法の並列比較。

より公正で緑豊かな都市のための新しい手法

研究は、マルチモーダル大規模言語モデルに対する慎重に設計されたプロンプトが、一般的な街路画像を時宜にかなった近隣スケールの貧困と樹木の陰影の指標に変換し、信頼できる情報源と密接に一致させられると結論づけています。このアプローチは各都市ごとに新しいモデルの再学習を必要とせず、適切な検証を伴えば非専門家でも実行できるため、計画担当者、行政機関、地域団体が社会的・環境的なギャップの重なりを把握し、地域プログラムの効果を追跡し、ニーズの変化に応じて資源配分を見直すための実用的な手段を提供します。常に監督のために人間を関与させることも可能です。

引用: Howell, A., Wu, N., Bagchi-Sen, S. et al. Multimodal large language models, street view images and urban policy-intelligence: recovering the sustainability effects of redlining. npj Urban Sustain 6, 79 (2026). https://doi.org/10.1038/s42949-026-00380-7

キーワード: 都市の持続可能性, レッドライニング, ストリートビュー画像, マルチモーダルAI, 樹木被覆