Clear Sky Science · he
דגמי שפה גדולים מולטימודליים, תמונות מבט-רחוב ומדעי מדיניות עירונית: לשחזר את השפעות האדום-קו (redlining) על קיימות
מדוע רחובות העיר ומפות ישנות עדיין חשובים היום
ערים רבות מנסות לצמצם עוני ולהגן על תושבים מפני חום, אך לעתים קרובות חסר להן מידע עדכני חטיבה-אחרי-חטיבה על המקומות שבהם העזרה נדרשת ביותר. מחקר זה מדגים כיצד בינה מלאכותית מודרנית יכולה לקרוא תמונות רחוב שגרתיות כדי לגלות היכן עוני נמוך וכיסוי עצים דליל עדיין מצטלבים יחד, במיוחד בשכונות שנעצבו על ידי הפרקטיקה ההיסטורית של redlining בפיניקס, אריזונה.

דירוגי הדיור הישנים ורחובות לא שווים של היום
במהלך שנות ה-30 של המאה ה-20, מפות דיור פדרליות סווגו חלק מהשכונות כ"מסוכנות" לקבלת הלוואות לדיור, תהליך שמוכר כ-redlining. מקומות אלה, שלרוב כללו יותר תושבים ממיעוטים ובתי מגורים ישנים יותר, קיבלו פחות השקעה ציבורית ופרטית לאורך עשורים. בפיניקס, העיר הגדולה החמה ביותר בארצות הברית, ההיסטוריה הזו עדיין משמעותית כי אזורים עם פחות משאבים ופחות עצים ניצבים בפני חום מסוכן ותנאי מחיה נחותים. הכותבים מתמקדים בשני מדדים פשוטים של בריאות שכונה: כמה תושבים חיים בעוני וכמה כיסוי צמרת עצים מספק צל.
הפיכת תמונות רחוב לכרטיסי דירוג שכונה
החוקרים אספו כמעט עשרים אלף תמונות מ-Google Street View ברחמ מכמה אלפים של שטחים שכונתיים קטנים. לאחר מכן הם בנו שני סוגי כלים ל"קריאת" תמונות אלה. כלי אחד משתמש בדגם שפה גדול מולטימודלי, GPT-4o, שבוחן את הסצנה כולה ומסיק בשפה תיאורית רמזים כגון איכות הדיור, תחזוקה נראית ונוכחות צמחייה, ורושם את ההסקות האלה לציונים מספריים של עוני וכיסוי עצים. הכלי השני הוא מודל ראייה ממוחשבת סטנדרטי שמסווג פיקסלים בודדים לקטגוריות כמו כביש, מבנה או עץ ואז סופר כמה מכל קטגוריה קיימת. עבור כל שכונה, הצוות חישב ממוצעים מתוצאות של תמונות רבות והשווה את המדדים שמקורם בבינה מלאכותית לנתונים הרשמיים של המפקד האמריקאי על עוני ולמפת כיסוי העצים של Google Environmental Insights Explorer.
בדיקת הבינה המלאכותית מול מספרים רשמיים ומורשת ה-redlining
בהמשך הצוות בדק האם ההערכות של הבינה המלאכותית משקפות את הסיפור שאומרות הסטטיסטיקות הרשמיות לגבי ההשפעות המתמשכות של ה-redlining. באמצעות מספר סוגי מודלים סטטיסטיים המתחשבים בתכונות מקומיות, בהבדלים בשירותי העיר ובהשפעות בין שכונות סמוכות, הם השוו אזורים שסומנו כ-redlined היסטורית לשתי קבוצות השוואה: אזורים "אידיאליים" עם הכנסות גבוהות ו"אזורים יציבים או בירידה" שלא סומנו כמסוכנים. כמעט בכל גרסאות המודל, שתי הגישות של הבינה המלאכותית שיחזרו דפוס מוכר: בשכונות שקיבלו redlining עדיין יש יותר עוני וכיסוי עצים נמוך יותר בהשוואה לאזורים ההשוואתיים. חשוב לציין שהערכת הפערים של GPT-4o הייתה כמעט זהה לנתונים הרשמיים, בעוד שמודל ספירת-הפיקסלים נטה להמעיט בקשר החזק בין עוני ל-redlining.
מדוע הבנת הסצנה הכוללת עובדת טוב יותר
כדי להבין מדוע, המחברים בדקו עד כמה כל שיטה מסבירה שונות בנתוני העוני וכיסוי העצים הרשמיים. GPT-4o לבדו תפס בערך את אותו חלק מדפוס העוני כמו סט עשיר של נתונים דמוגרפיים וחינוכיים, והרבה יותר מהמודל הסגמנטציוני. יתרונו בולט במיוחד בשכונות המוחלשות ביותר או העשירות ביותר בעצים, שם שאלות מדיניות הן לרוב דחופות יותר. זה מצביע על כך שעוני משאיר חותם לא רק באובייקטים מבודדים, כמו מספר העצים, אלא גם ברמזים רחבים יותר כגון תחזוקה, צורת מבנים ושחרור תשתיות. היכולת של GPT-4o לשקול את כל הסצנה מאפשרת לו ללקט אותות עדינים אלה שספירות פיקסלים פשוטות עלולות לפספס, תוך שהוא עדיין מתפקד היטב למדידת כיסוי צמרת עצים, שם ספירת צמרת יש חשיבות רבה.

כלים חדשים לעירונים הוגנים וירוקים יותר
המחקר מסיק כי הנחיות זהירות לתמרון דגמי שפה גדולים מולטימודליים יכולות להפוך תמונות רחוב שגרתיות למדדים שכונתיים עדכניים של עוני וצל עצים התואמים באופן הדוק למקורות מהימנים. מאחר שגישה זו אינה דורשת אימון דגם חדש לכל עיר וניתנת להפעלה על ידי לא-מומחים עם בדיקות מתאימות, היא מציעה דרך מעשית לתכנונאים, סוכנויות וארגוני קהילה למפות היכן פערים חברתיים וסביבתיים מצטלבים, לעקוב האם תוכניות מקומיות עובדות ולהכוון משאבים מחדש כשהצרכים משתנים — הכל תוך שמירה על מעורבות אנושית לפיקוח.
ציטוט: Howell, A., Wu, N., Bagchi-Sen, S. et al. Multimodal large language models, street view images and urban policy-intelligence: recovering the sustainability effects of redlining. npj Urban Sustain 6, 79 (2026). https://doi.org/10.1038/s42949-026-00380-7
מילות מפתח: קיימות עירונית, redlining, תמונות מבט-רחוב, בינה מלאכותית מולטימודלית, כיסוי עצים