Clear Sky Science · ar

نماذج لغوية ضخمة متعددة الوسائط، صور الشوارع والسياسات الحضرية-الاستخباراتية: استعادة آثار الاستبعاد العرقي على الاستدامة

· العودة إلى الفهرس

لماذا لا تزال شوارع المدينة والخرائط القديمة مهمة اليوم

تحاول العديد من المدن الحد من الفقر وحماية الناس من الحر، لكنها غالبًا ما تفتقر إلى معلومات مُحدَّثة على مستوى كل كتلة حول أماكن الحاجة الأكبر للمساعدة. تُظهر هذه الدراسة كيف يمكن للذكاء الاصطناعي الحديث قراءة صور الشوارع العادية لكشف أماكن تجمع الفقر وقلة الأشجار معًا، خاصة في الأحياء المتشكِّلة بفعل الممارسة التاريخية للتأمين الأحمر في فينيكس بولاية أريزونا.

Figure 1. الذكاء الاصطناعي يقرأ صور شوارع المدينة لرسم خرائط المناطق التي لا تزال تتقاطع فيها الفقر والتغطية الشجرية المنخفضة في أحياء فينيكس المتأثرة بالتأمين الأحمر التاريخي.
Figure 1. الذكاء الاصطناعي يقرأ صور شوارع المدينة لرسم خرائط المناطق التي لا تزال تتقاطع فيها الفقر والتغطية الشجرية المنخفضة في أحياء فينيكس المتأثرة بالتأمين الأحمر التاريخي.

تصنيفات الإسكان القديمة وشوارع اليوم غير المتكافئة

في ثلاثينيات القرن العشرين، صنَّفت خرائط الإسكان الفدرالية بعض الأحياء على أنها "خطرة" فيما يتعلق بقروض المنازل، وهي عملية تُعرف باسم التأمين الأحمر. هذه المناطق، التي غالبًا ما كانت تضم المزيد من السكان الملونين ومساكن أقدم، تلقت استثمارات عامة وخاصة أقل لعقود. في فينيكس، أكثر المدن حرارةً في الولايات المتحدة، لا يزال لهذا التاريخ أثر لأن المناطق ذات الموارد الأقل وعدد الأشجار الأقل تواجه حرارة أكثر خطورة وظروف معيشية أسوأ. يركِّز المؤلفون على ركيزتين بسيطتين لصحة الأحياء: عدد السكان الذين يعيشون في فقر ومقدار مظلة الأشجار التي توفر الظل.

تحويل صور الشوارع إلى بطاقات تقرير عن الأحياء

جمع الباحثون ما يقرب من عشرين ألف صورة من صور شارع Google عبر أكثر من ألف حي صغير. ثم بنوا نوعين من الأدوات لـ"قراءة" هذه الصور. تستخدم إحدى الأدوات نموذجًا لغويًا كبيرًا متعدد الوسائط، GPT-4o، الذي ينظر إلى المشهد بأكمله ويستنتج بلغة مبسطة عن دلائل مثل جودة الإسكان، والصيانة المرئية، والمساحات الخضراء قبل تحويل ذلك الاستدلال إلى درجات رقمية للفقر وتغطية الأشجار. الأداة الأخرى هي نموذج رؤية حاسوبية قياسي يصنِّف البكسلات الفردية إلى فئات مثل الطريق أو المبنى أو الشجرة ثم يَحصي مقدار كل فئة موجودة. لكل حي، وسّط الفريق النتائج من العديد من الصور وقارن هذه المقاييس المستندة إلى الذكاء الاصطناعي مع بيانات رسمية من تعداد الولايات المتحدة حول الفقر ومع بيانات من Google’s Environmental Insights Explorer حول مظلة الأشجار.

مقارنة الذكاء الاصطناعي بالأرقام الرسمية وإرث التأمين الأحمر

اختبر الفريق بعد ذلك ما إذا كانت تقديرات الذكاء الاصطناعي تُظهر نفس القصة التي ترويها الإحصاءات الرسمية عن الآثار المستمرة للتأمين الأحمر. باستخدام عدة نماذج إحصائية تأخذ في الحسبان السمات المحلية وفروقات خدمات المدينة والتداخلات بين الأحياء القريبة، قارنوا المناطق التي تعرضت للتأمين الأحمر تاريخيًا بمجموعتين مرجعيتين: مناطق "مثالية" ذات دخول عالية ومناطق "مستقرة أو متراجعة" لم تُصنّف كخطرة. عبر معظم إصدارات النماذج، كرّرت الطريقتان المعتمدتان على الذكاء الاصطناعي نمطًا مألوفًا: لا تزال الأحياء المتأثرة بالتأمين الأحمر تعاني فقرًا أعلى وتغطية أشجار أقل من مناطق المقارنة. والأهم أن تقديرات GPT-4o لحجم هذه الفوارق كانت متطابقة تقريبًا مع البيانات الرسمية، بينما كان نموذج عد البكسلات يميل إلى التقليل من مدى ارتباط الفقر بالتأمين الأحمر.

لماذا يعمل الفهم الشامل للمشهد بشكل أفضل

لفهم السبب، فحص المؤلفون مدى تفسير كل طريقة للتباين في أرقام الفقر والمظلة الرسمية. التقط GPT-4o وحده تقريبًا نفس قدر نمط الفقر مثل مجموعة غنية من الإحصاءات الديموغرافية والتعليمية، وبدرجة أكبر بكثير من نموذج التقسيم. كانت ميزته أقوى بشكل خاص في الأحياء الأكثر تهميشًا أو الأكثر غنى بالأشجار، حيث تكون الأسئلة السياسية غالبًا الأكثر إلحاحًا. ويشير ذلك إلى أن الفقر يترك أثرًا ليس فقط في الأشياء المعزولة، مثل عدد الأشجار، بل أيضًا في دلائل أوسع مثل الصيانة وشكل المباني وتجاهل البنية التحتية. تمكن GPT-4o من التقاط تلك الإشارات الدقيقة بفضل قدرته على النظر إلى المشهد بأكمله، بينما لا تزال أداؤه جيدًا في قياس تغطية الأشجار، حيث يظل عد المظلة ذا أهمية.

Figure 2. عرض جنبًا إلى جنب لطريقتين ذكيتين تحولان صور الشوارع إلى خرائط ألوان تكشف الفروق في الفقر وتغطية الأشجار.
Figure 2. عرض جنبًا إلى جنب لطريقتين ذكيتين تحولان صور الشوارع إلى خرائط ألوان تكشف الفروق في الفقر وتغطية الأشجار.

أدوات جديدة لمدن أكثر عدلاً وخضرة

تخلص الدراسة إلى أن مطاردات مُصممة بعناية لنموذج لغوي كبير متعدد الوسائط يمكن أن تحول صور الشوارع الشائعة إلى مؤشرات آنية على مقياس الحي للفقر وظل الأشجار تتطابق عن كثب مع المصادر الموثوقة. وبما أن هذه الطريقة لا تتطلب تدريب نموذج جديد لكل مدينة ويمكن أن يديرها غير المتخصصين مع إجراءات تحقق مناسبة، فإنها توفر وسيلة عملية للمخططين والوكالات والمجموعات المجتمعية لرسم خرائط أماكن تلاقي الفجوات الاجتماعية والبيئية، ومراقبة ما إذا كانت البرامج المحلية تعمل، وإعادة توجيه الموارد حسب تغيّر الاحتياجات، مع إبقاء البشر في الحلقة للمراقبة والإشراف.

الاستشهاد: Howell, A., Wu, N., Bagchi-Sen, S. et al. Multimodal large language models, street view images and urban policy-intelligence: recovering the sustainability effects of redlining. npj Urban Sustain 6, 79 (2026). https://doi.org/10.1038/s42949-026-00380-7

الكلمات المفتاحية: الاستدامة الحضرية, التأمين الأحمر, صور شوارع, الذكاء الاصطناعي متعدد الوسائط, مظلة الأشجار