Clear Sky Science · ar

نمذجة واسعة النطاق لتنبؤ حالة المساكن باستخدام خوارزميات تعلم الآلة

· العودة إلى الفهرس

لماذا تهم حالة منازلنا

يمكن أن يؤثر كون المنزل آمناً وجافاً ومريحاً على كل شيء، من صحة الطفل إلى الاستقرار المالي للأسرة. ومع أننا نتابع أسعار المنازل حتى مستوى الشوارع الفردية، نادراً ما تتوفر صورة مفصلة مماثلة عن جودة المساكن نفسها. تتناول هذه الدراسة تلك اللوحة العمياء عبر استخدام تقنيات حاسوبية حديثة لتقدير حالة ما يقرب من كل وحدة سكنية في الولايات المتحدة، وإنشاء خرائط توضح أين تزدهر المنازل وأين قد تعرض السكان للمخاطر.

Figure 1
الشكل 1.

من أسعار المنازل إلى جودة السكن

لطالما نمذج الباحثون قيمة المنازل، لكن ما هو معروف عن مدى قدرة هذه المنازل على أن تكون صالحة للعيش أقل بكثير. تقدم الاستطلاعات الوطنية الحالية لقطات عامة فقط، غالباً على مستوى الولايات أو المناطق الحضرية بأكملها، وتركز العديد من مجموعات بيانات الحكومة على القدرة على تحمل التكاليف أو الاكتظاظ بدلاً من الحالة المادية للمباني. ونظراً لأن الوكالات المحلية تجمع وتصنف المساكن بطرق مختلفة، لم تكن هناك رؤية موحدة ومفصلة لحالة المساكن عبر البلاد. تجعل هذه الفجوة من الصعب على المخططين والمسؤولين الصحيين والمجتمعات رؤية أماكن تجمع المساكن منخفضة الجودة التي قد تزيد من مخاطر العفن أو التسريبات أو درجات الحرارة الداخلية القصوى أو الهياكل غير الآمنة.

إدخال البيانات الضخمة إلى الحي

لسد هذه الفجوة، جمع المؤلفون مصدرين رئيسيين للبيانات. الأول هو قاعدة بيانات عقارية على المستوى الوطني تحتوي على أكثر من 111 مليون وحدة سكنية، مع تفاصيل مثل عدد غرف النوم والحمامات، سنة البناء والتجديد، مواد السقف والواجهات، نظام التدفئة، مواقف السيارات، الضرائب، وعند توفرها، تصنيف مكوّن من ستة مستويات لحالة المبنى من «غير صالح» إلى «ممتاز». المصدر الثاني هو بيانات مكتب التعداد الأمريكي والبيانات المتعلقة بالأحياء، التي تصف مستويات الدخل المحلية وقيم المساكن وحصة مالكي المنازل والمنازل المتنقلة وكثافة السكان ومستويات الفقر وما إذا كانت المنطقة أكثر حضرية أو ريفية. من خلال مطابقة كل عقار مكانياً مع مقاطعة التعداد أو مجموعة البلوكات المحيطة به، أنشأ الفريق سجلًا موحدًا يربط خصائص المباني بالسياق الاجتماعي والاقتصادي المحيط بكل منزل.

تعليم الآلات للتعرف على صحة المساكن

حوالي نصف العقارات في قاعدة البيانات كانت تفتقد تصنيف حالة رسمي. درب الباحثون ثلاثة نماذج متقدمة لتعلم الآلة — CatBoost وLightGBM وXGBoost — على المنازل التي كانت لديها تصنيفات، طالبين من الخوارزميات أن تتعلم كيف ترتبط تراكيب ميزات العقار والحي بحالة السكن. قاموا بتنظيف البيانات بعناية، وتعاملوا مع القيم المتطرفة والمفقودة، واستخدموا عنقوداً حاسوبياً عالي الأداء — مزودًا بوحدات معالجة رسومية قوية — للبحث بكفاءة عن أفضل إعدادات النماذج. ولتجنب النماذج التي «تحفظ» بيانات التدريب، استخدموا مقياس الدقة المتوازنة والتحقق المتبادل، ثم ضبطوا النموذج الفائز بشكل إضافي بحيث تتطابق احتمالاته المقدرة مع النتائج الواقعية بأكبر قدر ممكن.

Figure 2
الشكل 2.

تحويل التنبؤات إلى خرائط مفيدة

بمجرد اختيار النموذج الأفضل أداءً (CatBoost)، استخدم لتوقع تصنيفات الحالة للملايين من المنازل التي تفتقر للمعلومات. تُرجمت فئة كل منزل إلى نتيجة رقمية من واحد (الأسوأ) إلى ستة (الأفضل). لحماية الخصوصية وتسهيل رؤية الأنماط، قام الباحثون بعد ذلك بتجميع هذه الدرجات عبر ثلاثة أنواع من المناطق: مقاطعات التعداد، ومناطق تجميع رموز ZIP، وشبكة منتظمة من السداسيات تبلغ مساحتها نحو 36 كيلومتراً مربعاً تغطي البلاد بأكملها. النتيجة هي مجموعة خرائط وطنية تكشف عن مشهد واسع لجودة المساكن مع احتفاظها بتفاصيل كافية لتوجيه التحليل المحلي. كما تحقق الفريق من أداء النموذج باستخدام اختبارات إحصائية متعددة، ووجد توافقًا معتدلاً لكن ذا مغزى بالنظر إلى حجم وتعقيد المهمة.

ما الذي يدفع إلى منازل أفضل أو أسوأ

من خلال فحص المدخلات الأهم للنموذج، تقدم الدراسة دلائل حول ما يؤثر في حالة المساكن. سيطرت ميزات مستوى العقار: مقدار الضريبة المقدرة، والتغطية الخارجية، ونوع السقف، ونظام التدفئة، وعمر المنزل وسجل تجديده كانت مؤثرة بشكل خاص. لعبت عوامل الحي مثل معدلات الفقر وكثافة السكان وحصة المنازل المتنقلة دورًا أصغر لكنه مهم. تتوافق هذه النتائج مع أبحاث أوسع تُظهر أن الأسر ذات الدخل الأقل والمستأجرين والمجتمعات الملونة أكثر عرضة للعيش في مساكن منخفضة الجودة، وهو ما يتشكل جزئيًا بسياسات إقراض غير متساوية وتطبيق متباين لحماية السكن.

أداة جديدة لمساكن أكثر أمانًا وعدلاً

ببساطة، تستخدم هذه العمل أنماطًا في السجلات الموجودة لملء القطع المفقودة من صورة وطنية لجودة السكن. توفر الخرائط ومجموعات البيانات المتاحة للجمهور الناتجة وسيلة جديدة فعالة للمخططين والوكالات الصحية والمجموعات المجتمعية لرؤية أين قد تعرض المنازل السكان للمخاطر وأين قد تحقق الاستثمارات أعظم الفوائد. وبينما لا يوجد نموذج مثالي، خصوصًا عند العمل ببيانات أساسية غير متساوية، يمثل هذا النهج واسع النطاق خطوة مهمة نحو فهم — وفي النهاية تحسين — البيئات اليومية التي يعتبرها الناس منازلهم.

الاستشهاد: Kim, K., Holmes, T., Powell, E. et al. Large-scale modeling for housing condition prediction using machine learning algorithms. Sci Data 13, 647 (2026). https://doi.org/10.1038/s41597-026-07012-w

الكلمات المفتاحية: جودة المساكن, تعلم الآلة, البيانات المكانية, الصحة العامة, التخطيط الحضري