Clear Sky Science · tr
Makine öğrenimi algoritmaları kullanarak konut durumu tahmini için büyük ölçekli modelleme
Evlerimizin Durumunun Neden Önemli Olduğu
Bir evin güvenli, kuru ve konforlu olup olmaması, bir çocuğun sağlığından bir ailenin mali istikrarına kadar pek çok şeyi etkileyebilir. Oysa ev fiyatlarını sokak bazında takip ederken, konut kalitesinin kendisine aynı ayrıntıda sahip olmak nadirdir. Bu çalışma, modern bilgisayar tekniklerini kullanarak Amerika Birleşik Devletleri’ndeki neredeyse her konut biriminin durumunu tahmin ederek, evlerin hangi bölgelerde iyi durumda olduğunu ve nerelerde sakinleri risk altında bırakabileceğini gösteren haritalar oluşturarak bu kör noktayı ele alıyor.

Ev Fiyatlarından Konut Kalitesine
Araştırmacılar uzun zamandır evlerin ne kadar değerli olduğunu modelledi, ancak bu evlerin ne kadar yaşanabilir olduğu hakkında çok daha az şey biliniyor. Mevcut ulusal anketler genellikle yalnızca eyaletler veya metropol alanlar düzeyinde kaba kesitler sunar ve birçok devlet veri seti binaların fiziksel durumu yerine erişilebilirlik veya kalabalıklık üzerine odaklanır. Yerel kurumlar konutları farklı şekillerde topladığı ve derecelendirdiği için ülke genelinde birleşik, ayrıntılı bir konut durumu görünümü hiç oluşmadı. Bu boşluk, planlamacıların, sağlık yetkililerinin ve toplulukların küf, sızıntılar, aşırı iç mekân sıcaklıkları veya güvensiz yapılar gibi risklerin nerelerde yoğunlaştığını görmesini zorlaştırıyor.
Mahalleye Büyük Veriyi Getirmek
Bu boşluğu doldurmak için yazarlar iki büyük veri kaynağını birleştirdi. Birincisi, yatak odası ve banyo sayısı, inşa ve yenileme yılı, çatı ve dış cephe malzemeleri, ısıtma sistemi, otopark, vergiler ve mevcut olduğunda “güvensiz”den “mükemmel”e kadar altı seviyeli bir bina durumu derecelendirmesi gibi ayrıntıları içeren 111 milyondan fazla konut birimini kapsayan ülke çapında bir gayrimenkul veritabanı. İkinci kaynak ise yerel gelir düzeyleri, konut değerleri, mülk sahibi ve seyyar ev payı, nüfus yoğunluğu, yoksulluk ve bir alanın daha kentsel mi yoksa kırsal mı olduğunu tanımlayan ABD Sayımı ve ilgili mahalle verileri. Her bir mülkü çevresindeki sayım bölgesi veya blok grubuna mekansal olarak eşleyerek ekip, bina özelliklerini her evin çevresindeki sosyal ve ekonomik bağlamla ilişkilendiren birleşik bir kayıt oluşturdu.
Makinelere Konut Sağlığını Tanımayı Öğretmek
Veritabanındaki mülklerin yaklaşık yarısında resmi bir durum derecelendirmesi yoktu. Araştırmacılar, puanlı olan evler üzerinde CatBoost, LightGBM ve XGBoost olmak üzere üç gelişmiş makine öğrenimi modelini eğiterek algoritmalardan mülk ve mahalle özelliklerinin kombinasyonlarının konut durumu ile nasıl ilişkili olduğunu öğrenmelerini istedi. Verileri dikkatle temizlediler, aykırı değerler ve eksik verilerle ilgilendiler ve en iyi model ayarlarını verimli şekilde aramak için güçlü grafik işlemcilere sahip yüksek performanslı bir hesaplama kümesi kullandılar. Modellerin yalnızca eğitim verilerini “ezberlemesini” önlemek için dengelenmiş doğruluk ve çapraz doğrulama kullanıldı ve ardından kazanan modelin tahmini olasılıkları gerçek dünya sonuçlarıyla olabildiğince eşleşecek şekilde daha da ince ayarlandı.

Tahminleri Faydalı Haritalara Dönüştürmek
En iyi performans gösteren model (CatBoost) seçildikten sonra, eksik bilgiye sahip milyonlarca konut için durum derecelendirmelerini tahmin etmek üzere kullanıldı. Her evin kategorisi en kötüden (bir) en iyiye (altı) kadar sayısal bir puana dönüştürüldü. Mahremiyeti korumak ve desenleri görmek daha kolay hale getirmek için araştırmacılar bu puanları üç tür alan üzerinden ortaladı: sayım bölgeleri, posta kodu alanları ve ülke çapını kaplayan yaklaşık 36 kilometrekarelik düzenli altıgen ızgaradan oluşan bir ağ. Sonuç, yerel analizlere rehberlik edebilecek kadar ayrıntılı kalırken konut kalitesinin geniş manzaralarını ortaya koyan ulusal haritalar seti oldu. Ekip ayrıca modelin performansını bir dizi istatistiksel testle kontrol etti ve görevin boyutu ve karmaşıklığı göz önüne alındığında orta düzeyde ama anlamlı bir uyum buldu.
Daha İyi veya Daha Kötü Evleri Neler Belirliyor
Model için en önemli girdileri inceleyerek çalışma, konut durumunu neyin belirlediğine dair ipuçları sunuyor. Mülk düzeyindeki özellikler baskındı: tahmini vergi miktarı, dış kaplama, çatı tipi, ısıtma sistemi ve bir evin yaş ve yenileme geçmişi özellikle etkiliydi. Yoksulluk oranları, nüfus yoğunluğu ve seyyar ev payı gibi mahalle faktörleri daha küçük ama yine de önemli bir rol oynadı. Bu bulgular, daha düşük gelirli hanelerin, kiracıların ve renkli toplulukların standart altı konutlarda yaşama olasılığının daha yüksek olduğunu gösteren ve kısmen eşitsiz kredi uygulamaları ile konut korumalarının düzensiz uygulanmasıyla şekillenen daha geniş araştırmalarla uyumlu.
Daha Güvenli, Daha Adil Konut İçin Yeni Bir Araç
Basitçe söylemek gerekirse, bu çalışma mevcut kayıtlardaki desenleri kullanarak ulusal bir konut kalite yapbozunun eksik parçalarını dolduruyor. Ortaya çıkan halka açık haritalar ve veri setleri, planlamacılara, sağlık ajanslarına ve topluluk gruplarına, evlerin sakinleri risk altında bırakıyor olabileceği yerleri ve yatırımların en büyük getiriyi sağlayabileceği alanları görmeleri için güçlü yeni bir yol sunuyor. Temel veriler düzensiz olduğunda hiçbir modelin mükemmel olmadığı doğru olsa da, bu büyük ölçekli yaklaşım insanların ev dediği günlük ortamları anlamaya—ve nihayetinde iyileştirmeye—doğru atılmış önemli bir adımı temsil ediyor.
Atıf: Kim, K., Holmes, T., Powell, E. et al. Large-scale modeling for housing condition prediction using machine learning algorithms. Sci Data 13, 647 (2026). https://doi.org/10.1038/s41597-026-07012-w
Anahtar kelimeler: konut kalitesi, makine öğrenimi, mekansal veri, kamu sağlığı, kentsel planlama