Clear Sky Science · ru
Оценка жилой сегрегации на основе многоканальных данных и метода случайного леса: тематическое исследование Нанкина
Почему место проживания по‑прежнему важно
В городах люди с разными доходами часто оказываются расселёнными по отдельным районам. Эта незаметная сортировка формирует всё — от качества школ до доступа к паркам и рабочим местам. Но отслеживать, как меняется такая жилищная разобщённость с течением времени, непросто: обычно для этого требуются редкие и дорогие переписи населения. В этом исследовании рассматривается Нанкин, крупный китайский город, и показано, как современные цифровые карты и данные о жилье можно объединить, чтобы получить более оперативную и гибкую картину того, кто где живёт и насколько город смешан или разделён.

От домохозяйств к жилым комплексам
Традиционные исследования сегрегации опираются на данные переписи, которые учитывают, сколько состоятельных и менее состоятельных людей живёт в каждом районе, а затем вычисляют индексы разделения и разнообразия. Но переписи проводятся редко и в быстро меняющихся городах быстро устаревают. Некоторые учёные обходятся заменителями дохода — ценами на жильё, исходя из предположения, что более дорогие квартиры обычно занимают более состоятельные жители. Другие комбинируют цены с спутниковыми изображениями и точками интереса — школами, магазинами, парками. Эти подходы помогают, но часто упускают важный нюанс: не каждая площадь земли населена одинаково. Пустующий промышленный участок на карте может выглядеть так же «бедно», как густонаселённый малообеспеченный квартал, хотя почти никто там не живёт.
Видеть районы через призму жилых комплексов
В китайских городах большинство горожан проживает в чётко ограниченных жилых комплексах — группах многоквартирных домов с общими воротами, садами и сервисами. Внутри комплекса жители, как правило, имеют сходные доходы и образ жизни, потому что качество зданий, их возраст и окружение «фильтруют» тех, кто может или хочет там жить. В этом исследовании каждый комплекс рассматривается как базовая единица анализа. Авторы утверждают, что если надёжно классифицировать комплексы на элитные, средние и низкобюджетные, то можно с высокой долей вероятности оценить уровни доходов их жителей без доступа к детальным персональным данным.
Преобразование больших данных в карту города
Чтобы классифицировать комплексы, исследователи собрали пять видов информации: официальные карты и границы, записи о сделках с жильём, цифровые контуры комплексов из онлайн‑карт, спутниковые оценки озеленённости и тысячи точек, отмечающих сервисы — супермаркеты, парки, остановки наземного транспорта. Для каждого комплекса они измерили шесть ключевых характеристик: среднюю цену продажи, возраст зданий, тип конструкции, степень озеленённости, доступность автобусов и метро и плотность повседневных сервисов. Метод машинного обучения под названием случайный лес выявляет закономерности в этих признаках и распределяет более 4400 комплексов по категориям: элитные, среднего уровня и низкобюджетные.
Измерение того, кто где живёт
Дальше команда оценивает численность жителей каждого комплекса, исходя из числа жилищных единиц и типичных уровней вакансий, которые различаются по типу комплекса. Так, в элитных домах обычно больше пустующих квартир, чем в старых низкобюджетных блоках в центре. После этого они картируют население элитных, средних и низкобюджетных комплексов на двух масштабах: районы и более мелкие подрайоны. На их основе рассчитываются три стандартных индикатора: индекс несходства, показывающий, насколько резко разделены состоятельные и менее состоятельные группы; коэффициент локального размещения, выявляющий, где необычно сконцентрированы богатые или бедные жители; и индекс разнообразия, фиксирующий, насколько равномерно различные доходные группы сосуществуют в одних и тех же зонах.

Что выявляют шаблоны в Нанкине
Результаты показывают, что в целом в основной городской зоне Нанкина уровень разделения по доходу умеренный. Однако некоторые районы выделяются. Цзянье, активно реконструируемый район, имеет много новых элитных комплексов и сравнительно мало низкобюджетных, что приводит к высокой концентрации состоятельных жителей и высоким показателям сегрегации. Цинхуаи, напротив, содержит много старых низкобюджетных комплексов и мало люксовых застроек, поэтому там концентрируются менее обеспеченные жители. Другие районы, такие как Гулоу и Цися, демонстрируют более смешанные картины, где старое и новое жильё соседствует. На более мелком уровне подрайонов некоторые места оказываются очень смешанными, а другие доминируются одной доходной группой. Эти закономерности подтверждаются независимыми проверками по данным переписи и арендным ценам, что указывает на то, что метод фиксирует реальные социальные разломы.
Почему этот новый взгляд важен
Для неспециалистов главный вывод таков: теперь можно отслеживать жилищную сегрегацию без ожидания очередной переписи. Используя жилые комплексы как «контейнеры» социальных групп и комбинируя многоканальные данные с алгоритмом обучения, авторы предлагают практичный обходной путь: они могут оценить, где живут разные доходные группы, насколько они разобщены и как это варьируется по городу. Их тематическое исследование Нанкина показывает, что подход точен и применим на практике. По мере того как всё больше городов оставляют цифровые следы — спутниковые снимки, онлайн‑карты, объявления о недвижимости — этот метод даёт планировщикам и политикам новый инструмент для мониторинга неравенства, целенаправленных инвестиций и проверки, способствуют ли проекты обновления городского пространства сближению людей или, наоборот, их дальнейшему отталкиванию.
Цитирование: Zhang, Y., Sun, Y., Zhu, AX. et al. Residential segregation assessment based on multi-source data and random forest method: a case study of Nanjing. Humanit Soc Sci Commun 13, 482 (2026). https://doi.org/10.1057/s41599-026-06840-w
Ключевые слова: городская сегрегация, жилые комплексы, Нанкин, геопространственные данные, неравенство в жилищном секторе