Clear Sky Science · ru

Прогнозирование краж в городе с помощью пространственно-временного трансформера на базе больших языковых моделей

2026-03-31 · Назад к списку

Почему это важно жителям города

Для тех, кто живёт, работает или делает покупки в большом городе, кражи — это не просто статистика; они формируют ощущение безопасности на улицах, в магазинах и в общественном транспорте. В этом исследовании рассматривается Нью-Йорк и формулируется практический вопрос: можно ли с помощью современных методов искусственного интеллекта предсказывать, почасово и по кварталам, где наиболее вероятны кражи, не воспроизводя при этом старые полицейские предубеждения? Ответ может помочь городам лучше защищать людей и имущество, одновременно экономя ограниченные ресурсы полиции.

Figure 1. Различные потоки городских данных объединяются, чтобы выделить, где риск краж сосредоточен по районам Нью-Йорка.

Где и когда кражи действительно концентрируются

Исследователи начинают с демонстрации того, насколько неравномерно распределены кражи по Нью-Йорку. Накладывая на город тонкую сетку, они обнаруживают, что в некоторых небольших участках число краж в сотни раз превышает другие. Примерно половина всех случаев краж сосредоточена в крошечной доле городских кварталов, особенно в плотных коммерческих зонах, таких как Мидтаун Манхэттена. Время года и время суток также имеют значение: тёплые месяцы, периоды праздничных покупок и часы интенсивных поездок на работу привлекают больше людей на улицы и в магазины, создавая больше возможностей для краж. Погода, освещение и тип района вносят дополнительные нюансы: ясные, сухие ночи в оживлённых деловых районах особенно выделяются как рискованные моменты.

Преобразование городской жизни в данные

Чтобы зафиксировать эту сложную картину, команда объединяет пять типов информации. Они используют подробные полицейские записи о прошлых кражах, почасовые данные о посадках и высадках такси как индикатор движения и скопления людей, карты магазинов, жилых домов, парков и станций транспорта, спутниковые снимки ночного освещения и базовые погодные и переписные данные. Из этого строят десятки показателей: как часто преступления повторяются в каждой ячейке сетки, насколько многолюдны коммерческие зоны в ранний вечер, как риск кражи в одном квартале переходит на соседние, и как уровень преступности растёт или падает при изменении осадков или температуры. Они также измеряют, сколько времени прошло с момента последней кражи в каждом месте — этот показатель оказывается сильным индикатором вероятности следующей кражи в ближайшее время.

Figure 2. Многоуровневые городские карты показывают, как движение людей, места и сигналы ИИ сливаются, уточняя прогнозы риска краж по кварталам.

Дав возможность языковой модели «почувствовать» город

Ключевой шаг — попросить большую языковую модель прочитать короткие структурированные описания каждого места и момента: где расположен квартал, какие типы заведений в нём есть, насколько ярко светят ночные огни, сколько пассажиров такси только что прибыло, какая погода и как часто там происходили кражи ранее. Модель затем выдает оценку риска кражи и другие семантические подсказки о том, как функции, наплыв людей и время взаимодействуют. Эти насыщенные текстовые наблюдения преобразуются в числовые векторы и тщательно фильтруются, чтобы не просто дублировать структурированные данные. В результате получается высокоразмерный портрет каждой ячейки сетки, отражающий не только сырые подсчёты, но и закономерности, которые модель извлекла из широкого массива текстов о городах и преступности.

Как работает механизм прогнозирования

Все эти признаки поступают в пространственно-временной трансформер — тип нейронной сети, предназначенный для отслеживания закономерностей в пространстве и времени. Модель сначала приводит разные типы признаков к единому формату, затем применяет механизмы внимания, которые учатся определять, какие соседние кварталы и какие недавние часы наиболее важны для каждого прогноза. Она также использует оценку риска от языковой модели как априорное предположение и аккуратно корректирует её на основе наблюдаемых данных, чтобы ни одна сторона не доминировала. Обученная на нескольких годах данных Нью-Йорка, система предсказывает для каждой ячейки сетки и каждого часа вероятность того, что произойдёт хотя бы одна кража. В тестах она демонстрирует высокий уровень различения между ситуациями с кражой и без кражи и F1-метрику, отражающую хорошее равновесие между обнаружением реальных очагов и минимизацией ложных срабатываний.

Что это значит для повседневной безопасности

Для неспециалиста вывод таков: риск краж не случаен; он тесно связан с тем, как люди перемещаются по городу, как используются разные районы и как развивались недавние события. Смешивая классическую криминальную статистику с «приближёнными к реальному времени» сигналами, такими как потоки такси и ночное освещение, а также с интерпретативной мощью языковой модели, этот подход может выделять небольшую долю кварталов и часов, где сосредоточена большая часть городских краж. Хотя метод требует дополнительных испытаний в других городах и тщательных проверок на справедливость, он указывает на инструменты, которые могли бы помочь полиции и городским планировщикам сосредоточиться на конкретных оживлённых, высокорискованных зонах в конкретное время, вместо того чтобы распылять усилия по целым районам.

Цитирование: Tang, M., Wang, J., Bu, X. et al. Urban theft prediction via LLM-empowered spatiotemporal transformer. Sci Rep 16, 15525 (2026). https://doi.org/10.1038/s41598-026-45681-0

Ключевые слова: прогнозирование городских преступлений, очаги краж, пространственно-временное моделирование, динамика потока населения, большие языковые модели