Clear Sky Science · de

Vorhersage von städtischen Diebstählen mittels LLM-gestütztem raumzeitlichen Transformer

· Zurück zur Übersicht

Warum Stadtbewohner das interessieren sollte

Für alle, die in einer Großstadt leben, arbeiten oder einkaufen, ist Diebstahl mehr als eine Statistik; er beeinflusst, wie sicher wir uns auf Straßen, in Geschäften und in öffentlichen Verkehrsmitteln fühlen. Diese Studie betrachtet New York City und stellt eine praktische Frage: Lassen sich moderne Verfahren der künstlichen Intelligenz nutzen, um stunden- und blockgenau vorherzusagen, wo Diebstähle am wahrscheinlichsten eintreten, ohne einfach frühere polizeiliche Verzerrungen zu reproduzieren? Die Antwort könnte Städten helfen, Menschen und Eigentum besser zu schützen und begrenzte Polizeiresourcen gezielter einzusetzen.

Figure 1. Verschiedene städtische Datenströme werden kombiniert, um zu zeigen, wo sich das Diebstahlsrisiko in New Yorker Vierteln konzentriert.
Figure 1. Verschiedene städtische Datenströme werden kombiniert, um zu zeigen, wo sich das Diebstahlsrisiko in New Yorker Vierteln konzentriert.

Wo und wann Diebstahl sich wirklich ballt

Die Forschenden beginnen damit, die ungleichmäßige Verteilung von Diebstählen in New York aufzuzeigen. Mit einem feinen Raster über der Stadt stellen sie fest, dass manche kleine Bereiche hunderte Male mehr Diebstähle verzeichnen als andere. Etwa die Hälfte aller Diebstähle konzentriert sich auf einen winzigen Bruchteil der Stadtblöcke, vor allem in dichten Geschäftsbereichen wie Midtown Manhattan. Jahreszeit und Tageszeit spielen ebenfalls eine Rolle: wärmere Monate, Feiertagsshopping und starke Pendlerzeiten bringen mehr Menschen auf die Straßen und in die Läden und erhöhen so die Gelegenheiten für Diebstahl. Wetter, Beleuchtung und Nachbarschaftstyp wirken zusätzlich, wobei klare, trockene Nächte in pulsierenden Geschäftsvierteln besonders risikoreich hervorstechen.

Städtisches Leben in Daten verwandeln

Um dieses komplexe Bild einzufangen, kombiniert das Team fünf Arten von Informationen. Sie verwenden detaillierte Polizeiberichte über frühere Diebstähle, stündliche Taxi‑Abholungen und -Absetzungen als Proxy für Mobilität und Ansammlungen, Karten von Läden, Wohnungen, Parks und Verkehrsknotenpunkten, Satellitenbilder der Nachtbeleuchtung sowie grundlegende Wetter‑ und Volkszählungsdaten. Daraus erstellen sie Dutzende Indikatoren: wie häufig Verbrechen in jedem Rasterfeld auftreten, wie voll Geschäftsbereiche am frühen Abend werden, wie sich das Diebstahlrisiko eines Blocks auf Nachbarblöcke ausweitet und wie Kriminalitätsraten mit Änderungen von Niederschlag oder Temperatur steigen oder fallen. Sie messen auch, wie lange es seit dem letzten Diebstahl an einem Ort her ist, was sich als starker Hinweis darauf erweist, ob bald ein weiterer folgen könnte.

Figure 2. Mehrschichtige Stadtkarten veranschaulichen, wie Bewegung, Orte und KI‑Signale verschmelzen, um Block für Block genauere Diebstahlsrisikovorhersagen zu ermöglichen.
Figure 2. Mehrschichtige Stadtkarten veranschaulichen, wie Bewegung, Orte und KI‑Signale verschmelzen, um Block für Block genauere Diebstahlsrisikovorhersagen zu ermöglichen.

Dem Sprachmodell ein Stadtgefühl geben

Ein zentraler Schritt besteht darin, ein großes Sprachmodell kurze, strukturierte Beschreibungen jedes Ortes und Zeitpunkts lesen zu lassen: wo sich der Block befindet, welche Arten von Einrichtungen er enthält, wie hell die Nachtbeleuchtung ist, wie viele Taxipassagiere gerade angekommen sind, wie das Wetter ist und wie häufig dort zuvor Diebstähle vorkamen. Das Modell antwortet dann mit einer geschätzten Diebstahlswahrscheinlichkeit und weiteren semantischen Hinweisen darauf, wie Funktion, Menschenansammlungen und Zeit zusammenwirken. Diese reichen, textbasierten Einsichten werden in numerische Vektoren umgewandelt und sorgfältig gefiltert, damit sie die strukturierten Daten nicht einfach duplizieren. Das Ergebnis ist ein hochdimensionales Porträt jedes Rasterfeldes, das nicht nur rohe Zählwerte widerspiegelt, sondern auch Muster, die das Sprachmodell aus einer Vielzahl von Texten über Städte und Kriminalität gelernt hat.

Wie die Vorhersage‑Engine funktioniert

All diese Merkmale fließen in ein raumzeitliches Transformer‑Modell, eine Art neuronales Netzwerk, das darauf ausgelegt ist, Muster über Raum und Zeit hinweg zu erfassen. Das Modell bringt zunächst verschiedene Merkmalstypen auf dieselbe Grundlage und wendet dann Attention‑Mechanismen an, die lernen, welche benachbarten Blöcke und welche vergangenen Stunden für jede Vorhersage am wichtigsten sind. Es verwendet außerdem die Risikobewertung des Sprachmodells als Vorannahme und passt diese behutsam mit den beobachteten Daten an, sodass keine Seite dominiert. Trainiert an mehreren Jahren New Yorker Daten sagt das System für jedes Rasterfeld und jede Stunde die Wahrscheinlichkeit voraus, dass mindestens ein Diebstahl eintritt. In Tests erreicht es ein hohes Maß an Unterscheidungsfähigkeit zwischen Diebstahl‑ und Nicht‑Diebstahl‑Situationen und einen F1‑Wert, der eine starke Balance zwischen dem Erkennen echter Hotspots und dem Vermeiden von Fehlalarmen widerspiegelt.

Was das für die tägliche Sicherheit bedeutet

Für Nichtfachleute ist die Schlussfolgerung, dass Diebstahlsrisiko nicht zufällig ist; es hängt eng damit zusammen, wie Menschen sich durch die Stadt bewegen, wie verschiedene Bereiche genutzt werden und wie sich jüngste Ereignisse entwickelt haben. Durch die Verbindung klassischer Kriminalstatistiken mit quasi‑Live‑Signalen wie Taxiströmen und Nachtbeleuchtung sowie der interpretativen Kraft eines Sprachmodells kann dieser Ansatz einen kleinen Anteil von Blöcken und Stunden herausfiltern, in denen ein großer Teil der städtischen Diebstähle tatsächlich stattfindet. Obwohl die Methode noch in anderen Städten getestet und sorgfältig auf Fairness geprüft werden muss, deutet sie auf Werkzeuge hin, die Polizei und Stadtplaner dabei unterstützen könnten, sich auf konkrete, zu bestimmten Zeiten frequentierte Hochrisikozonen zu konzentrieren, anstatt großflächig ganze Viertel zu überwachen.

Zitation: Tang, M., Wang, J., Bu, X. et al. Urban theft prediction via LLM-empowered spatiotemporal transformer. Sci Rep 16, 15525 (2026). https://doi.org/10.1038/s41598-026-45681-0

Schlüsselwörter: Vorhersage städtischer Kriminalität, Diebstahl‑Hotspots, raumzeitliche Modellierung, dynamischer Bevölkerungsfluss, große Sprachmodelle