Clear Sky Science · he

חיזוי גניבות עירוניות באמצעות טרנספורמר מרחבי-זמני בתמיכה של מודל שפה גדול

2026-03-31 · חזרה לאינדקס

מדוע תושבי העיר אמורים להתעניין

עבור כל מי שחי, עובד או קונה בעיר גדולה, גניבות הן יותר מאשר סטטיסטיקה; הן מעצבות את תחושת הבטיחות שלנו ברחובות, בחנויות ובתחבורה הציבורית. המחקר הזה בוחן את ניו יורק ושואל שאלה מעשית: האם ניתן להשתמש בבינה מלאכותית מודרנית כדי לומר, שעה אחר שעה ורחוב אחר רחוב, היכן סביר ביותר שיתרחשו גניבות, מבלי לשעתק באופן אוטומטי הטיות משטרתיות ישנות? התשובה עשויה לסייע לערים להגן על אנשים ורכוש תוך שימוש זהיר יותר במשאבי משטרה מוגבלים.

Figure 1. זרמי נתונים עירוניים שונים משתלבים ומבליטים היכן מסתכמים סיכוני גניבה בשכונות שונות של ניו יורק.

איפה ומתי הגניבות באמת מתרכזות

החוקרים מתחילים בהצגת האופן הלא שוויוני שבו מתפזרת הגניבה ברחבי ניו יורק. באמצעות רשת דקה שמכסה את העיר הם מגלים כי אזורים קטנים מסוימים רואים מאות פעמים יותר גניבות מאשר אחרים. כ־50% מכל מקרים נמצאים מרוכזים בחלק קטן מהרחובות, במיוחד באזורים מסחריים צפופים כמו מידטאון מנהטן. עונת השנה ושעת היום גם הן חשובות: חודשים חמים, תקופות קניות בחגים ושעות שיא של נסיעות מגדילים את כמות האנשים ברחובות ובחנויות, וכך גם את ההזדמנויות לגניבה. מזג אוויר, תאורה וסוג השכונה מוסיפים מורכבויות נוספות, כאשר לילות בהירים ויבשים באזורי עסקים תוססים בולטים כרגעים בעלי סיכון גבוה במיוחד.

הפיכת חיי העיר לנתונים

כדי ללכוד את התמונה המורכבת הזו הצוות משלב חמש סוגי מידע. הם משתמשים ברשומות משטרתיות מפורטות של גניבות קודמות, באיסופי מוניות לפי שעה כהערכה לתנועת ואיסוף אנשים, במפות של חנויות, דירות, פארקים ותחנות תחבורה, בתמונות לוויין של אורות לילה ובנתוני מזג אוויר ומפקד אוכלוסין בסיסיים. מתוך אלה הם בונים עשרות מדדים: תדירות חזרת הפשיעה בכל תא רשת, כמה צפופים אזורים מסחריים בשעות ערב מוקדמות, כיצד סיכון גניבה בחלק אחד נשפך לשכנים, וכיצד שיעורי פשיעה עולים או יורדים עם שינויים בגשם או בטמפרטורה. הם גם מודדים כמה זמן עבר מאז הגניבה האחרונה בכל מקום — וזה מתברר כאינדיקציה חזקה לשאלה האם עוד גניבה צפויה בקרוב.

Figure 2. מפות עירוניות מרובדות מראות כיצד תנועת אנשים, מקומות ואותות בינה מלאכותית מתמזגים כדי לחדד חיזוי סיכון גניבה רחוב אחר רחוב.

לתת למודל שפה תחושת עיר

שלב מרכזי הוא לבקש ממודל שפה גדול לקרוא תיאורים קצרים ומובנים של כל מקום ורגע: היכן נמצאת החצי־רחוב, אילו סוגי מקומות יש בו, עד כמה אורות הלילה חזקים, כמה נוסעי מוניות זה עתה הגיעו, איך מזג האוויר ומהי תדירות הגניבות במקום בעבר. המודל משיב עם הערכת סיכון גניבה ורמזים סמנטיים נוספים על הדרך שבה פונקציה, צפיפות וזמן מתקשרים זה לזה. התובנות העשירות המבוססות טקסט מומרות לווקטורים מספריים ומסוננות בקפידה כדי שלא יחזרו רק על הנתונים המובנים. התוצאה היא דיוקן רב־ממדי של כל תא רשת המשקף לא רק ספירות גולמיות, אלא גם דפוסים שהמודל השפתי למד ממגוון רחב של טקסטים על ערים ופשיעה.

איך מנוע החיזוי עובד

כל התכונות האלה מוזנות למודל טרנספורמר מרחבי־זמני, סוג של רשת עצבית שמיועדת לעקוב אחר דפוסים גם במרחב וגם בזמן. המודל קודם מביא סוגי תכונות שונים לאותה מסגרת, ואז מיישם מנגנוני תשומת לב שלומדים אילו רחובות סמוכים ואילו שעות אחרונות חשובים ביותר לכל חיזוי. הוא גם משתמש בציון הסיכון שמספק מודל השפה כאמונת תחילית ומעדכן אותה בעדינות באמצעות הנתונים הנצפים, כך שאף צד לא ישתלט לגמרי. מאומן על כמה שנות נתוני ניו יורק, המערכת חוזה, עבור כל תא רשת ובכל שעה, את הסיכוי שמתרחשת לפחות גניבה אחת. במבחנים היא מגיעה לרמת הפרדה גבוהה בין מצבי גניבה ולא־גניבה ולציוני F1 המצביעים על איזון חזק בין איתור מוקדי אמת לבין הימנעות מאזהרות שווא.

מה משמעות הדבר לבטיחות היומיומית

למשתמש שאינו מומחה, המסקנה היא שסיכון הגניבה אינו אקראי; הוא קשור באופן הדוק לאופן שבו אנשים נעים בעיר, לאופן בו אזורים שונים מנוצלים ולאירועים האחרונים שהתרחשו. על ידי שילוב סטטיסטיקות פשיעה קלאסיות עם אותות כמעט־חי כמו זרימות מוניות ואורות לילה, בתוספת כוח הפרשנות של מודל שפה, הגישה הזו יכולה לסמן חלק קטן של רחובות ושעות שבהם מתרחשת חלק גדול מהגניבות בעיר. בעוד שהשיטה עדיין צריכה נבחון בערים אחרות ובהצלבות זהירות של הוגנות, היא מצביעה על כלים שעשויים לסייע למשטרה ומתכנני ערים להתמקד באזורים ספציפיים, עמוסים ובעלי סיכון גבוה בזמנים מסוימים, במקום לפזר רשת רחבה על פני שכונות שלמות.

ציטוט: Tang, M., Wang, J., Bu, X. et al. Urban theft prediction via LLM-empowered spatiotemporal transformer. Sci Rep 16, 15525 (2026). https://doi.org/10.1038/s41598-026-45681-0

מילות מפתח: חיזוי פשיעה עירונית, מוקדי גניבה, מנשוב מרחבי-זמני, זרימת אוכלוסייה דינמית, מודלים לשוניים גדולים