Clear Sky Science · he

אופטימיזציה של צעדי התערבות במחלות זיהומיות באמצעות למידת חיזוקים עם נתוני מגפת COVID-19 בבריטניה

· חזרה לאינדקס

כלים חכמים להחלטות בריאות קשות

כאשר מחלה חדשה מתקיימת במדינה, מנהיגים צריכים במהירות להחליט עד כמה להגביל את החיים היומיומיים. לסגור הכול יכול להציל חיים אך להשחית את הכלכלה; לפעול באיטיות עלול להעמיס על בתי החולים. מאמר זה בודק האם צורת בינה מלאכותית הנקראת למידת חיזוקים יכולה לסייע לממשלות למצוא תגובות חכמות ומאוזנות יותר באמצעות סימולציות מפורטות של האופן שבו וירוס כמו COVID‑19 מתפשט בקהילות אמיתיות.

סימולציה של מדינה במחשב

במקום להשתמש במשוואות פשוטות המטפלות באנשים כאחידים, החוקרים מתבססים על Covasim, מודל מחשב עשיר שעוקב אחרי אלפי יחידים וירטואליים בחייהם, בעבודה, בלימודים ובאינטראקציות. לכל אדם מדומה יש גיל, מיקום במשפחה, רשתות בית‑ספר ומקום עבודה, ומצב בריאות שיכול להשתנות מבריא לנגוע, להחלים או למות. בהתאמת הגדרות המודל בקפדנות, הקבוצה גורמת לבריטניה הווירטואלית זו להתנהג כמו הבריטניה האמיתית בגל הראשון של COVID‑19, בהתאמה לנתונים הרשמיים של מקרי מחלה ותמותה מתחילת 2020. שלב הכייל חשוב מאוד, כי כל אסטרטגיה שהמחשב ילמד צריכה לעבוד בעולם הדומה לשלו שלנו, לא ביקום צעצוע.

Figure 1
Figure 1.

ללמד יועץ דיגיטלי לפעול

לאחר שהמודל מתנהג כמו המציאות, החוקרים משלבים למידת חיזוקים — ענף של בינה מלאכותית שבו סוכנת תוכנה מנסה שוב ושוב החלטות ומקבלת תגמול או עונש לפי התוצאות. כאן יכולה הסוכנת לכוונן שלושה מנופים עיקריים בכל שבוע סימולציה: חומרת הסגרים החלקיים, היקף הבדיקות וכמה אגרסיבית היא איתור המגעים. מערכת התגמול מתוכננת ללכוד שני מטרות מתחרות: שמירה על שיעורי הדבקה, מחלות קשות ותמותה נמוכים, תוך הגבלת הנזק הכלכלי הנגרם מסגירת מקומות עבודה ובידוד אנשים. בהרצת אלפי סימולציות של מגיפה, הסוכנת מגלת אילו שילובים ולוחות זמנים של צעדים זוכים לציון הכולל הגבוה ביותר.

מציאת איזון טוב יותר מאשר חוקים קבועים

המחקר משווה כמה שיטות למידה ודרכים לתאר את בחירות הסוכנת. שיטה המתייחסת לפעולות כהגדרות דיאלי חלקיות, במקום לתפריט קטן של אפשרויות קבועות, מתפקדת במיוחד היטב. היא לומדת להגיב במהירות כשהוירוס מתחיל להתפשט, בהטלת הגבלות קצרות אך חזקות יחד עם בדיקות ואיתור מגעים אינטנסיביים. כאשר ההתפרצות המדומה נכנסת לשליטה, היא מרפה סגרים אך שומרת על חלק מהבדיקות והאיתור, ואז מהדקת שוב באופן קצר במקרה שמאיימת עלייה בזיהומים. דפוס גמיש זה משאיר את מספר ההדבקות הכולל במודל בכ‑300,000 בערך, הרבה מתחת למה שקרה תחת המדיניות הממשית שננקטה בבריטניה בתקופה זו, וכמו כן מתחת לכלל פשוט של "שבעה ימים פתוחים, שבעה ימים סגורים". ההפסדים הכלכליים במודל מצטמצמים ביותר משני שלישים בהשוואה לאסטרטגיית הלוקדאון הקפדנית והמתחלפת ההיא.

Figure 2
Figure 2.

תזמון הוא גורם מכריע

המחברים גם בוחנים כיצד אסטרטגיות שונות אלה משפיעות על מספר השכפול בזמן אמת, מדד למספר ההדבקות החדשות שכל מקרה יוצר. בסימולציות שלהם, המדיניות שתוכננה על ידי ה‑AI דוחפת את המספר הזה מתחת לערך הקריטי של אחד כחודש מוקדם יותר מאשר התגובה הממשית של בריטניה. שינוי קטן לכאורה זה מקטין באופן דרמטי את סך ההדבקות המצטברות, ומדגיש כמה השפעה יכולה להיות לפעולה מוקדמת ומתוכננת היטב. הם בוחנים נוסף את המדיניות הנלמדת בהקשר שונה מאוד, באמצעות נתונים מהגל הגדול של COVID‑19 בהונג קונג ב‑2022, ומוצאים שהאסטרטגיה עדיין מתפקדת היטב, מה שמרמז שהכללים הנלמדים לוכדים עקרונות כלליים במקום להתאים יתר על המידה למדינה אחת.

מה זה אומר עבור התפרצויות עתידיות

עבור לא‑מומחים, המסר המרכזי הוא שלא צריך לבחור בעיוורון בין הצלת חיים והצלת פרנסה. על‑ידי שילוב סימולציות מפורטות של אופן תנועת הוירוס ברשתות חברתיות אמיתיות עם בינה מלאכותית שלומדת מניסיון וטעייה, ניתן לספק למקבלי החלטות מפת דרכים מונעת נתונים שמתאימה את עצמה כשהתנאים משתנים. המחברים מדגישים שכלים כאלה אינם מיועדים להחליף שיפוט אנושי, אלא לשמש כסיוע החלטה עוצמתי, החוקר אינספור תסריטי 'מה אם' הרבה יותר מהר מאשר בני אדם. כאשר יופיעו מגפות חדשות, גישה זו עשויה לסייע למנהיגים לפעול מוקדם ומדויק יותר, באמצעות בדיקות ממוקדות, איתור ומצרים חלקיים כדי לשמור על המחלה תחת שליטה תוך שימור כמה שיותר מהחיים הנורמליים והפעילות הכלכלית האפשרית.

ציטוט: Zhang, B., Chen, Y., Li, H. et al. Optimization of infectious disease intervention measures using reinforcement learning with UK COVID-19 epidemic data. Sci Rep 16, 10627 (2026). https://doi.org/10.1038/s41598-026-39377-8

מילות מפתח: מדיניות COVID-19, למידת חיזוקים, סימולציית מגיפה, התערבויות שאינן תרופתיות, אסטרטגיה לבריאות הציבור