Clear Sky Science · he
חשיפת המגוון של PAM עבור Cas9 דרך כריית מטאגנומיקה ולמידת מכונה
למה זה חשוב לעריכת גנים בעתיד
CRISPR הפך לסמל של עריכת גנים מודרנית, אך כלל שקט אחד עדיין מגביל את מה שהוא יכול לעשות: כל חתיכה בדנ"א חייבת לשבת לצידה של רצף קצר של "רשיון". דפוסים קצרים אלה, הנקראים PAMים, קובעים היכן האנזים הפופולרי Cas9 יכול לעבוד והיכן לא. המחקר הזה מראה כיצד שיטוט דרך כמויות עצומות של דנ"א מיקרוביאלי, בשילוב עם למידת מכונה מתקדמת, יכול לחשוף מגוון חבוי גדול של רשיונות כאלה. המפה החדשה הזו עשויה לפתוח הרבה יותר מקומות בגנום האנושי לטיפולים מדויקים ובטוחים יותר.
חוקים נסתרים שמנחים את חתיכות ה-CRISPR
Cas9 ואנזימים קרובים הם חלק ממערכת חיסון טבעית הנמצאת בחיידקים ובארכאה. כדי לא לקטוע את הדנ"א שלהם עצמם, המיקרואורגניזמים האלה גורמים לחלבוני Cas לחפש PAM — קטע קצר מאוד של אותיות — ליד אתר המטרה. רק כאשר PAM נמצא יוכל Cas9 לפרום את סליל הדנ"א ולהרשות ל-RNA המנחה לבדוק התאמה, מה שמפעיל חיתוך אם הכל תואם. הבעיה עבור הרפואה היא שכלי מעבדה נפוצים, כמו ה-Cas9 הסטנדרטי מ-Streptococcus pyogenes, מזהים רק דגמי PAM צרים. אם מוטציה הגורמת למחלה חסרה את הרצף המתאים בסמוך, הכלים של היום פשוט לא יכולים להגיע אליה ללא פגיעה בדיוק.

כריית העולם המיקרובריאלי לאופציות חדשות
המחברים יצאו למיפוי שיטתי של האופן שבו חלבוני Cas9 שונים מזהים PAMים שונים בטבע. הם טחנו יותר מ-3.8 מיליון גנומים של חיידקים וארכאה, ומעל 7.4 מיליון רצפי וירוסים ופלאסמידים שתוקפים או נעים בין מיקרובים. על-ידי זיהוי מערכי CRISPR, קישורם לגני Cas9 סמוכים, ואז התאמת ה"זיכרון" של הספייסרים נגד הווירוסים והפלאסמידים התוקפים, הם יכלו לראות אילו דפוסי דנ"א קצרים נטו להקיף מטרות אמיתיות. מכך בנו את CRISPR-PAMdb, קטלוג ציבורי המכיל 8003 קבוצות Cas9, כל אחת מלווה בפרופיל PAM קונצנזוס, ומאורגן על עץ אבולוציוני המדגיש כיצד אנזימי Cas9 קרובים נוטים לשתף העדפות PAM דומות בעוד שהם עדיין מראים גיוון מרשים בכללותו.
כשנתונים אזלים, תנו למודל ללמוד
אפילו עם הסקר העצום הזה, לרוב חלבוני Cas9 שמצאו לא היו מספיק מטרות ויראליות תואמות כדי לקרוא את ה-PAM ישירות. כדי למלא את החורים, הצוות בנה מודל למידת מכונה בשם CICERO. CICERO משתמש ב"מודל שפה" חזק לחלבונים שלמד דפוסים כלליים של רצפי חומצות אמינו ומכוון אותו לחיזוי, עבור כל חלבון Cas9 נתון, עד כמה סביר שכל אות דנ"א תופיע בכל אחד מעשרת המיקומים ב-PAM. המודל אומן על פרופילי ה-PAM מתוך CRISPR-PAMdb ונבחן הן באמצעות תיקוף צולב והן על 79 אנזימי Cas9 שה-PAM שלהם נמדדו בניסויים, והשיג התאמה חזקה בין החיזוי לבין המציאות.

לדעת עד כמה בטוחים
תכונה מרכזית של CICERO היא שהיא לא רק מנחשת PAM — היא גם מעריכה עד כמה כל ניחוש אמין. לאחר שלימד את עצמה לחזות דפוסי PAM, החוקרים אומנו רשת שנייה וקלה של משקל שלוקחת את אותו רצף Cas9 ולומדת לחזות עד כמה מדויק יהיה החיזוי של ה-PAM. ציון ביטחון גבוה תאם בחוזקה לדיוק גבוה במציאות. באמצעות מסנן הביטחון הזה, הצוות הרחיב את אנוטציות ה-PAM ליותר מ-50,000 חלבוני Cas9 נוספים, עם למעלה מ-17,000 חיזויים שסווגו כבעלי ביטחון גבוה. זה מרחיב משמעותית את התפריט של וריאנטים של Cas9 עם כללי מיקוד מובנים היטב למדי.
מה זה אומר לטיפול במחלות גנטיות
כדי להראות מדוע המשאבים החדשים האלה חשובים, המחברים בחנו עשרות אלפי מוטציות בודדות מקושרות למחלות ממאגר ClinVar שניתן, מבחינה עקרונית, לתקן בעזרת עורכי בסיסים — כלים שמשנים אות דנ"א אחת ללא חיתוך שתי הגדילים. הם מצאו כי האנזים Cas9 הסטנדרטי יכול לגשת רק לכחצי מהאתרים הללו בגלל דרישות ה-PAM הקפדניות שלו. כאשר אפשרו קרובי Cas9 מ-CRISPR-PAMdb וחיזויי CICERO בעלי ביטחון גבוה שמכירים סט רחב יותר אך עדיין ספציפי של רצפים סמוכים, כמעט כל המוטציות הללו הפכו תיאורטית לנגישות ללא ויתור על דיוק.
ארגז כלים גדול יותר לניתוח דנ"א מדויק
במלים פשוטות, עבודה זו בונה שני דברים: מפה ציבורית עצומה שמקשרת אלפים של חלבוני Cas9 טבעיים לדפוסי הדנ"א הקצרים שהם מעדיפים, ומדריך בינה מלאכותית שיכול לחזות העדפות אלה לעוד אנזימים רבים פשוט מתוך רצפיהם. יחד, הם הופכים את העולם המיקרוביאלי לספריית חלקים עשירה עבור עורכי גנים עתידיים. ככל שחוקרים ימקדו ויבחנו וריאנטים אלה של Cas9 במעבדה, קלינאים עשויים לזכות בכלים בטוחים וגמישים יותר שיכולים להגיע למוטציות הגורמות למחלות שהיו מחוץ להישג יד עד כה, ובכך לקרב את הניתוח הגנטי המדויק צעד נוסף אל המציאות.
ציטוט: Fang, T., Bogensperger, L., Feer, L. et al. Uncovering Cas9 PAM diversity through metagenomic mining and machine learning. Nat Commun 17, 2510 (2026). https://doi.org/10.1038/s41467-026-69098-5
מילות מפתח: CRISPR-Cas9, מגוון PAM, מטאגנומיקה, למידת מכונה, עריכת גנום