Clear Sky Science · he

טיעון תיאורטי-מידעתי להגבלת האלפבית הביולוגי הנוכחי ל-4 נוקלאוטידים ו-20 חומצות אמינו

· חזרה לאינדקס

מדוע האלפבית הקטן של החיים חשוב

כל החיים על פני כדור הארץ כותבים את "הטקסטים" הגנטיים והחלבוניים שלהם באמצעות אלפביתים מפתיעים בצורתם הקטנה: רק ארבע אותות כימיות ל-DNA ול-RNA, ועשרים לחלבונים. כימאים יכולים לדמיין יחידות בניין רבות נוספות, אז מדוע הביולוגיה נצמדת לקבוצות המוגבלות האלה? מאמר זה טוען שהתשובה טמונה בקלות שבה מולקולות אלה מתקפלות לצורות שימושיות וביעילות שבה האבולוציה יכולה לחפש בכל הרצפים האפשריים. על ידי חיבור רעיונות מפיזיקה ותורת המידע, המחברים מראים שהאלפביתים המוכרים של החיים הם גדולים מספיק כדי שמולקולות יתממשו בקיפול מהימן ועדיין יהיו ניתנות לאבולוציה.

ממחרוזות מסובכות לצורות מועילות

חלבונים ו-RNA מתחילים כשרשרות גמישות שמתנדנדות דרך אינספור צורות אפשריות. רק חלק זעיר מהצורות האלה יציב ותפקודי. כדי שהחיים יעבדו, שרשרת חייבת למצוא במהירות את הצורה המתקפלת הנכונה בלי לבדוק כל אפשרות באקראי. המחברים מסתכלים בעדשת תורת המידע: כאשר שרשרת מתקפלת, היא "מרוויחה מידע" על ידי בחירת צורת הברירת מחדל מתוך הרבה חלופות. רווח זה ניתן למדידה כמה טווח הצורות האפשריות מצטמצם לכל מצב לאורך השרשרת. הם משווים זאת עם המידע שנרכש כאשר האבולוציה מסננת רצפים אקראיים אל אלה שמתקפלים בפועל, ומראים ששני התהליכים האלה צריכים להיות מאוזנים כדי שהקיפול יהיה מהיר ומהימן.

Figure 1
Figure 1.

התאמת אותיות דיגיטליות לתנועות פיזיות

התובנה המרכזית היא קשר מתמטי פשוט בין שלושה דברים: גודל האלפבית הכימי, כמה צורות יכולה כל מיקום בשרשרת לא מקופלת לאמץ, וכמה יחידות בניין שונות מופיעות בפועל באותו מיקום במולקולות מפותחות. עבור פולימר שמתקפל למבנה מוגדר היטב, התיאוריה חוזה שמספר הצורות הלא מקופלות הנגישות לכל מיקום והגיוון היעיל של האותיות המיושמות שם יהיו שניהם בערך שווים לשורש הריבועי של גודל האלפבית הכולל. כאשר המחברים מיישמים מדידות ממחקרים על חלבונים ו-RNA אמיתיים, הם מוצאים שמספר ממוצע של צורות לא מקופלות לכל מיקום והגיוון היעיל של האותיות שם מצייתים לניבוי הזה, עבור שני סוגי הביופולימרים.

מדוע ארבעה נוקלאוטידים וכ-עשרים חומצות אמינו

בעבור ה-RNA, מחקרים ניסיוניים על גמישות עמוד השדרה ושימוש בזיווג בסיסים מצביעים על כך שלכל נוקלאוטיד יש בערך שני וחצי צורות לא מקופלות רלוונטיות. בריבוע של ערך זה מתקבל גודל אלפבית הקרוב מאוד לארבע — בדיוק מה שהחיים משתמשים בו. עבור חלבונים, הערכות של חופש התשתית והוריאציה ברצף מרמזות על כארבע עד חמש צורות יעילות ואותיות יעילות לכל מיקום, מה שמצביע על אלפבית אופטימלי בטווח של בערך עשרים או כמה עשרות חומצות אמינו. העובדה שבביולוגיה המודרנית משתמשים בעשרים חומצות אמינו מבחינה כימית מובחנות מתיישבת בנוחות בקצה התחתון של טווח זה, ובהתאם למגבלות מעשיות נוספות כגון כמה מורכבת יכולה להיות המכונה העושה חלבונים וכמה סוגי שרשראות צדדיות ניתן לשמר מובחנים באופן אמין.

רמזים לחלבונים שברירי-הראשית של החיים

המחברים הופכים אחר כך את המסגרת הזו לחלון על האבולוציה המוקדמת. הם משלבים את הנוסחאות שלהם עם שחזורים קודמים של מתי נכנסו חומצות אמינו שונות לקוד הגנטי. בשלבים הראשוניים ביותר נראה שהאלפבית היה קטן מדי כדי לתמוך בחלבונים יציבים ומתוקפים היטב בכלל. במקום זאת, התיאוריה חוזה שרשראות שנשארו גמישות ומסולסלות מאוד, אך עדיין יכלו להצטבר לטיפות או לרשתות רופפות החשובות למבנים פרימיטיביים דמויי-תא חסרי ממברנה. כשהתווספו עוד חומצות אמינו, האלפבית חצה סף שבו חלבונים מתקפלים הפכו אפשריים, תחילה מיטיבים עם שרשרות מהותית בלתי מסודרות אך פונקציונליות, ורק מאוחר יותר אפשרו מבנים תלת־ממדיים מוגדרים היטב וקטליזטורים יעילים.

Figure 2
Figure 2.

מה משמעות הדבר עבור גבולות החיים

במונחים יומיומיים, המחקר מציע שיש נקודת איזון בין מעט מדי אותות כימיים, מה שמקשה על קידוד צורות ספציפיות, ורב מדי אותות, מה שמאט בצורה בלתי נסבלת את החיפוש אחרי מולקולות שימושיות. ארבעת הנוקלאוטידים ועשרים חומצות האמינו של כדור הארץ נמצאים קרוב מאוד לנקודת האיזון הזו, בהתחשב עד כמה השרשרות האלה גמישות במים. מתחת לגודל אלפבית זה, האבולוציה הייתה נאבקת למצוא מולקולות מתקפלות היטב; מעליו הוספת אותיות מביאה תועלת מועטה כי מבנה יציב אחד כבר ניתן לקידוד. במבט זה, האלפביתים של החיים אינם אקראיים: הם פתרונות קרובים למינימליים שמאפשרים למולקולות עשירות מידע להתקפל במהירות ולהתפתח ביעילות.

ציטוט: Galpern, E.A., Ferreiro, D.U. & Sánchez, I.E. An information-theoretic argument for the restriction of the current biological alphabets to 4 nucleotides and 20 amino acids. Sci Rep 16, 10751 (2026). https://doi.org/10.1038/s41598-026-46009-8

מילות מפתח: קוד גנטי, קיפול חלבונים, מבנה RNA, אבולוציה מולקולרית, אלפבטים של ביופולימרים