Clear Sky Science · he

לקראת אוטומציה מקצה-לקצה של מחקר בבינה מלאכותית

· חזרה לאינדקס

מדוע מדען-רובוט חשוב

דמיינו חוקר דיגיטלי בלתי עייף שיכול להגות רעיונות, לכתוב קוד, להריץ ניסויים, לצייר גרפים ואף להכין ולבדוק מאמרים מדעיים עם מעט מאוד סיוע אנושי. מאמר זה מתאר מערכת כזו, הנקראת "המדען של הבינה המלאכותית." הוא מראה שבעת הזו בינה מלאכותית מודרנית מסוגלת לטפל כמעט בכל שלב בפרויקט מחקר בלמידת מכונה, מה שמרמז על עתיד שבו תגליות יגיעו מהר יותר — אך גם מעלה שאלות מהותיות לגבי אמון, מקומות עבודה, ובריאותה של המדע עצמו.

Figure 1
Figure 1.

מרעיון לנייר גמור

המדען הבינה-מלאכותי תוכנן לעבור את כל מחזור החיים של מחקר, בדומה לסטודנט לתואר מתקדם. תחילה הוא מציע כיווני מחקר בתחום נבחר של למידת מכונה, מסביר מדוע כל רעיון עשוי להיות מעניין ומשרטט תוכנית לבחינתו. לאחר מכן הוא בודק רעיונות אלה מול מאגרי מחקרים מקוונים כדי להימנע מהעתקה של עבודה קיימת. רק רעיונות שנראים חדשים באמת ממשיכים הלאה. בשלב הבא המערכת כותבת ומעריכה את הקוד הדרוש להרצת ניסויים, מתקנת רבות מבאגים עצמה, ומנהלת "יומן מעבדה" שוטף של מה שניסתה ומה קרה.

שתי דרכים לאפשר למערכת לחקור

החוקרים בנו שתי גרסאות של החוקר הדיגיטלי הזה. במצב ה"מבוסס-תבנית" האנשים מספקים תוכנית התחלתית פשוטה, והמערכת משנה אותה בהדרגה כדי לחקור שאלות קשורות. במצב ה"ללא תבנית" הבינה מתחילה כמעט מאפס: היא ממציאה רעיונות, מתכננת ניסויים וכותבת קוד בעצמה, מונחית רק על-ידי הוראות רחבות כמו נושא של סדנה בכנס. הגרסה הזו, הפתוחה יותר, משתמשת בחיפוש מתפצל דרך מסלולי ניסוי מקבילים רבים, מקדמת את ההצדדים המבטיחים ומקטלת את אלה שמתרסקות או מניבות תוצאות חלשות. יותר כוח חישוב מאפשר לחקור יותר ענפים ונוטה להניב מחקרים סופיים חזקים יותר.

Figure 2
Figure 2.

להכין בינה לפעול כבוחן עמיתים

שיפוט איכות של זרם אינסופי של מאמרים שנכתבו על-ידי בינה מלאכותית הוא אתגר, ולכן הצוות גם בנה מבקר אוטומטי. כלי זה קורא מאמרים מדעיים, מדרג אותם מבחינת תקפות ותרומה, מפרט חוזקות וחולשות, ומנסח המלצה של קבלה או דחייה לפי אותם קווים מנחים כמו בכנס מוביל של למידת מכונה. כשנבדק על אלפי מאמרים אמיתיים עם החלטות ידועות, שיפוטיו של המבקר האוטומטי התאימו לשיפוטי מבקרים אנושיים בקירוב לאותה רמת התאמה שבה בני אדם מתאימים זה לזה. הוא הופיע בביצועים דומים גם על מאמרים עדכניים שלא היו בנתוני האימון שלו, מה שמרמז שלמד באמת את משימת הביקורת ולא רק זכר תוצאות.

מבחן למדען הבינה המלאכותית

כדי לבדוק עד כמה המערכת שלהם מתפקדת בשדה, המחברים ביקשו ממנה לייצר מאמרים מלאים לסדנה בכנס מוביל בלמידת מכונה. באישור אתי ובשיתוף מאורגני הכנס, הוגשו שלושה כתב-יד שנוצרו על-ידי הבינה לצד מאמרים שנכתבו בידי בני אדם. המבקרים הודעו כי ייתכנו הגשות שנכתבו על-ידי בינה אך לא נאמר להם אילו. אחד משלושת המאמרים שנוצרו על-ידי הבינה קיבל ציוני ביקורת שהיו מספיקים כדי שיעמוד בקריטריונים לקבלה בסדנה; המחברים משכו אותו לאחר מכן לפי פרוטוקול מוסכם מראש. שני המאמרים האחרים לא עמדו בסטנדרט. בסך הכול, המערכת ייצרה עבודה שעדיין לא שווה למחקר האנושי הטוב ביותר, אך כבר מספיקה במקרים מסוימים לעבור ביקורת עמיתים אמיתית.

הבטחות, מכשולים והדרך קדימה

אף שהמדען הבינה-מלאכותי עדיין עושה טעויות — כגון רעיונות שטחיים, שגיאות בקוד וציטוטים מטעהים — המחקר מציע שכאשר המודלים הבסיסיים של הבינה המלאכותית ומשאבי החישוב ישתפרו, מערכות כאלה צפויות להשתפר משמעותית. זה עלול להאיץ בצורה דרמטית את גילוי תגליות בתחומים שבהם ניסויים ניתן להריץ על מחשבים או במעבדות אוטומטיות. במקביל, היכולת לייצר מאמרים בקלות עלולה לשטוף כתבי-עת בעבודות באיכות נמוכה, לטשטש גבולות סביב מחברות וזכויות, ולאפשר ניסויים מסוכנים או לא-אתיים. המחברים טוענים כי הקהילה המדעית זקוקה עכשיו לחוקים ברורים ואמצעי הגנה, בזמן שהטכנולוגיה עדיין בתחילת דרכה, כדי שמחקרים ממוכנים יחזקו את המדע ולא יחלישו אותו.

ציטוט: Lu, C., Lu, C., Lange, R.T. et al. Towards end-to-end automation of AI research. Nature 651, 914–919 (2026). https://doi.org/10.1038/s41586-026-10265-5

מילות מפתח: מחקר מדעי ממוכן, מדען בינה מלאכותית, ניסויי למידת מכונה, אוטומציה של ביקורת עמיתים, יושרה מדעית