Clear Sky Science · he

התפקיד של מיומנות אבחונית בשיפוט יכולת של רובוטים

· חזרה לאינדקס

למה תקיעות של רובוט חשובה לכולנו

רובוטים ומערכות בינה מלאכותית עוברים במהירות ממעבדות למפעלים, בתי חולים ולשדרותינו. ככל שאנו מתחילים להסתמך עליהם, שאלה אחת הופכת מכרעת: איך אנשים מחליטים האם רובוט באמת מיומן? מאמר זה בוחן איך אנו שופטים רובוט שמבצע בדרך כלל היטב אך מדי פעם עושה טעות מפתיעה — או משיג הצלחה בלתי צפויה. הממצאים מסבירים מדוע "התחושות הבטן" שלנו לגבי מכונות יכולות להבדיל ממה שאנו אומרים בקול, ולמה טעות אחת יכולה להתעלם ממנה או לשנות את האמון שלנו לצמיתות.

שתי דרכים שבהן מוחנו שופט מכונות

פסיכולוגים מבחינים בין שתי סוגי רושם. רושמים מפורשים הם השיפוטים שאנו יכולים לדווח עליהם ישירות כשנשאלים, כמו דירוג רובוט בסולם יכולת 1–7. רושמים בלתי מודעים הם אוטומטיים יותר, משתקפים בתגובות מהירות שאנשים עושים מבלי להתמקד בהערכה. מחקרים קודמים הציעו שרושמים מפורשים משתנים במהירות כאשר אנו רואים התנהגות חדשה, בעוד שרושמים בלתי מודעים נעים באטיות. המחקר הזה שואל האם הפער באמת נובע ממערכות מנטליות שונות — או שמא הוא תלוי עד כמה ההתנהגות החדשה נראית אינפורמטיבית, כלומר אבחונית, לגבי יכולותיו האמיתיות של הרובוט.

Figure 1
Figure 1.

מרצפות מפעל לחדרי ניתוח ולכבישים

בעזרת תשעה ניסויים מקוונים שכללו יותר מ-3,700 משתתפים, החוקרים הראו לאנשים רובוטים שונים שפעלו בהקשרים ריאליסטיים: רובוט תעשייתי שנע במחסן צפוף, רובוט כירורגי שעוקב מסלולים מדויקים, ורכב אוטונומי שמגיב למכשולים בכביש. לפעמים הרובוט היה מיומן בעקביות או מגושם בעקביות. במקרים אחרים הוא היה בדרך כלל מיומן אך ביצע טעות ברורה אחת, או בדרך כלל בלתי מיומן אך השיג הצלחה בולטת אחת. לאחר צפייה ברצפי הופעות קצרים אלה, נמדדו רושמי המשתתפים בשתי דרכים: שאלות דיווח עצמי ישירות ומשימות עקיפות שתפסו תגובות מהירות ואוטומטיות.

מתי הופעה יוצאת דופן תופסת משמעות

בסיטואציות ריאליסטיות אלה, דירוגי המשתתפים המפורשים עקבו גם אחרי דפוס הביצועים הכולל וגם אחרי הניסוי ה"יוצא דופן" הנדיר. טעות בודדת בין הצלחות רבות יכלה להוריד במידה ניכרת את הדירוגים המפורשים, והצלחה בודדת בין כישלונות רבים יכלה להעלות אותם. רושמים בלתי מודעים, לעומת זאת, סיפרו סיפור שונה. הם הגיבו בחוזקה להתנהגות הטיפוסית של הרובוט — האם בדרך כלל הוא מיומן או לא — אך התעלמו ברובו מהיוצא מן הכלל הבודד. הפיצול הזה נשאר גם כאשר החוקרים תכננו מחדש את המידות שלהם בקפידה כך שהמשימות "המפורשות" וה"עקיפות" ייראו וירגישו דומות ככל האפשר, והבדילו בעיקר בכך שהמשתתפים הונחו לשפוט את הרובוט במודע.

מה עושה את הטעות של רובוט לאמיתית ומסמנת

הצוות בדק אז רעיון מרכזי: כוחו של אירוע יוצא דופן תלוי עד כמה הוא נתפס כאבחוני — האם אנשים חושבים שהוא באמת חושף משהו מתמשך לגבי הרובוט. במחקרים חדשים ראו המשתתפים תחילה רובוט שמבצע מספר ניסוים ללא דופי, ולאחר מכן ראו כישלון אחד או יותר. כשהכישלונות המאוחרים הוצגו כחשובים, כניסיונות עדכניים, או כשמספר הכישלונות הצטבר על מנת להתאים לכמות ההצלחה הקודמת, גם הרושמים המפורשים וגם הבלתי מודעים השתנו. באופן קריטי, בתנאי אבחוניות גבוהה אפילו טעות אחת הספיקה להזיז רושמים אוטומטיים ובלתי מודעים. כאשר אותו סוג שגיאה תואר כלא עדכני, לא חשוב או תקלת חד פעמית, הרושמים הבלתי מודעים בקושי זזו, למרות שהדירוגים המפורשים עדיין השתנו.

Figure 2
Figure 2.

למה זה חשוב לאמון היומיומי בבינה מלאכותית

במבט כולל, הממצאים מציעים שרושמים מהירים ואוטומטיים של יכולת הרובוט אינם עיוורים למידע חדש, אך הם דורשים ראיות חזקות או בעלות משמעות ברורה לפני שישתנו. הדירוגים שאנו מבטאים בקול, בניגוד לכך, רגישים מאוד אפילו לאירועים חלשים או אמביוולנטיים, בחלקם בגלל לחץ להשתמש בכל המידע הקיים כאשר נשאלים לשפוט. עבור מעצבים, מהנדסים וקובעי מדיניות, המשמעות היא שניהול האמון ברובוטים הוא לא רק עניין של הפחתת שגיאות, אלא גם של אופן העיצוב וההצגה של אותן שגיאות וההבנה שלהן. כישלון בולט אחד — כמו רכב שלא נעצר כשהוא ברור שצריך — יכול לעצב מחדש הן את התחושות המיידיות והן את הדעות המוצהרות שלנו, עם השלכות ישירות על נכונותנו לאמץ ולהסתמך על מכונות חכמות.

ציטוט: Surdel, N., Ferguson, M.J. The role of diagnosticity in judging robot competence. Sci Rep 16, 7578 (2026). https://doi.org/10.1038/s41598-026-35375-y

מילות מפתח: יכולת רובוטית, אינטראקציה בין אדם לרובוט, הטיה בלתי מודעת, אמון ב-AI, מידע אבחוני