Clear Sky Science · he

השוואת ביצועי בינה מלאכותית ואנשי מקצוע ברפואה בניתוחים ובניתוחי וידאו התערבותיים: סקירה שיטתית ומטה‑אנליזה

· חזרה לאינדקס

עיניים חכמות יותר בחדר הניתוח

בכל שנה עוברים מאות מיליוני אנשים ניתוחים ופרוצדורות פולשניות מינימליות המונחות באמצעות וידאו — חשבו קולונוסקופיות, ניתוחים זעיר‑פולשניים או מצלמות זעירות המוחדרות לכלי דם. ברגעים אלה, היכולת של הרופא לזהות סימני אזהרה עדינים על המסך יכולה להכריע בין גילוי מוקדם של סרטן לבין פספוס. המחקר הזה שואל שאלה החשובה לכל מטופל עתידי: כאשר מנתחים וידאו כירורגי והתערבותי, עד כמה מערכות בינה מלאכותית מופיעות בהשוואה לקלינאים אנושיים, ומה קורה כשהשניים עובדים יחד?

Figure 1
Figure 1.

הבאת סדר לשטף הווידאו הכירורגי

הרפואה המודרנית מקליטה כעת כמויות עצומות של סרטוני פרוצדורות, מאנדוסקופיות של מערכת העיכול ועד לניתוחים בסיוע רובוט. ההקלטות הללו מלאות במידע: פוליפים זעירים במעי, גידולים מוקדמים בקיבה או בוושט, עצבים עדינים שיש להמנע מהם, או שלבים במהלכו של ניתוח מורכב. חוקרים מאמנים מערכות בינה מלאכותית לסרוק תמונות אלה, לסמן אזורים חשודים ואפילו לזהות באיזה שלב של הפעולה נמצא המנתח. יחד עם זאת, עד כה רוב המחקרים השוו את ה‑AI לנתחים במאבקי תנאי מעבדה מלאכותיים, במקום לשאול כיצד הטכנולוגיה תשמש במציאות — כסייעת לצד הרופא. סקירה זו שאפה לאסוף ולנתח באופן שיטתי את הראיות המפוזרות בכל ההתמחויות.

מה בחן צוות המחקר

הצוות חיפש במסדי נתונים מרכזיים בתחום הרפואה וההנדסה והתחיל כמעט מ‑38,000 מאמרים. לאחר יישום קריטריונים קפדניים — רק מחקרים ראשוניים שהשתמשו ב‑AI על וידאו כירורגי או התערבותי אמיתי והשוו ישירות את ביצועיו לאלו של אנשי מקצוע רפואיים — נשארו רק 146 מחקרים. אלה כיסו מגוון רחב של פרוצדורות, במיוחד אנדוסקופיה של מערכת העיכול, אך גם התערבויות בריאה, בלוטת התריס, מוח, לב ומערכת השלד השתן. רובם השתמשו בשיטות למידה עמוקה מודרניות, כמו רשתות עצביות קונבולוציוניות, שאומנו לאתר מחלה, לזהות אנטומיה, לדרג את ניקיון המעיים או לזהות שלבים בניתוח. שבעים ושש מהמחקרים דיווחו על פרטים מספקים שמאפשרים למחברים לאגד תוצאות ולחשב באיזו תדירות ה‑AI והאנשים צדקו או טעו.

AI לבד מול רופאים, ו‑AI כעמית

כאשר החוקרים השוו את ה‑AI לקלינאים שלא נעזרו בעזרים וסקרו את אותם סרטונים, מערכות ה‑AI בדרך כלל זיהו יותר בעיות אמיתיות (רגישות גבוהה יותר) מבלי לגרום ליותר אזעקות שווא (ספציפיות דומה). התבנית הזו החזיקה גם כאשר המודלים נבחנו על נתונים מוכרים וגם כשהתמודדו עם מאגרי חוץ חדשים. עם זאת, הממצא הקליני המשמעותי ביותר הופיע כאשר ה‑AI שימש כסייע. בטווח רחב של משימות, קלינאים שיכלו לראות את הצעות ה‑AI הצליחו יותר לאתר מחלה והיו פחות נוטים לסווג רקמות תקינות באופן שגוי מאשר אלה שעבדו לבד. השיפור היה בולט במיוחד עבור לא‑מומחים, כגון מתמחים, שזכו במיוחד מהכוונת ה‑AI. עבור מומחים מנוסים, עזרה של AI ו‑AI שפועל לבד נתנו ביצועים בערך ברמות דומות, מה שמרמז שבידיהם של מומחים השילוב בין אדם למכונה יכול להתעלות על האלגוריתמים העצמאיים הטובים ביותר.

פערים בין תנאי מעבדה ובין המציאות הקלינית

למרות הנתונים המעודדים הללו, הסקירה מדגישה פער בין אופן הבדיקה של ה‑AI כיום ובין האופן שבו הוא חייב לפעול במצבים קליניים אמיתיים. מחקרים רבים ניקו את הנתונים על‑ידי הסרת פריימים מטושטשים או בעלי איכות נמוכה, אף על פי שחדרי ניתוח וחדרי אנדוסקופיה בעולם האמיתי מתמודדים לעתים קרובות דווקא עם ליקויים כאלה. אחרים ניתחו תמונות בודדות מנותקות במקום וידאו רציף, ובכך התחמקו מהאתגר של מעקב אחרי תנועה ותזמון. מיעוט מחקרים העריך את ה‑AI בזמן אמת ליד המיטה, ורובם התבססו על ציוד יקר שאולי אינו זמין בבתי חולים עם משאבים מוגבלים. נהלי הדיווח היו גם הם לא אחידים: פרטים מרכזיים על כיוונון המודלים ואימותם לעתים קרובות נעדרו, מה שמקשה על שחזור או הערכה הוגנת של התוצאות.

Figure 2
Figure 2.

בניית שותפויות אמינות בין אדם ל‑AI

המחברים טוענים שיש לפתח ולבחון את ה‑AI בכירורגיה וברפואה התערבותית מההתחלה כעמית עבור הקלינאים, לא כמחליף. המשמעות היא תכנון מחקרים המשקפים תנאי עולם‑אמיתי, שיתוף מאותיות וידאו מגוונות בין מרכזים ואימוץ תקני דיווח ברורים כדי שצוותים אחרים יוכלו לאמת ולשפר את העבודה השפורסמה. המשמעות גם היא להכשיר קלינאים להבין את חוזקותיו והטיותיו של ה‑AI, במקום לסמוך בעיוורון או לדחות את הצעותיו. בעוד שהמטא‑אנליזה מראה כי ה‑AI כבר יכול להתאים או להתעלם מביצוע האדם הלא‑מועסק בהרבה משימות מבוססות וידאו, התועלת המשמעותית ביותר היא בדרך שבה הוא יכול לחדד את שיקול הדעת האנושי. עבור מטופלים, המסר אינו שמכונות יחליפו את חדר הניתוח, אלא שצוותים אנושיים‑ממוחשבים שעוצבו בקפידה יכולים להפוך פרוצדורות לבטוחות יותר, לאבחנות מוקדמות יותר ולתוצאות טובות יותר.

ציטוט: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2

מילות מפתח: וידאו כירורגי ובינה מלאכותית, אנדוסקופיה בסיוע מחשב, שיתוף פעולה בין אדם ל‑AI, ניתוח תמונות רפואיות, תמיכה בקבלת החלטות קליניות