Clear Sky Science · he
חוסר יציבות ומגבלות ביצועים של רשתות עצביות מבוססות קונבולוציה על נתונים טבלאיים רפואיים שאינם רציפים: חקירה אמפירית
מדוע זה חשוב לרפואה היומיומית
בתי חולים מסתמכים יותר ויותר על בינה מלאכותית כדי לסייע בחיזוי מי חולה בסרטן, במחלות לב או בזיהומים חמורים, תוך שימוש ברשומות רפואיות בסגנון גיליון אלקטרוני ולא בתמונות. המחקר הזה שואל שאלה שנראית פשוטה אך יש לה השלכות מעשיות גדולות: האם רשתות עצביות פופולריות שמקורותיהן בעיבוד תמונה אמינות כשמזינים להן נתונים טבלאיים רפואיים שאינם תמונות, או שהן מתנהגות באופן לא יציב שעלול להטעות רופאים ומטופלים?

שתי משפחות של מחשבים בהשראת המוח
החוקרים השוו שתי משפחות של רשתות עצביות המדמות, באופן גס, כיצד המוח מעבד מידע. רשתות קונבולוציה (CNN) הן כלי העבודה של זיהוי תמונות מודרני: הן סורקות תמונות בחלונות קטנים ומחפשות דפוסים מקומיים כמו קצוות או מרקמים, ואז בונות צורות מורכבות יותר. מולטילייר פרספטרונים (MLP) נוקטים בגישה פשוטה יותר: הם מתייחסים לכל תכונה קלט—כגון גיל, לחץ דם או ערך בדיקה—כמספר עצמאי ולומדים צירופים משוקללים של כל התכונות יחד, בלי להניח סדר או שכנות מיוחדת ביניהן.
להעמיד טבלאות רפואיות במבחן
כדי לבדוק כיצד המודלים מתנהגים על נתוני בריאות מהעולם האמיתי, הצוות השתמש בשלוש מערכות נתונים רפואיות ידועות שמזכירות יותר גיליונות אלקטרוניים מאשר תמונות. אחת כללה מאפייני מעבדה וקליניים של מטופלים עם COVID‑19, לשם חיזוי הישרדות. אחרת תיארה מדידות מיקרוסקופיות של גידולי שד, לשם הבחנה בין ממאיר לשפיר. השלישית תיעדה גורמי סיכון קלאסיים למחלות לב ממאגר קרדיולוגי. באופן חשוב, מערכי הנתונים האלה מציגים משתנים זה לצד זה, אך אין להם סדר "מימין-לשמאל" בעל משמעות טבעית, בניגוד לפיקסלים בתמונה.
שיבוש העמודות ושיבוש המודלים
ליבת המחקר הייתה מבחן לחץ עצום. המחברים שובבו שוב ושוב את סדר העמודות בקלט ובמקביל שינו אקראית רכיבים מרכזיים בעיצוב ה‑CNN, כמו כמות ה"קוראים" הקטנים (kernels), רוחב אותם חלונות, וכמות הנוירונים בשכבת ההחלטה הסופית. עבור כל קומבינציה של שיבוש וסגנון ארכיטקטורה—1,000 פרמוטציות בסך הכל—אימנו את ה‑CNN ובמקביל MLP דומה. במקום להתמקד בדיוק היחיד הטוב ביותר, הם בדקו כיצד ציוני הביצוע מתפזרים על פני כל הריצות, וניתחו את השטח תחת העקומה ROC (AUROC) כסיכום היכולת של כל מודל להפריד בין חולים לבין בריאים.

מה שנמצא בתוך הקופסה השחורה
התוצאות שיצרו תמונה מעכבת בנוגע ל‑CNN על טבלאות רפואיות שאינן תמונות. במצבים שנבחרו בקפידה, CNN יכלו להשוות או אפילו לעקוף במעט את ה‑MLP בשיא הביצועים—במיוחד בנתוני סרטן השד, שהכילו תכונות בולטות וברורות המבדילות. אך על פני כל השיבושים והארכיטקטורות, ה‑CNN הראו תנודות רחבות בהרבה בביצועים, עם נטייה מדאיגה לריצות גרועות מדי פעם. הצלחתם או כשלונם נבעו במידה רבה מהחלטות אקראיות: כיצד סודרו העמודות, מה גודל חלון הסריקה, וכמה מסננים וצמתים בשכבה הסופית ברשת. חלונות סריקה גדולים יותר, שמעבדים יחד תכונות שכנות רבות, פגעו בעקביות ובביצועים הממוצעים על קלטים לא‑רציפים אלה.
מדוע מודלים פשוטים התנהגו לעתים טוב יותר
לעומת זאת, ה‑MLP היו רגישים פחות לסדר העמודות. משום שאינם מסתמכים על שכנות מקומית, שיבוש תכונות לא שינה את מה שהמודל על פי עיקרון יכול ללמוד. כשהחוקרים הגדילו את מספר הנוירונים בשכבת ההסתר של ה‑MLP, ביצועיו השתפרו בעקביות ולעתים קרובות עלו על אלו של ה‑CNN, למרות שימוש בפחות פרמטרים כוללים. מערכי נתונים עם תכונות אינפורמטיביות וברורות נטו להניב ציונים גבוהים ויציבים לשני המודלים, אך ה‑CNN עדיין נשאו סיכון גבוה יותר לקריסה אקראית. על מערכי נתונים קשים יותר, שבהם האותות חלשים יותר, ביצועי ה‑CNN השתנו באופן קיצוני בהתאם לבחירות הארכיטקטוניות, בעוד שה‑MLP נשארו יציבים יחסית.
מסר למי שעוסק בבינה קלינית
ליישומים רפואיים שמבוססים על רשומות בסגנון גיליון אלקטרוני במקום תמונות, המחקר מסכם כי CNN עלולות להיות כלים שבירים. חוזקן המדומה בכמה סטנדרטים עשוי לשקף סידור מזל של העמודות והחלטות עיצוב ספציפיות, ולא למידה יציבה ממשית של דפוסים רפואיים. MLP ושיטות אחרות שאינן מניחות פריסת מרחב משמעותית הציעו בדרך כלל התנהגות אמינה יותר לאורך אלפי ניסויים. עבור רופאים, מדעני נתונים בבתי חולים ומוסדות רגולטוריים, הלקח ברור: בעת בניית מערכות בינה מלאכותית על נתוני בריאות טבלאיים, עדיף להעדיף יציבות ושקיפות על פני מרדף אחרי המספר הבודד הגבוה ביותר שמספקות רשתות סגנון‑תמונה שלא תוכננו לקלטים כאלה.
ציטוט: Wang, C., Elgendi, M. & Shin, H. Instability and performance limits of convolutional neural networks on non-sequential medical tabular data: an empirical investigation. Sci Rep 16, 11914 (2026). https://doi.org/10.1038/s41598-026-39875-9
מילות מפתח: נתונים טבלאיים רפואיים, רשתות עצביות קונבולוציוניות, מולטילייר פרספטרון, מודלי חיזוי קליניים, יציבות המודל