Clear Sky Science · he
מודל רגרסיה אדפטיבי לאבחון מחלת פרקינסון מתוך אותות דיבור באמצעות אשכולות מבוססי Box-Cox ואקסטרא רנדומיזציה
מדוע האזנה לקולות יכולה לעזור לזהות פרקינסון מוקדם יותר
מחלת פרקינסון מוכרת בעיקר ברעידות ובנוקשות, אבל זמן רב לפני שהתסמינים האלה הופכים ברורים, הקול לעיתים משתנה באופן עדין. מאחר שכמעט לכל אחד יש מיקרופון בכיס, ניתן לנטר שינויים אלה בבית, ולהפוך דיבור יומיומי למערכת איתות מוקדמת. המאמר חוקר כיצד לבנות כלי “מקשיב” חכם ואמין שמשתמש בטכניקות מחשב מתקדמות כדי לאמוד עד כמה חמורים תסמיני הפרקינסון של אדם, רק על סמך קולו.

להפוך הקלטות ביתיות לרמזים בריאותיים משמעותיים
החוקרים עבדו עם מערך נתונים קוליים עשיר שנאסף מ-42 אנשים בשלב מוקדם של מחלת פרקינסון, שכל אחד מהם הקליט צלילי תנועה של תנועה קצרה בבית במהלך כשלושה־שישה חודשים. מכל הקלטה מדד המערכת עשרות מאפייני קול, כגון עד כמה יציב הטון מגל הלחיצות של מיתרי הקול (jitter), עד כמה העוצמה מתנדננת (shimmer), ועד כמה הקול רועש או נשימתי. מדידות אלה נקשרו לאופן שבו פרקינסון משפיע על השרירים ששולטים בדיבור. המטרה לא הייתה רק לומר האם למישהו יש פרקינסון, אלא לחזות שתי נקודות מדויקות רפואיות, המכונות Motor-UPDRS ו-Total-UPDRS, שבהן רופאים משתמשים כדי לדרג את חומרת התסמינים הכוללת.
לנקות נתונים מבולגנים כדי שמחשבים יבינו אותם
מדידות קול גולמיות יכולות להיות מבולגנות: חלק מהערכים מוטים באופן חזק, אחרים כוללים ערכי קיצון, ורבים הם גרסאות חופפות של אותה תובנה. אם מזינים אותם ישירות למודל, העומס הזה יכול לבלבל את הלמידה ולהפוך את התוצאות לפגיעות. כדי להתמודד עם זה, הצוות יישם תחילה שלב שינוי מתמטי שנקרא טרנספורמציית Box–Cox. בפשטות, זה מתיחה ודחיסה של הנתונים כך שערכים קיצוניים יתמתנו וההתפלגות הכללית תיראה יותר כמו עקומת פעמון חלקה, שמספר אלגוריתמי למידה מטפלים בה טוב יותר. הם גם דאגו לפצל את הנתונים לפי אדם ולא לפי הקלטה, כך שהמחשב מעולם לא ראה את אותו מטופל גם באימון וגם במבחן, ובכך נמנע האשליה של דיוק גבוה שנגרמת מ״זכירת״ קולות בודדים.

לאפשר לנתונים להחליט אילו תכונות קול באמת חשובות
רבים מ-26 מאפייני הקול במערך הנתונים הם וריאציות על אותה נושא — למשל, כמה דרכים למדוד רעידות גובה או שינויי עוצמה. במקום להכניס את כולם למודל, הכותבים ניסו אסטרטגיות שונות לשמירה רק על אלו המועילות ביותר. הגישה המוצלחת ביותר שלהם היתה לאגד תכונות שמתנהגות בדומה לאשכולות ואז לבחור נציג יחיד מכל אשכול על סמך עד כמה הוא קשור לנקודות הסימפטומים. בחירת התכונות המבוססת על אשכולות צמצמה את הקבוצה המקורית לשלוש אינדיקטורים בולטים בלבד: מדד jitter אחד, מדד shimmer אחד ומדד אחד לרעשי הקול הכללי. למרות הפישוט הקיצוני הזה, שלושת התכונות שנבחרו בקפידה תפסו את רוב המידע הרפואי החבוי בהקלטות.
שימוש בעצי החלטה אקראיים לקריאת אותות הקול
עם מאפייני הקול המסוננים, הצוות השווה מספר שיטות חיזוי, מנוסחאות פשוטות קוויות ועד מודלים גמישים מבוססי עצים ואוטוהאיקודר בסגנון רשת עצבית. המנצח הברור היה גישה שנקראת Extra Trees, אנסמבל של עצי החלטה רבים שכל אחד מהם מחלק את הנתונים בדרכים מאוד אקראיות. האקראיות הזו, בצירוף מערך תכונות מצומצם ופחות מיותר, עזרה למודל להימנע מהתאמה יתרה — לזכור קיצונים של נתוני האימון במקום ללמוד דפוסים כלליים. על מטופלים שהוחזקו מחוץ לאימון, שילוב האשכולות ו-Extra Trees חזה הן את ציוני ה-Motor וה-Total UPDRS בדיוק מרשים, והתיאומים עם הציונים הנמדדים היו כה קרובים שההבדלים היו בדרך כלל הרבה מתחת לנקודה אחת בסולמות המתפרשים על פני מאה נקודות ומעלה.
מה זה אומר לאנשים החיים עם פרקינסון
לקורא שאינו מקצועי, המסר המרכזי הוא שמספר קטן של מדידות קול שנבחרו בקפידה, שעברו עיבוד באמצעות צינור למידה מתוכנן היטב, יכול לעקוב אחרי חומרת הפרקינסון ברמת דיוק קרובה לקלינית — באמצעות הקלטות שנעשו בבית. אמנם המחקר עדיין מסתמך על מערך נתונים יחיד ויזדקק לבחינה בקבוצות מטופלים גדולות ומגוונות יותר, אך הוא מציג מסלול מבטיח אל עבר טלמדיסין מעשי: עתיד שבו הקלטת קול קצרה יכולה לסייע למטופלים ולרופאים לעקוב אחרי התקדמות המחלה, לכוונן תרופות, ואולי לזהות החמרה מוקדמת בתסמינים — כל זאת בלי לצאת למרפאה.
ציטוט: Essam, M., Balat, M., Zaky, A.B. et al. Adaptive regression model for Parkinson’s disease diagnosis from speech signals using Box-Cox-based clustering and extremely randomization. Sci Rep 16, 14044 (2026). https://doi.org/10.1038/s41598-026-49065-2
מילות מפתח: מחלת פרקינסון, ניתוח קול, למידת מכונה, מוניטור מרחוק, בחירת תכונות