Clear Sky Science · he

מסגרת יחס סבירות המבוססת על ניקוד לזיהוי תמונות דיפפייק במדעי המשפט

· חזרה לאינדקס

מדוע פנים מזויפות הן בעיה של כולם

תמונות וסרטונים שנראים אמיתיים כעת ניתנים לזיוף בקלות בעזרת אפליקציות צרכניות, החל מכלי החלפת פנים ועד מסנני תמונות. מה שנקרא דיפפייקים כבר אינם סתם סקרנות אינטרנטית — הם יכולים לשמש להפצת חדשות כוזבות, להונאה או להטיל ספק בראיות אמיתיות בבית משפט. מאמר זה מתמודד עם שאלה החשובה לכל מי שדואג לאמת בעולם הדיגיטלי: לא רק "האם התמונה מזויפת?" אלא "כמה חזק הראיות מצביעות על כך, באופן ששופט ולשופטים יכולים להבין?"

Figure 1
Figure 1.

מענה של כן-או-לא אל מול כמה בטוחים אנחנו

רוב מזהי הדיפפייק כיום מתנהגים כגלאי שקרים פשוטים: הם מקבלים תמונה ומוצאים תווית, אמיתית או מזויפת, לפעמים עם ציון ביטחון. לסינון יומיומי ברשתות החברתיות זה עשוי להספיק. אבל בבית משפט, חוקריו חייבים להשוות שתי גרסאות מתחרות — "התמונה זו מזויפת" מול "התמונה אמיתית" — ולהסביר עד כמה הנתונים תומכים באחת מהן. המחברים בונים מערכת הממירה את הציונים הגולמיים של מזהה הדיפפייק ל"יחס סבירות": ביטוי מספרי שמצביע עד כמה הראיות הנצפות תומכות באפשרות אחת ביחס לשנייה, שפה שכבר מוכרת בתחומי מִדָע־המשפט אחרים כמו טביעות אצבע וכתב יד.

בניית ערימת מבחן מוצקה של פנים אמיתיות ומזויפות

כדי ליישם את עבודתם על נתונים מוצקים, החוקרים מסתמכים על FaceForensics++, אוסף נפוץ של סרטונים שמציג גם פנים אמיתיות וגם דיפפייקים שנוצרו על ידי כמה שיטות פופולריות. הם מחלקים חומר זה ברמת הסרטון השלם — ולא של פריימים בודדים — לחמש בריכות נפרדות לאימון המזהה, לכיול הגדרותיו, לבחירת הדגם הטוב ביותר, לכיול מערכת יחס־הסבירות ולבדיקות. עיצוב זה מונע "דליפת נתונים", שבה פריימים כמעט זהים מאותו סרטון עשויים להופיע בטעות הן באימון והן בבדיקה, מה שיכול לשפר באופן מלאכותי את מספרי הביצועים.

הפיכת ציוני המזהה למשקל ראיות

הצוות משווה תחילה מספר מזהי דיפפייק מודרניים ומגלה שרשת מבוססת קפסולות מספקת את התוצאות האמינות ביותר על פני סוגים שונים של זיופים. דגם זה מפיק ציון בין אפס לאחד עבור כל תמונת פנים, כאשר ערכים גבוהים יותר מצביעים על חשד חזק יותר לזיוף. במקום לקבוע קו חיתוך נוקשה בסף כלשהו, המחברים ממדלים כיצד ציונים אלה מתפלגים עבור תמונות ידועות כאמיתיות ועבור דיפפייקים ידועים. בעזרת טכניקת החלקה הם מעריכים שתי עקומות חלקות: אחת שמתארת ציונים אופייניים לתמונות אמיתיות, והשנייה לדיפפייקים. עבור כל תמונה חדשה הם שואלים: האם הציון הזה אופייני יותר לעקומת ה"אמיתי" או לעקומת ה"מזויף"? היחס בין שתי האפשרויות האלה הופך ליחס הסבירות, מדד ישיר לחוזק הראיות.

Figure 2
Figure 2.

מניעה של קיצוניות בטוחה מדי

עם זאת, עקומות סטטיסטיות עלולות להתנהג באופן בלתי יציב באזורים שבהם המערכת ראתה מעט או לא ראתה נתונים כלל, מה שיוביל ליחסי סבירות שאפתניים מדי — ענקיים או זעירים באופן בלתי ריאלי. כדי למנוע מהדגם לנסח טענות בטוחות מדי, החוקרים מיישמים שיטה של גבולות תחתונים ועליונים אמפיריים. במונחים פרקטיים הם מקבעים את הערכים הקיצוניים ביותר שהמערכת רשאית להפיק בהתבסס על ביצועה כאשר נבחנת על דוגמאות "קשות". בנוסף הם משתמשים בצעד כיול שמתקן את יחס־הסבירות הגולמי כך שבמקרים רבים דיווח חוזק הראיות יתאים יותר לשכיחות שבה המערכת אכן צודקת. בדיקות על החלק השמור של FaceForensics++ מראות שיעורי שגיאה נמוכים ומקרים מעטים שבהם הראיות מצביעות בכיוון הלא נכון, מה שמעיד שהמערכת מתנהגת באופן סביר בתוך היקום הנתוני הזה.

כמה טוב זה מתמודד מחוץ למעבדה?

מקרים מהעולם האמיתי יתקשו להתאים באופן מושלם לנתוני האימון, ולכן המחברים בודקים כיצד המערכת שלהם מתפקדת על מספר מאגרי דיפפייק בלתי־תלויים שנבנו עם שחקנים ושיטות יצירה שונות. כאן הביצועים יורדים: היא עדיין טובה יותר מהנחה אקראית, אך לא בפרשנות רחבה על הסטים המאתגרים ביותר. המערכת עובדת היטב כאשר החומר החדש דומה לנתוני FaceForensics++ המקוריים ומתקשה כאשר סגנון הזיוף משתנה. זה מדגיש קושי מרכזי בבינה מלאכותית פורנזית: כלים חייבים להיות מאומתים לא רק על מערכי בוחן נוחים אלא גם לאורך הנוף המשתנה במהירות של טכנולוגיות דיפפייק.

מה משמעות הדבר לבית משפט ולציבור?

במונחים יומיומיים, עבודה זו מראה שניתן לתרגם את פלט מזהי הדיפפייק לצורת "משקל ראיות" שמתאימה לאופן שבו מדעני פורנזיקה כבר שוקלים טביעות אצבע או DNA. בהגדרות הדומות לנתוני האימון שלה, המערכת יכולה לספק לא רק הערכה לגבי האם תמונה מזויפת, אלא גם הצהרה כיולת וזהירה על כמה חזק הנתונים תומכים במסקנה זו. עם זאת, המחקר מזהיר מפני ביטחון יתר: הביצועים עלולים להיחלש כאשר השיטה נתקלת בסוגים חדשים של דיפפייקים. לפני שכלים כאלה יזכו לאמון בבתי משפט, הם זקוקים לאימות רחב יותר ולעדכון מתמשך כדי לעמוד בקצב האמצעים המשתנים לייצר מציאות מזויפת.

ציטוט: Guo, T., Li, J. & Tang, Y. A score based likelihood ratio framework for deepfake image identification in forensic science. Sci Rep 16, 12149 (2026). https://doi.org/10.1038/s41598-026-42176-w

מילות מפתח: זיהוי דיפפייק, ראיות פליליות, יחס סבירות, ניתוח תמונה דיגיטלית, טכנולוגיה בבית משפט