Clear Sky Science · he
מאגר התוכן הסמנטי המינימלי (MSC): משאב גדול ומאוזן למחקר אסתטיקה חישובית
מדוע יופי בתמונות קשה יותר למדידה משנדמה
מדוע חלק מהתמונות נראות לנו יפות בעוד שאחרות נראות משעממות או אף מכוערות? יתכן שתחשבו שמדענים יוכלו לענות על כך על ידי מדידת צבעים, ניגודיות או דפוסים בתמונה. אך יש בעיה: תגובותינו משולבות במה שהתמונה מציגה — אנשים, מקומות, סמלים וזיכרונות. מאמר זה מציג אוסף תמונות חדש, מתוכנן בקפידה, שמנסה להסיר את ההסחות האלה כדי שמחקרנים יוכלו להתמקד באיך העין והמוח מגיבים למראה הגולמי של התמונה עצמה.
להוציא את הסיפור מהתמונה
מרבית מאגרי התמונות הפופולריים במחקר בנויים מאתרי שיתוף תמונות ותחרויות ברשת. מקורות אלה נלווים לכותרות, לנושאים ולהקשרים תרבותיים שמכוונים בעדינות את האופן שבו אנשים מדרגים אותן. בדיחה שנונה שתואמת נושא תחרות יכולה להפוך תמונה בינונית לזוכה. סמלים חזקים, כמו דגלים, עלולים לקבל ציונים גבוהים מסיבות תרבותיות ולא חזותיות. בנוסף, אנשים לא נוטים להעלות תמונות גרועות באמת, ולכן מאגרים קיימים מלאים בתמונות שמספיקות או טובות. יחד, זה מקשה מאוד להבחין האם דירוג גבוה נובע מהמבנה הויזואלי של התמונה — צבעיה, מרקמיה וצורותיה — או מהמובן שלה. 
לבנות עולם של סצנות שקטות
כדי להתמודד עם זה, יצרו המחברים את מאגר התוכן הסמנטי המינימלי (MSC): למעלה מעשרת אלפים תמונות שנבחרו להיות עשירות ויזואלית אך בעלי "סיפור" מינימלי ככל האפשר. הם התחילו מתמונות בשליטה ציבורית ואוספים אישיים, והסירו כל תמונה עם אנשים, בעלי חיים, מבנים, כתיבה או חפצים סמלים חזקים. הם גם הימנעו מנופי גלויות וסגנונות פוסט-קארד שעלולים לעורר זיכרונות או רגשות עזים. מה שנשאר הם בעיקר פיסות של טבע — עלים, קליפה, סלעים, עננים, משטחים מימיים ורצפות יער. סצנות אלה אינן חסרות משמעות לחלוטין, אך הן אחידות יותר בנושאן. זה מקטין את ההשפעה של משמעות־התוכן על הדירוגים ומגביר את הסבירות שההבדלים במשפטי אנשים נובעים מתכונות ויזואליות כמו צבע, אור ומבנה.
המצאת כלי ליצירת יופי ומכוערות לפי דרישה
גם עם סינון זה בקפדנות, אוסף ההתחלתי נטה לתמונות נאותות מראה. כדי להשיג הבנה מדעית טובה של היופי, החוקרים זקוקים לדוגמאות רבות הפזורות באופן שווה מטווח מכוער עד יפה מאוד. לכן הקבוצה בנתה תוכנית עריכה פשוטה שכונתה "המאכסה" (Uglifier). ארבעים מתנדבים השתמשו בה כדי לדחוף תמונות נבחרות לשני כיוונים: להפוך אותן ליפות ככל האפשר או למכוערות ככל האפשר, באמצעות כוונון מחווני בהירות, ניגודיות, תערובת צבעים, חדות, רעש, חיתוך ועוד כמה טרנספורמציות מתקדמות. החוקרים גם תעדו חלק ממתכוני העריכה הללו והחילו אותם אוטומטית על תמונות אחרות, והוסיפו אצווה גדולה של וריאנטים "מכווצים" אוטומטית. כך נוצר מגוון רחב של תמונות מקוריות, משופרות, מעוותות באופן מכוער ומעוותות באופן אוטומטי.
לבקש מאלפים להצביע בעזרת העיניים
בהמשך פנו המחברים לפלטפורמת המונים שמשולבת במשחק מקוון, וגייסו יותר מעשרת אלפים שחקנים ברחבי העולם. כל תמונה בערכת ה-MSC הוצגה למאה צופים לא־מומחים שונים, שדרגו את יופיה בסולם פשוט של חמש נקודות מהכי מכוער עד הכי יפה. דוגמאות אימון בקצוות עזרו לאנשים להשתמש בכל טווח הסולמות. בדיקות איכות קפדניות הסירו שחקנים שנראו לוחצים באקראי. התוצאה הסופית היא אוסף תמונות שבו כל סצנה מגובה בהיסטוריית דירוגים עשירה, ושבו תמונות מכוערות, ממוצעות ויפות מיוצגות היטב במקום שתמצופת באמצע.
מה זה מגלה על יופי ומבנה חזותי
עם מאגר מאוזן זה ביד, בדקו החוקרים כיצד עשרות תכונות בסיסיות של תמונה — כגון ניגודיות, שונות צבע, צפיפות קצוות, סימטריה ומרקם בדומה לפרקטל — מתקשרות לציוני יופי. הם מצאו שכאשר הציונים מפוזרים באופן שווה לאורך טווח המכוער–יפה, הקשרים בין תכונות ברמה הנמוכה לבין שיפוטי אנשים מתבהרים ולעיתים מתעצמים. במקרים מסוימים, כיוון הקשר אף היפך לעומת מה שנצפה במאגרים ישנים ומוטים. הם גם בדקו האם ה-Uglifier ייצר סוג צר ומלאכותי של מכוערות; במקום זאת, התמונות הערוכות שיתפו סטטיסטיקה בסיסית דומה עם המקוריות בעלי דירוג נמוך באופן טבעי, מה שמרמז שהמניפולציות תפסו נטיות חזותיות אמיתיות ולא קיצוניות מצונזרות.

מדוע זה חשוב להבנת הטעם
לקורא כללי, המסקנה היא שמדענים יכולים עכשיו לחקור טעם חזותי באופן נקי יותר. מאגר ה-MSC מציע עולם של סצנות שקטות, ברובן טבעיות, שבהן יופי ומכוערות תלוים בעיקר באופן בו הדברים נראים, לא במה או במי שהם מייצגים. זה יוצר סביבת ניסוי חזקה לפסיכולוגיה, לנוירו-מדע ולמחקר בבינה מלאכותית שמטרתו לחזות העדפה אסתטית מתוך מבנה התמונה בלבד. אחר כך ניתן להוסיף בהדרגה משמעות מורכבת יותר והקשרים תרבותיים. על ידי התחלה בתמונות שאומרות מעט ונראות שונות מאוד זו מזו, פרויקט ה-MSC מסייע להבהיר כמה ממערכת תחושת היופי שלנו נובעת מהעין לפני שהמוח מוסיף את הסיפורים שלו.
ציטוט: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0
מילות מפתח: אסתטיקה חזותית, מאגר תמונות, דירוגים המופקים מהציבור, יופי חישובי, מרקמים טבעיים