Clear Sky Science · he

מודל להערכת אמנות שנוצרה על ידי בינה מלאכותית המשלב אסתטיקה חישובית ופסיכולוגיה קוגניטיבית

· חזרה לאינדקס

מדוע חשוב לשפוט אמנות שנוצרה על ידי AI

כשמערכות בינה מלאכותית ממלאות את המסכים שלנו בציורים, תמונות ועיצובים, עדיין איננו מבינים במלואן כיצד בני אדם מחליטים אם אמנות שמיוצרת על ידי מכונה היא יפה, או כיצד מחשבים יכולים לחלוק על כך באופן משמעותי. המחקר הזה בונה גשר בין האופן שבו פסיכולוגים סבורים שהמוח מגיב לאמנות ובין האופן שבו מודלים של בינה מלאכותית מדרגים תמונות, במטרה לעשות את דירוגי האמנות האוטומטיים קרובים יותר לחוויה האנושית וברי-הסבר.

חיבור בין תחושות אנושיות לציונים מכניים

מרבית מערכות דירוג התמונות הקיימות מתייחסות ליופי כמספר תיבה שחורה. לעומת זאת, עבודה זו מתחילה מהרעיונות המוכרים בפסיכולוגיה: אנשים אוהבים תמונות שקל לעבד, שיש להן מבנה ברור, ושמאוזנות בין היכרות לחידוש. המחבר הופך רעיונות אלה למודל שלב-אחר-שלב שבא לידי חיקוי איך צופים עוברים מראייה גולמית לתחושה כוללת לגבי תמונה. העיצוב משלב ארגון חזותי בסיסי, מדד לקושי הפרשנות של התמונה ושני מסלולים נפרדים לקבלת שיפוט במהירות או באיטיות.

Figure 1. כיצד בני אדם ובינה מלאכותית משתווים כששופטם את היופי של תמונות אמנות שנוצרו על ידי AI.
Figure 1. כיצד בני אדם ובינה מלאכותית משתווים כששופטם את היופי של תמונות אמנות שנוצרו על ידי AI.

כיצד המודל החדש פועל מבפנים

המודל קודם כל מארגן כל תמונה לאזורים משמעותיים, מהדהד את האופן שבו עינינו מפרידות דמות מרקע ושמות לב לדמיון, לקיבוצים ולצורות שלמות. בהמשך הוא מעריך עד כמה קל לעבד את התמונה על ידי שילוב עומס חזותי, היכרות עם דפוסים נעימים טיפוסיים ורמת החידוש, המכוונת כך שהפתעה מתונה מועדפת על שעמום או בלבול. בנוסף לכך, המודל מריץ בו-זמנית שני מסלולים: מסלול מהיר שתופס את המראה והמצב הרוח הכלליים בשבריר שניה, ומסלול איטי שבוחן פרטים מקומיים, מרקמים ותוכן ביתר הקפדה לפני שאוחדו הכל לציון אסתטי סופי.

בדיקת המודל מול אנשים

כדי לבדוק אם חישובים אלה אכן תואמים לחוויה האנושית, המחקר גייס 120 מתנדבים ברמות ידע שונה באמנות. הם צפו ביצירות אדם וביצירות שנוצרו על ידי AI שנעו מפשוטות עד צפופות חזותית, דירגו עד כמה אהבו אותן ומילאו שאלוני עומס עבודה המתארים עד כמה כל צפייה הרגישה תובענית מנטלית. מאזין עיניים הקליט היכן ולכמה זמן הביטו בחלקים שונים של כל תמונה, ודיווחים מילוליים נוספים תיעדו כיצד נימקו את בחירותיהם. תערובת עשירה זו של זמני תגובה, דפוסי מבט ודיווחים עצמיים אפשרה השוואה ישירה בין תהליכי הפנים של המודל לבין התנהגות הצפייה של האנשים.

Figure 2. כיצד מודל בינה מלאכותית מעבד יצירת אמנות דרך מסלולים חזותיים מהירים ואיטיים כדי לחזות משיכה אסתטית.
Figure 2. כיצד מודל בינה מלאכותית מעבד יצירת אמנות דרך מסלולים חזותיים מהירים ואיטיים כדי לחזות משיכה אסתטית.

מה הושג בהשוואות

דירוגי ה-AI הראו התאמה חזקה לשיפוטים האנושיים, קרובה להסכמה שנצפתה בדרך כלל בין אנשים שונים. תחזיותיו הסתדרו במיוחד עם תמונות בעלות מבנה ברור, שבהן חוקי הקיבוץ החזותי הבסיסיים בולטים ביותר. המודל גם עקב בהצלחה אחרי המאמץ המנטלי, כאשר חזה נכון אילו תמונות ירגישו תובעניות יותר לעיבוד, בעיקר במידות כמו דרישה מנטלית ומאמץ פיזי. דפוסי תנועת העיניים מתוך מפת תשומת הלב של המודל דמו למסלולי הסריקה האנושיים: שניהם התמקדו יותר באזורים חזותיים ואסתטיים חשובים, וזמני שלבי הצפייה המהירים והאיטיים הדהדו את עיצוב שני המסלולים. יחד עם זאת, המחקר מצא גם שרקע תרבותי, אסוציאציות אישיות והכשרה אמנותית מסבירים הרבה מהפערים הנותרים, ומזכירים לנו כי היופי אינו אוניברסלי עד הסוף.

מה משמעות הדבר למפגשים שלנו עם אמנות AI

לקורא הכללי, המסר המרכזי הוא שאפשר לבנות מערכות בינה מלאכותית ששופטות תמונות בדרכים שאפשר באמת לפרש, ולא רק לאמץ בעיניים עצומות. על ידי שורש כל חלק במודל ברעיונות פסיכולוגיים על תשומת לב, מאמץ, העדפה ורגש, המחקר מראה שה-AI יכול לעזור להסביר כיצד אנו חווים אמנות, גם כאשר תגובותינו מעוצבות על ידי תרבות והיסטוריה אישית. מבחינה מעשית, המסגרת יכולה להנחות מנועי המלצה, כלי למידה דיגיטליים ותצוגות בגלריות כך שיכבדו את המגבלות והטעמים האנושיים. באותו זמן, העבודה מדגישה כי ה-AI צריך להשלים, לא להחליף, את השיפוט האסתטי האנושי, ולשמש כעדשה על תודעתנו ולא כסמכות סופית לקביעת מה נחשב ליפה.

ציטוט: Jin, C. An AI-generated art evaluation model that integrates computational aesthetics and cognitive psychology. Sci Rep 16, 15309 (2026). https://doi.org/10.1038/s41598-026-42766-8

מילות מפתח: אמנות בינה מלאכותית, שיפוט אסתטי, פסיכולוגיה קוגניטיבית, מדידת תנועת עיניים, הערכת תמונה