Clear Sky Science · pl

Model oceny dzieł sztuki generowanych przez AI łączący estetykę obliczeniową z psychologią poznawczą

2026-04-01 · Powrót do spisu

Dlaczego ważne jest ocenianie sztuki tworzonej przez AI

W miarę jak systemy AI zalewają nasze ekrany obrazami — malowidłami, zdjęciami i projektami — wciąż nie rozumiemy w pełni, jak ludzie decydują, czy dzieło stworzone przez maszynę jest piękne, ani jak komputery mogłyby sensownie współdziałać w tym zadaniu. To badanie buduje pomost między tym, jak psychologowie rozumieją reakcję umysłu na sztukę, a sposobem, w jaki modele AI oceniają obrazy, z celem tworzenia automatycznych ocen bardziej zgodnych z ludzkim doświadczeniem i łatwiejszych do zrozumienia.

Łączenie ludzkich odczuć z wynikami maszyn

Większość istniejących systemów oceny obrazów traktuje piękno jak czarną skrzynkę — jedną liczbę. W przeciwieństwie do tego, ta praca wychodzi od dobrze znanych koncepcji z psychologii: ludzie lubią obrazy, które łatwo przetworzyć, które mają wyraźną strukturę i które równoważą znajomość z nowością. Autor przekuwa te idee w krok po kroku model AI, który naśladuje sposób, w jaki widzowie przechodzą od surowego wzroku do ogólnego odczucia względem obrazu. Projekt łączy podstawową organizację wizualną, miarę trudności interpretacji obrazu oraz dwa różne szlaki podejmowania oceny — szybki i wolny.

Figure 1. Jak ludzie i sztuczna inteligencja porównują się podczas oceniania piękna obrazów wygenerowanych przez AI.

Jak nowy model oceny działa od środka

Model najpierw organizuje każdy obraz w znaczące regiony, naśladując sposób, w jaki nasze oczy oddzielają figurę od tła i zauważają podobieństwa, grupowania oraz kompletne kształty. Następnie szacuje, jak łatwy jest obraz do przetworzenia, łącząc miary wizualnego bałaganu, znajomości typowych przyjemnych wzorców i poziomu nowości, dostrojone tak, by umiarkowane zaskoczenie było preferowane nad nudą czy dezorientacją. Ponadto model uruchamia jednocześnie dwa szlaki: szybki, który uchwyca ogólny wygląd i nastrój w ułamku sekundy, oraz wolniejszy, który dokładniej bada lokalne szczegóły, tekstury i treść, zanim wszystko zostanie połączone w końcowy wynik estetyczny.

Testowanie modelu z udziałem ludzi

Aby sprawdzić, czy te obliczenia rzeczywiście odpowiadają ludzkim doświadczeniom, badanie zrekrutowało 120 ochotników o różnym stopniu znajomości sztuki. Oglądali oni zarówno dzieła stworzone przez ludzi, jak i wygenerowane przez AI, o zróżnicowanym stopniu prostoty i gęstości wizualnej, oceniali, na ile im się podobają, oraz wypełniali ankiety obciążenia poznawczego opisujące, jak wymagające mentalnie było każde oglądanie. Urządzenie śledzące ruch oczu rejestrowało, gdzie i jak długo patrzyli na różne części obrazu, a dodatkowe raporty słowne uchwyciły, jak uzasadniali swoje wybory. To bogate połączenie czasów reakcji, wzorców spojrzeń i samoopisów pozwoliło na bezpośrednie porównanie wewnętrznych mechanizmów modelu z rzeczywistym zachowaniem widzów.

Figure 2. Jak model AI przetwarza dzieło sztuki przez szybkie i wolne szlaki wzrokowe, by przewidzieć atrakcyjność estetyczną.

Co ujawniły porównania

Oceny AI wykazały silne dopasowanie do ludzkich osądów, zbliżone do zgodności zazwyczaj obserwowanej między różnymi osobami. Jej przewidywania szczególnie dobrze pokrywały się w przypadku obrazów o wyraźnej strukturze, gdzie podstawowe reguły grupowania wizualnego są najbardziej oczywiste. Model skutecznie śledził również wysiłek poznawczy, poprawnie przewidując, które obrazy będą odczuwane jako bardziej wymagające w przetworzeniu, zwłaszcza w miarach takich jak obciążenie poznawcze i zmęczenie fizyczne. Wzorce ruchu oczu pochodzące z map uwagi modelu przypominały ludzkie ścieżki skanowania: oba skupiały się bardziej na wizualnie i estetycznie ważnych regionach, a czasowanie faz szybkiego i wolnego oglądania odzwierciedlało koncepcję dwóch szlaków. Jednocześnie badanie wykazało, że pochodzenie kulturowe, osobiste skojarzenia i wykształcenie artystyczne wyjaśniają wiele pozostałych rozbieżności, przypominając nam, że piękno nigdy nie jest całkowicie uniwersalne.

Co to oznacza dla naszych spotkań ze sztuką AI

Dla ogólnego czytelnika kluczowy wniosek jest taki, że możliwe jest zbudowanie systemów AI, które oceniają obrazy w sposób, który możemy naprawdę interpretować, a nie tylko ślepo ufać wynikowi. Zakorzenienie każdego elementu modelu w psychologicznych pojęciach dotyczących uwagi, wysiłku, preferencji i emocji pokazuje, że AI może pomóc wyjaśnić, jak doświadczamy sztuki, nawet jeśli nasze reakcje kształtują kultura i osobista historia. W praktyce ramy te mogą kierować silnikami rekomendacji, cyfrowymi narzędziami edukacyjnymi i ekspozycjami w galeriach, tak aby respektowały ludzkie ograniczenia i gusta. Jednocześnie praca podkreśla, że AI powinna uzupełniać, a nie zastępować, ludzki osąd estetyczny — służąc jako soczewka na nasz umysł, a nie ostateczny autorytet określający, co jest piękne.

Cytowanie: Jin, C. An AI-generated art evaluation model that integrates computational aesthetics and cognitive psychology. Sci Rep 16, 15309 (2026). https://doi.org/10.1038/s41598-026-42766-8

Słowa kluczowe: sztuka AI, osąd estetyczny, psychologia poznawcza, śledzenie ruchu oczu, ocena obrazu