Clear Sky Science · pl

Modele poznawcze ułatwiają wnioskowanie o ukrytych motywach w czasie rzeczywistym

2026-01-28 · Powrót do spisu

Dlaczego zgadywanie ukrytych celów ma znaczenie

Każdego dnia po cichu odczytujesz intencje osób wokół — czy kierowca zamierza wjechać na twój pas, czy rowerzysta się zatrzyma, czy współpracownik chce pomóc czy konkurować. Te błyskawiczne oceny opierają się na interpretowaniu ukrytych motywów na podstawie widocznych ruchów. Dzisiejsza sztuczna inteligencja potrafi być bardzo dokładna w przewidywaniach, ale często działa jak „czarna skrzynka” i nie potrafi wyjaśnić, dlaczego podjęła daną decyzję. W tym badaniu sprawdzono, czy psychologiczne modele zachowania ludzkiego mogą dać AI bardziej ludzki sposób rozumienia motywów innych — dzięki czemu byłaby szybsza, dokładniejsza i łatwiejsza do zaufania.

Prosta gra w ściganie i unikanie

Aby to zbadać, naukowcy zbudowali uproszczoną grę wideo. W każdej 10-sekundowej rundzie gracz sterował trójkątnym „statkiem” za pomocą joysticka, podczas gdy sterowany komputerowo statek poruszał się według jednego z kilku wzorców. Graczowi potajemnie przypisano jeden z trzech celów: Atak (zderzyć się z drugim statkiem), Unikaj (trzymać się daleko) lub Inspekcja (pozostać blisko bez zderzenia). Statek komputera mógł zachowywać się agresywnie, nieśmiało, ciekawsko, defensywnie lub po prostu błąkać się. Te kombinacje tworzyły sytuacje, w których ruchy statków były zgodne lub sprzeczne — na przykład atakujący gracz ścigający nieśmialy komputer, który ciągle starał się uciec.

Pomiary zdolności ludzi do odczytywania ukrytych celów

Pierwszym krokiem było sprawdzenie, jak dobrze sami ludzie potrafią czytać motywy z ruchu. Zespół wziął rozgrywki ośmiu najlepiej grających pilotów statków i przerobił każdą rundę na krótki filmik. Nowi ochotnicy oglądali te klipy i musieli odgadnąć cel gracza — atak, unikanie lub inspekcja — po zobaczeniu tylko 1, 4, 7 lub 10 sekund ruchu. W różnych grupach, w tym uczestników z diagnozą autyzmu i bez niej, ludzie poprawnie identyfikowali cel w około dwóch trzecich przypadków. Dokładność rosła w miarę oglądania większej części rundy, a wyniki były podobne między grupami, co dało solidny ludzki punkt odniesienia do porównań.

Psychologiczny plan ruchu

Zamiast wkładać surowe dane wideo bezpośrednio do sieci neuronowej, autorzy zbudowali model poznawczy, który uchwyci siły mogące napędzać czyjś ruch. Ich model „globalno-lokalne dążenie do celu” (GLOP) zakłada, że gracz równoważy jednocześnie kilka sił: utrzymanie preferowanej odległości od przeciwnika (zbyt blisko jest niebezpiecznie, zbyt daleko traci się okazje), pozostawanie na korzystnych pozycjach na ekranie zamiast utknąć w rogu oraz dopasowywanie lub przewidywanie prędkości i kierunku drugiego statku. Czynniki te łączone są w pojedynczy „motywacyjny” kierunek ruchu, z dodatkowymi terminami odzwierciedlającymi płynność ruchu i stopień losowości w kontroli.

Uczenie AI czytania umysłów z ruchu

Aby uczynić ten model użytecznym w czasie rzeczywistym, badacze zasymulowali 100 000 rund gry, używając wielu różnych ustawień parametrów GLOP. Następnie wytrenowali rekurencyjną sieć neuronową, która pobierała sekwencje pozycji statków i szybko szacowała ukryte parametry — takie jak preferowana odległość czy jak bardzo ktoś dba o globalną pozycję. Sieć potrafiła odtworzyć kilka kluczowych parametrów bardzo dokładnie już po kilku sekundach ruchu. Potem wytrenowali zestaw sieci klasyfikujących, które miały odgadnąć cel gracza na trzy różne sposoby: bezpośrednio z surowych danych pozycji, z prostych statystyk podsumowujących (jak średnia odległość czy tendencja do zbliżania się versus unikania) albo z parametrów wnioskowanych przez model poznawczy. Wreszcie zbudowali klasyfikatory „ensemble”, które łączyły te źródła.

Pokonanie ludzkiego punktu odniesienia

Wszystkie klasyfikatory AI dorównywały lub przewyższały ludzką wydajność, ale sposób przygotowania informacji miał znaczenie. Sieci opierające się tylko na surowym ruchu lub tylko na parametrach modelu osiągały wyniki podobne do ludzi, około 66% trafności. Klasyfikatory oparte na prostych statystykach radziły sobie lepiej, a najlepsze wyniki uzyskano, łącząc te statystyki z parametrami modelu poznawczego, osiągając około 72% dokładności. Systemy oparte na modelu trenowały się też szybciej i stabilniej niż te zasilane jedynie surowymi danymi. Śledząc dokładność w czasie każdej rundy, AI potrafiła zaktualizować swoje przypuszczenie dotyczące ukrytego celu gracza w czasie krótszym niż odstęp między odświeżeniami ekranu, efektywnie wnioskując intencję w czasie rzeczywistym.

Co to oznacza dla codziennej AI

Dla laika wniosek jest taki, że wplatanie teorii psychologicznej w AI może pomóc maszynom zrozumieć nie tylko co ludzie robią, ale dlaczego to robią. Przekształcając chaotyczne ruchy w mały zestaw interpretowalnych motywów — jak jak blisko ktoś chce być czy jak ktoś równoważy bezpieczeństwo z okazją — system staje się zarówno dokładniejszy, jak i łatwiejszy do wyjaśnienia. W przyszłych zastosowaniach, takich jak samochody autonomiczne czy zespoły człowiek–AI, tego rodzaju „poznawcze front-endy” mogłyby pomóc AI wcześniej i bardziej niezawodnie przewidywać intencje innych agentów, potencjalnie zapobiegając kolizjom i nieporozumieniom, a przy tym oferując przyjazne dla ludzi wyjaśnienia typu „drugi kierowca prawdopodobnie próbuje włączyć się do ruchu, a nie tylko zbacza z pasa.”

Cytowanie: Fitch, A.K., Kvam, P.D. Cognitive models facilitate real-time inference of latent motives. Sci Rep 16, 6444 (2026). https://doi.org/10.1038/s41598-026-37587-8

Słowa kluczowe: teoria umysłu, modelowanie poznawcze, wnioskowanie intencji, interakcja człowiek–AI, wyjaśnialna sztuczna inteligencja