Clear Sky Science · de
Kognitive Modelle ermöglichen Echzeit‑Schlussfolgerungen über latente Motive
Warum das Erraten verborgener Ziele wichtig ist
Jeden Tag lesen Sie stillschweigend die Absichten der Menschen um Sie herum — ob ein Fahrer gleich in Ihre Spur wechseln will, ein Radfahrer anhalten wird oder ein Kollege helfen oder konkurrieren möchte. Diese Sekundenbruchteile an Urteil beruhen darauf, verborgene Motive aus sichtbaren Bewegungen zu interpretieren. Die heutige künstliche Intelligenz kann bei Vorhersagen äußerst genau sein, agiert aber oft als „Black Box“, die nicht erklärt, warum sie eine Entscheidung getroffen hat. Diese Studie untersucht, ob psychologische Modelle menschlichen Verhaltens der KI ein menschlicheres Gespür für die Motive anderer geben können, sodass sie schneller, genauer und leichter zu vertrauen ist.
Ein einfaches Spiel aus Jagen und Ausweichen
Zur Untersuchung bauten die Forschenden ein reduziertes Videospiel. In jeder 10‑Sekunden‑Runde steuerte ein menschlicher Spieler ein dreieckiges „Schiff“ mit einem Joystick, während ein computergesteuertes Schiff sich nach einem von mehreren Mustern bewegte. Dem Menschen wurde heimlich eines von drei Zielen zugewiesen: Angreifen (mit dem anderen Schiff kollidieren), Ausweichen (großen Abstand halten) oder Inspektieren (in der Nähe bleiben, ohne zu kollidieren). Das Computer‑Schiff konnte aggressiv, schüchtern, neugierig, defensiv oder ziellos umherschweifen. Diese Kombinationen erzeugten Situationen, in denen sich die Bewegungen entweder deckten oder widersprachen — etwa ein angreifender Mensch, der ein schüchternes Computer‑Schiff verfolgt, das ständig zu fliehen versucht.

Messung, wie gut Menschen verborgene Ziele lesen
Der erste Schritt war herauszufinden, wie gut Menschen selbst Motive aus Bewegungen ablesen können. Das Team nahm Spielrunden der acht besten Piloten und verwandelte jede Runde in ein kurzes Video. Neue Freiwillige sahen diese Clips und sollten das Ziel des menschlichen Spielers — angreifen, ausweichen oder inspizieren — nach nur 1, 4, 7 oder 10 Sekunden Bewegung erraten. Über mehrere Gruppen hinweg, einschließlich Teilnehmenden mit und ohne Autismus‑Diagnose, identifizierten Menschen das Ziel in etwa zwei Dritteln der Fälle korrekt. Die Genauigkeit stieg, je mehr sie von der Runde sahen, und die Leistung war in den Gruppen ähnlich, was einen soliden menschlichen Referenzwert für den Vergleich liefert.
Ein psychologischer Bauplan der Bewegung
Anstatt rohe, videoähnliche Daten direkt in ein neuronales Netz zu füttern, entwickelten die Autorinnen und Autoren ein kognitives Modell, das die Kräfte erfasst, die die Bewegung einer Person antreiben könnten. Ihr «global‑local objective pursuit» (GLOP)‑Modell geht davon aus, dass ein Spieler mehrere Einflüsse gleichzeitig ausbalanciert: einen bevorzugten Abstand zum Gegner halten (zu nah ist gefährlich, zu weit verpasst Chancen), gute Positionen auf dem Bildschirm einnehmen statt in einer Ecke gefangen zu sein, und das Tempo und die Richtung des anderen Schiffs anpassen oder antizipieren. Diese Faktoren werden zu einer einzigen „motivationalen“ Bewegungsrichtung kombiniert, mit zusätzlichen Termen, die widerspiegeln, wie geschmeidig sich Menschen bewegen und wie viel Zufälligkeit in ihrer Steuerung steckt.

Der KI beibringen, aus Bewegung zu „lesen“
Um dieses Modell in Echtzeit nutzbar zu machen, simulierten die Forschenden 100.000 Spielrunden mit vielen verschiedenen GLOP‑Parameter‑Einstellungen. Dann trainierten sie ein rekurrentes neuronales Netz, das Positionssequenzen der Schiffe einliest und schnell die verborgenen Parameter schätzt — zum Beispiel den bevorzugten Abstand oder wie stark jemand die globale Position gewichtet. Dieses Netz konnte mehrere Schlüsselfaktoren sehr genau bereits aus wenigen Sekunden Bewegung rekonstruieren. Anschließend trainierten sie eine Reihe von Klassifizierern, um das Ziel des Spielers auf drei verschiedene Arten zu erraten: direkt aus rohen Positionsdaten, aus einfachen Zusammenfassungsstatistiken (wie durchschnittlicher Abstand und Annäherung versus Ausweichen) oder aus den vom kognitiven Modell inferierten Parametern. Schließlich bauten sie „Ensemble“‑Klassifizierer, die diese Quellen kombinierten.
Den menschlichen Referenzwert übertreffen
Alle KI‑Klassifizierer erreichten das menschliche Niveau oder übertrafen es, doch wie die Informationen aufbereitet wurden, spielte eine Rolle. Netze, die nur auf rohe Bewegungsdaten oder ausschließlich auf Modellparameter vertrauten, schnitten ähnlich wie Menschen ab, bei etwa 66 % Genauigkeit. Klassifizierer, die einfache Zusammenfassungsstatistiken nutzten, waren besser, und die besten Ergebnisse erzielten jene, die diese Statistiken mit den Parametern des kognitiven Modells kombinierten, und erreichten rund 72 % Genauigkeit. Diese modellgestützten Systeme lernten außerdem schneller und stabiler als solche, die nur Rohdaten erhielten. Verfolgte man die Genauigkeit im Verlauf jeder Runde, konnte die KI ihre Vermutung über das verborgene Ziel eines Spielers in weniger Zeit aktualisieren als die Zwischenzeit zwischen Bildschirminfos, also effektiv in Echtzeit.
Was das für den Alltag mit KI bedeutet
Für Laien lautet die Erkenntnis: Psychologische Theorie in die KI einzubetten, kann Maschinen helfen, nicht nur zu verstehen, was Menschen tun, sondern warum sie es tun. Indem unordentliche Bewegungen in eine kleine Menge interpretierbarer Motive übersetzt werden — etwa wie nah jemand sein möchte oder wie er Sicherheit gegen Gelegenheit abwägt — wird das System sowohl genauer als auch leichter erklärbar. In zukünftigen Anwendungen wie selbstfahrenden Autos oder Mensch–KI‑Teams könnte eine solche „kognitive Front“ der KI helfen, die Absichten anderer Akteure früher und verlässlicher vorherzusagen, womöglich Kollisionen und Missverständnisse zu verhindern und gleichzeitig menschenfreundliche Erklärungen zu liefern wie „der andere Fahrer versucht wahrscheinlich einzuscheren, nicht nur zu schlingern.“
Zitation: Fitch, A.K., Kvam, P.D. Cognitive models facilitate real-time inference of latent motives. Sci Rep 16, 6444 (2026). https://doi.org/10.1038/s41598-026-37587-8
Schlüsselwörter: Theorie des Geistes, kognitive Modellierung, Absichtsschluss, Mensch–KI‑Interaktion, erklärbare KI