Clear Sky Science · es

Modelos cognitivos facilitan la inferencia en tiempo real de motivos latentes

2026-01-28 · Volver al índice

Por qué importa adivinar objetivos ocultos

Cada día, lees en silencio las intenciones de las personas a tu alrededor: si un conductor va a incorporarse a tu carril, si un ciclista se va a detener, o si un compañero intenta ayudar o competir. Estos juicios de fracciones de segundo se basan en interpretar motivos ocultos a partir de movimientos visibles. La inteligencia artificial actual puede ser extremadamente precisa en la predicción, pero a menudo actúa como una “caja negra” que no puede explicar por qué tomó una decisión. Este estudio pregunta si los modelos psicológicos del comportamiento humano pueden dar a la IA una sensación más humana de los motivos ajenos, haciéndola más rápida, más precisa y más fácil de confiar.

Un juego simple de perseguir y esquivar

Para explorar esto, los investigadores construyeron un videojuego depurado. En cada ronda de 10 segundos, un jugador humano dirigía una “nave” triangular con un joystick mientras una nave controlada por ordenador se movía según uno de varios patrones. Al humano se le asignaba en secreto uno de tres objetivos: Atacar (colisionar con la otra nave), Evitar (mantenerse lejos) o Inspeccionar (mantenerse cerca sin colisionar). La nave del ordenador podía comportarse de forma agresiva, tímida, curiosa, defensiva o simplemente errante. Estas combinaciones creaban situaciones en las que los movimientos de las naves se alineaban o entraban en conflicto —por ejemplo, un humano atacante persiguiendo a un ordenador tímido que seguía intentando huir.

Medir cuán bien los humanos leen objetivos ocultos

El primer paso fue averiguar qué tan bien las personas pueden leer motivos a partir del movimiento. El equipo tomó partidas de los ocho mejores pilotos de la nave y convirtió cada ronda en un video corto. Nuevos voluntarios vieron estos clips y tuvieron que adivinar el objetivo del jugador humano —atacar, evitar o inspeccionar— tras ver solo 1, 4, 7 o 10 segundos de movimiento. En varios grupos, incluidos participantes con y sin diagnóstico de autismo, las personas identificaron correctamente el objetivo en aproximadamente dos tercios de los casos. La precisión aumentó a medida que veían más de la ronda, y el desempeño fue similar entre los grupos, proporcionando un sólido punto de referencia humano para la comparación.

Un plano psicológico para el movimiento

En lugar de alimentar datos de video sin procesar directamente a una red neuronal, los autores construyeron un modelo cognitivo para capturar las fuerzas que podrían impulsar el movimiento de una persona. Su modelo de “persecución de objetivos global-local” (GLOP) asume que un jugador equilibra varias fuerzas a la vez: mantener una distancia preferida del oponente (estar demasiado cerca resulta peligroso, demasiado lejos pierde oportunidades), situarse en buenas posiciones en la pantalla en lugar de quedar atrapado en una esquina, y igualar o anticipar el ritmo y la dirección de la otra nave. Estos factores se combinan en una única dirección “motivacional” de movimiento, con términos adicionales para reflejar qué tan suavemente se mueve la gente y cuánta aleatoriedad hay en su control.

Enseñar a la IA a leer mentes a partir del movimiento

Para que este modelo fuera útil en tiempo real, los investigadores simularon 100 000 rondas de juego usando muchos ajustes diferentes de los parámetros de GLOP. Después entrenaron una red neuronal recurrente para que tomara secuencias de posiciones de las naves y estimara rápidamente los parámetros ocultos —como la distancia preferida o cuán fuertemente alguien valora la posición global. Esta red pudo recuperar varios parámetros clave con mucha precisión a partir de apenas unos segundos de movimiento. A continuación, entrenaron un conjunto de redes clasificadoras para adivinar el objetivo del jugador de tres maneras diferentes: directamente desde datos de posición en bruto, a partir de estadísticas resumen simples (como distancia media y acercamiento frente a evitación), o a partir de los parámetros inferidos por el modelo cognitivo. Finalmente, construyeron clasificadores “en conjunto” que combinaban estas fuentes.

Superando el referente humano

Todas las clasificadoras de IA igualaron o superaron el rendimiento humano, pero importaba cómo se preparó la información para ellas. Las redes que dependían solo del movimiento en bruto o solo de los parámetros del modelo rindieron de forma similar a las personas, con aproximadamente un 66% de acierto. Las clasificadoras que recibieron estadísticas resumen simples lo hicieron mejor, y los mejores resultados provinieron de combinar esas estadísticas con los parámetros del modelo cognitivo, alcanzando alrededor de un 72% de precisión. Estos sistemas informados por el modelo también se entrenaron más rápido y con mayor estabilidad que los alimentados solo con datos sin procesar. Cuando se siguió la precisión momento a momento durante cada ronda, la IA pudo actualizar su conjetura sobre el objetivo oculto de un jugador en menos que el tiempo entre refrescos de pantalla, infiriendo efectivamente la intención en tiempo real.

Qué significa esto para la IA cotidiana

Para un público general, la conclusión es que incorporar teoría psicológica en la IA puede ayudar a las máquinas a entender no solo qué hacen las personas, sino por qué lo hacen. Al traducir movimientos desordenados en un pequeño conjunto de motivos interpretables —como cuán cerca quiere estar alguien o cómo prioriza seguridad frente a oportunidad—, el sistema se vuelve tanto más preciso como más fácil de explicar. En aplicaciones futuras, como coches autónomos o equipos humano–IA, este tipo de “frontal cognitivo” podría ayudar a la IA a anticipar antes y con mayor fiabilidad las intenciones de otros agentes, previniendo potencialmente colisiones y malentendidos, a la vez que ofrece explicaciones comprensibles para humanos como “el otro conductor probablemente intenta incorporarse, no solo se está desviando”.

Cita: Fitch, A.K., Kvam, P.D. Cognitive models facilitate real-time inference of latent motives. Sci Rep 16, 6444 (2026). https://doi.org/10.1038/s41598-026-37587-8

Palabras clave: teoría de la mente, modelado cognitivo, inferencia de intenciones, interacción humano–IA, IA explicable