Clear Sky Science · es
El papel de la diagnosticidad al juzgar la competencia de los robots
Por qué los fallos de los robots nos importan a todos
Los robots y los sistemas de IA están saliendo con rapidez de los laboratorios hacia fábricas, hospitales y nuestras calles. A medida que empezamos a depender de ellos, surge una pregunta crucial: ¿cómo decide la gente si un robot es realmente competente? Este artículo explora cómo juzgamos a un robot que suele funcionar bien pero que de vez en cuando comete un error sorprendente—o consigue un éxito inesperado. Los hallazgos ayudan a explicar por qué nuestras "corazonadas" sobre las máquinas pueden diferir de lo que decimos en voz alta y por qué un único error puede ser descartado con un encogimiento de hombros o cambiar nuestra confianza de forma permanente.
Dos modos en que nuestra mente juzga a las máquinas
Los psicólogos distinguen entre dos tipos de impresiones. Las impresiones explícitas son los juicios que podemos reportar directamente cuando se nos pregunta, como evaluar a un robot en una escala de competencia de 1 a 7. Las impresiones implícitas son más automáticas y se reflejan en respuestas rápidas que la gente hace sin centrarse en la evaluación. Trabajos anteriores sugirieron que las impresiones explícitas cambian con rapidez cuando vemos un nuevo comportamiento, mientras que las impresiones implícitas se mueven más lentamente. Este estudio pregunta si esa diferencia se debe realmente a sistemas mentales distintos—o si depende de lo informativo, o diagnóstic o, que parezca el nuevo comportamiento sobre las habilidades reales del robot.

Desde las plantas de producción hasta los quirófanos y las autopistas
En nueve experimentos en línea con más de 3.700 participantes, los investigadores mostraron a la gente distintos robots trabajando en entornos realistas: un robot industrial navegando por un almacén concurrido, un robot quirúrgico trazando rutas precisas y un coche autónomo reaccionando ante obstáculos en la carretera. A veces el robot era consistentemente hábil o consistentemente torpe. En otros casos, era mayormente competente pero cometía un único error claro, o mayormente incompetente pero lograba un éxito destacado. Tras ver secuencias breves de estas actuaciones, las impresiones de los participantes se midieron de dos maneras: preguntas directas de autoinforme y tareas indirectas que captaban reacciones rápidas y automáticas.
Cuando una actuación extraña domina la percepción
En estos escenarios realistas, las valoraciones explícitas de los robots por parte de la gente seguían tanto el patrón general de rendimiento como el ensayo “raro” y poco frecuente. Un único error entre muchos éxitos podía reducir notablemente las valoraciones explícitas, y un único éxito entre muchos fracasos podía aumentarlas. Sin embargo, las impresiones implícitas contaron otra historia. Respondieron con fuerza al comportamiento típico del robot—si normalmente era competente o no—pero en gran medida ignoraron el único ensayo atípico. Esta disociación persistió incluso cuando los investigadores rediseñaron cuidadosamente sus medidas para que las tareas “explícitas” e “implícitas” parecieran y se sintieran lo más similares posible, diferenciándose principalmente en si a los participantes se les decía que evaluaran al robot deliberadamente.
Qué hace que el error de un robot sea realmente revelador
El equipo probó después una idea clave: que el impacto de un evento atípico depende de lo diagnóstic o que parezca—si la gente piensa que realmente revela algo duradero sobre el robot. En nuevos estudios, los participantes vieron primero a un robot realizar varias pruebas impecables y, más tarde, observaron una o varias fallas. Cuando las fallas posteriores se enmarcaban como importantes, pruebas recientes, o cuando varias fallas se acumulaban para igualar la cantidad de éxitos previos, tanto las impresiones explícitas como las implícitas cambiaron. De forma crucial, en estas condiciones de alta diagnosticidad incluso un único error bastó para mover las impresiones automáticas e implícitas. Cuando el mismo tipo de desliz se describía como obsoleto, poco importante o una anomalía aislada, las impresiones implícitas apenas se inmutaban, aunque las valoraciones explícitas sí se movían.

Por qué esto importa para la confianza cotidiana en la IA
En conjunto, los hallazgos sugieren que nuestras impresiones rápidas y automáticas sobre la competencia de los robots no son impermeables a la información nueva, pero exigen pruebas más fuertes o claramente significativas antes de cambiar. Nuestras valoraciones verbales, en contraste, son muy sensibles incluso a eventos débiles o ambiguos, en parte porque sentimos presión por usar la información que tenemos cuando alguien nos pide un juicio. Para diseñadores, ingenieros y responsables políticos, esto significa que gestionar la confianza en los robots no consiste solo en reducir los errores, sino también en cómo se enmarcan y entienden esos errores. Un único fallo altamente revelador—como un coche que no frena cuando claramente debería—puede remodelar tanto nuestras corazonadas como nuestras opiniones expresadas, con consecuencias directas para nuestra disposición a adoptar y confiar en las máquinas inteligentes.
Cita: Surdel, N., Ferguson, M.J. The role of diagnosticity in judging robot competence. Sci Rep 16, 7578 (2026). https://doi.org/10.1038/s41598-026-35375-y
Palabras clave: competencia de los robots, interacción humano-robot, sesgo implícito, confianza en la IA, información diagnóstica