Clear Sky Science · es
La competencia inmersiva como fuente de sesgo en la evaluación clínica en realidad virtual
Por qué los exámenes en realidad virtual pueden no ser tan justos como parecen
La realidad virtual está entrando rápidamente en hospitales y aulas, prometiendo formación y pruebas realistas sin poner en riesgo a pacientes reales. Pero este estudio plantea una pregunta crucial: cuando a la gente se la evalúa dentro de unas gafas, ¿estamos realmente midiendo sus habilidades médicas o solo lo bien que manejan la tecnología? Los investigadores muestran que una capacidad oculta que denominan competencia inmersiva puede inclinar la balanza en los exámenes virtuales, con consecuencias importantes para la enseñanza y la atención al paciente.
Aprender a vivir dentro de unas gafas
La competencia inmersiva es la habilidad práctica para moverse, agarrar y controlar objetos en un mundo virtual. Incluye usar controladores manuales, entender el espacio 3D y manejar menús y retroalimentación poco familiares. Muchas herramientas de RV suponen que los usuarios «lo entenderán» por sí mismos, pero eso favorece a quienes ya juegan videojuegos o trabajan con software 3D. En medicina y atención sanitaria, donde la RV se usa ahora para evaluar a estudiantes e incluso aportar diagnósticos, esta ventaja oculta puede difuminar la línea entre la verdadera destreza clínica y la soltura tecnológica. Sin embargo, revisiones previas de exámenes basados en RV casi nunca habían comprobado esta fuente de sesgo.

Una prueba directa de habilidades en RV y rendimiento médico
Para investigar este asunto, el equipo realizó un ensayo aleatorizado con 94 estudiantes de medicina avanzados, de los cuales 88 completaron el estudio. Los estudiantes se asignaron a uno de tres grupos. Un grupo recibió entrenamiento general en RV con tareas abstractas, como agarrar objetos flotantes o sortear obstáculos. Un segundo grupo recibió tanto ese entrenamiento general como una ronda extra de práctica dentro de la misma simulación de urgencias que luego se usó en la prueba. Un tercer grupo solo tuvo una breve familiarización con los controles, similar a lo que muchos sistemas de RV ofrecen hoy, antes de enfrentarse al escenario clínico completo: manejar a un paciente virtual con shock séptico.
Cómo cambió la formación los resultados en la sala de urgencias virtual
El hallazgo clave fue que solo los estudiantes que practicaron en el entorno específico del examen superaron claramente al grupo control en la lista de verificación clínica, con una ventaja de moderada a grande. La práctica general con tareas abstractas de RV por sí sola no aumentó las puntuaciones de forma significativa. Estas mejoras en el rendimiento estuvieron estrechamente ligadas a la eficiencia procedimental: los estudiantes del grupo con entrenamiento combinado realizaron acciones médicas ensayadas y nuevas de forma más rápida y fluida que los demás, especialmente en tareas que no habían visto antes. En contraste, las calificaciones estándar de exámenes escritos no predijeron cómo gestionaron la urgencia en RV, lo que subraya que la medida de rendimiento virtual capturaba algo más allá del conocimiento de libro.

Esfuerzo mental, experiencia previa y desigualdades ocultas
El estudio también siguió cuánto esfuerzo mental sentían los estudiantes que estaban invirtiendo y monitorizó sus respuestas de estrés mediante conductancia de la piel. Sorprendentemente, quienes no recibieron entrenamiento especial reportaron la menor carga cognitiva durante la simulación, pero obtuvieron los peores resultados clínicos. Los estudiantes con niveles medios de esfuerzo mental informado tendieron a rendir mejor, lo que sugiere que cierta dificultad puede ser productiva cuando los usuarios están activamente comprometidos con la tarea. Sin embargo, las medidas objetivas de estrés no explicaron de forma clara las diferencias de rendimiento. La experiencia previa con aplicaciones 3D fue, en general, muy baja, lo que dificulta sacar conclusiones firmes, pero hubo indicios de que una vez superadas las barreras básicas de interacción mediante entrenamiento, los estudiantes con más experiencia digital podían beneficiarse aún más —potencialmente ampliando, no reduciendo, las brechas de rendimiento.
Diseñar mundos virtuales más justos para la salud
Más allá de los números, los estudiantes dijeron que disfrutaron del examen en RV y en general consideraron estos formatos justos, siempre que tuvieran suficiente oportunidad de practicar con el sistema. Quienes no recibieron entrenamiento específico se sintieron más distraídos por controles torpes y obstáculos en la interfaz. A partir de estos resultados, los autores sostienen que la competencia inmersiva debería tratarse como un factor medible y entrenable que puede sesgar los resultados si se ignora. Proponen tres líneas de defensa: crear interfaces más intuitivas e inclusivas; revisar rutinariamente los datos de rendimiento en busca de señales de ventaja digital; y o bien formar a los usuarios de manera estandarizada o corregir estadísticamente sus habilidades en RV al interpretar las puntuaciones.
Qué significa esto para pacientes y aprendices
Para un lector no especializado, la conclusión es clara: cuando trasladamos decisiones cruciales a espacios virtuales —ya sea calificar a futuros médicos o evaluar el pensamiento y movimiento de un paciente— debemos asegurarnos de que no estamos simplemente calificando lo cómodas que se sienten las personas dentro de unas gafas. Este estudio muestra que una práctica breve y específica en el entorno real de RV puede mejorar el rendimiento de forma significativa, pero también puede amplificar fortalezas digitales preexistentes si no se diseña con cuidado. Considerar la competencia inmersiva como una parte central de la equidad en salud digital puede ayudar a garantizar que las herramientas de RV sean ayudas para una evaluación justa y una mejor atención, y no nuevas fuentes de sesgo oculto.
Cita: Schaal, J., Leutritz, T., Lindner, M. et al. Immersive competence as a source of bias in virtual reality clinical assessment. npj Digit. Med. 9, 280 (2026). https://doi.org/10.1038/s41746-026-02482-z
Palabras clave: evaluación en realidad virtual, competencia inmersiva, educación médica, equidad en salud digital, entrenamiento con simulación