Clear Sky Science · de
Immersive Kompetenzen als Quelle von Verzerrungen bei klinischen Bewertungen in virtueller Realität
Warum virtuelle Prüfungen nicht so fair sein könnten, wie sie scheinen
Virtuelle Realität zieht schnell in Krankenhäuser und Klassenzimmer ein und verspricht realitätsnahe Ausbildung und Prüfung, ohne echte Patientinnen und Patienten zu gefährden. Diese Studie stellt jedoch eine zentrale Frage: Messen wir in einem Headset wirklich medizinische Fähigkeiten — oder nur, wie gut jemand mit der Technik umgehen kann? Die Forschenden zeigen, dass eine verborgene Fähigkeit, die sie als immersive Kompetenz bezeichnen, die Wettbewerbsbedingungen in virtuellen Prüfungen verzerren kann, mit wichtigen Konsequenzen für Ausbildung und Patientenversorgung.
Das Leben im Headset erlernen
Immersive Kompetenz ist das praktische Gespür dafür, sich in einer virtuellen Welt zu bewegen, Dinge zu greifen und zu steuern. Dazu gehört die Handhabung von Controllern, das Verständnis des 3D-Raums sowie der Umgang mit ungewohnten Menüs und Rückmeldungen. Viele VR-Tools gehen davon aus, dass Nutzende das einfach „herausfinden“ — das begünstigt jedoch Menschen, die bereits Videospiele spielen oder mit 3D-Software arbeiten. In der Medizin und Gesundheitsversorgung, wo VR inzwischen zur Bewertung von Studierenden und sogar zur Diagnostik eingesetzt wird, kann dieser verborgene Vorteil die Grenze zwischen echter klinischer Kompetenz und bloßer Technikaffinität verwischen. Frühere Übersichtsarbeiten zu VR-basierten Prüfungen hatten diese Fehlerquelle fast nie überprüft.

Ein direkter Vergleich von VR-Fertigkeiten und medizinischer Leistung
Um dieses Problem zu untersuchen, führte das Team eine randomisierte kontrollierte Studie mit 94 fortgeschrittenen Medizinstudierenden durch, von denen 88 die Studie abschlossen. Die Studierenden wurden einer von drei Gruppen zugeteilt. Eine Gruppe erhielt allgemeines VR-Training mit abstrakten Aufgaben wie dem Greifen schwebender Objekte oder dem Navigieren um Hindernisse. Eine zweite Gruppe erhielt sowohl dieses allgemeine Training als auch eine zusätzliche Übungsrunde innerhalb der exakten Notaufnahme-Simulation, die später im Test verwendet wurde. Eine dritte Gruppe bekam nur eine kurze Vertrautmachung mit den Steuerungen — ähnlich dem, was viele VR-Systeme aktuell anbieten — bevor sie das volle klinische Szenario versuchten: die Versorgung einer virtuellen Patientin/eines virtuellen Patienten im septischen Schock.
Wie Training die Ergebnisse in der virtuellen Notaufnahme veränderte
Das zentrale Ergebnis war, dass nur die Studierenden, die in der spezifischen Prüfungsumgebung geübt hatten, die Kontrollgruppe auf der klinischen Checkliste deutlich übertrafen — mit einem mittleren bis großen Vorteil. Allgemeines Üben mit abstrakten VR-Aufgaben allein steigerte die Punktzahlen nicht nennenswert. Diese Leistungsgewinne hingen eng mit prozeduraler Effizienz zusammen: Studierende der kombinierten Trainingsgruppe führten sowohl eingeübte als auch neue medizinische Handlungen schneller und flüssiger aus als andere, insbesondere bei Aufgaben, die sie zuvor nicht gesehen hatten. Im Gegensatz dazu sagten Standardnoten aus schriftlichen Prüfungen nicht voraus, wie gut Studierende die VR-Notfallsituation bewältigten, was unterstreicht, dass das virtuelle Leistungsmaß etwas jenseits des Buchwissens erfasste.

Mentale Anstrengung, Vorerfahrung und verborgene Ungleichheiten
Die Studie erfasste auch, wie viel mentale Anstrengung die Studierenden angaben, und überwachte ihre Stressreaktionen mittels Hautleitfähigkeit. Überraschenderweise berichteten jene ohne spezielles Training die geringste kognitive Belastung während der Simulation, erreichten aber die schlechtesten klinischen Ergebnisse. Studierende mit mittlerem berichteten mentalen Aufwand schnitten tendenziell am besten ab, was darauf hindeutet, dass ein gewisser Kampf tatsächlich produktiv sein kann, wenn Nutzende aktiv in die Aufgabe eingebunden sind. Objektive Stressmaße erklärten Leistungsunterschiede jedoch nicht klar. Die Vorerfahrung mit 3D-Anwendungen war insgesamt sehr gering, was feste Schlussfolgerungen erschwert, aber es gab Hinweise, dass, sobald grundlegende Interaktionsbarrieren durch Training beseitigt sind, Studierende mit mehr digitaler Erfahrung noch stärker profitieren könnten — und damit möglicherweise Leistungsunterschiede vergrößern statt verringern.
Faire virtuelle Welten für das Gesundheitswesen gestalten
Jenseits der Zahlen berichteten Studierende, dass ihnen die VR-Prüfung Spaß gemacht habe, und sie betrachteten solche Formate generell als fair — vorausgesetzt, sie hatten ausreichend Gelegenheit, mit dem System zu üben. Ohne spezielles Training fühlten sich Teilnehmende mehr durch unbeholfene Steuerungen und Interface-Hürden abgelenkt. Auf Basis dieser Ergebnisse argumentieren die Autorinnen und Autoren, dass immersive Kompetenz als messbarer, erlernbarer Faktor behandelt werden sollte, der Ergebnisse verzerren kann, wenn man ihn ignoriert. Sie schlagen drei Gegenmaßnahmen vor: intuitivere, inklusivere Oberflächen zu bauen; routinemäßig Leistungsdaten auf Anzeichen digitaler Vorteile zu prüfen; und entweder Nutzende standardisiert zu trainieren oder ihre VR-Fähigkeiten statistisch zu korrigieren, wenn Ergebnisse interpretiert werden.
Was das für Patientinnen, Patienten und Lernende bedeutet
Für eine allgemeine Leserschaft lautet die Kernaussage klar: Wenn wir entscheidende Bewertungen in virtuelle Räume verlagern — sei es zur Benotung angehender Ärztinnen und Ärzte oder zur Untersuchung von Denken und Bewegung von Patientinnen und Patienten — müssen wir sicherstellen, dass wir nicht nur beurteilen, wie wohl sich jemand in einem Headset fühlt. Die Studie zeigt, dass kurze, gezielte Übung in der tatsächlichen VR-Umgebung die Leistung deutlich verbessern kann, aber ohne sorgfältiges Design auch bestehende digitale Stärken verstärken könnte. Immersive Kompetenz als Kernbestandteil digitaler Gesundheitsgerechtigkeit zu behandeln, kann dazu beitragen, dass VR-Tools zu Mitteln fairer Bewertung und besserer Versorgung werden, statt neue Quellen verborgener Verzerrung zu schaffen.
Zitation: Schaal, J., Leutritz, T., Lindner, M. et al. Immersive competence as a source of bias in virtual reality clinical assessment. npj Digit. Med. 9, 280 (2026). https://doi.org/10.1038/s41746-026-02482-z
Schlüsselwörter: virtuelle Realität Bewertung, immersive Kompetenz, Medizinausbildung, digitale Gesundheit Gleichheit, Simulationsschulung