Clear Sky Science · de
Evaluation von LingualAI: eine prospektive Validierung der KI-basierten Übersetzung in Echtzeit gegenüber zertifizierten menschlichen Dolmetschern
Sprachliche Barrieren in der Arztpraxis überbrücken
Millionen von Menschen in den Vereinigten Staaten haben Schwierigkeiten, sich mit ihren Ärzten zu verständigen, weil sie nicht fließend Englisch sprechen. Professionelle Dolmetscher können helfen, sind aber nicht immer verfügbar – insbesondere in stark frequentierten Kliniken, ländlichen Gebieten oder bei späten Terminen. Diese Studie untersucht, ob ein hausinternes telefonbasiertes Werkzeug namens LingualAI, das Echtzeit-Übersetzungen Englisch–Spanisch bietet, Gespräche zwischen Ärzten und Patienten sicher unterstützen kann, wenn ein menschlicher Dolmetscher schwer erreichbar ist.

Warum sprachliche Unterstützung für die Gesundheit wichtig ist
Mehr als 25 Millionen Menschen in den USA sprechen Englisch weniger als „sehr gut“, und diese Sprachlücke steht im Zusammenhang mit Problemen wie Missverständnissen bei Diagnosen, ausgefallenen Nachsorgeterminen und schlechteren Gesundheitsergebnissen. Forschung zeigt, dass die Versorgung sicherer und effektiver ist, wenn Patienten in ihrer bevorzugten Sprache sprechen können. Trotzdem fehlen Krankenhäusern und Kliniken oft ausreichend zertifizierte Dolmetscher, um jede Konsultation abzudecken, insbesondere in der Primärversorgung und in Notaufnahmen. Da KI-Tools immer häufiger eingesetzt werden, fragen sich Gesundheitssysteme, ob diese einen Teil dieser Lücke schließen können, ohne Patienten zu gefährden.
Wie die Forscher LingualAI getestet haben
Das Team der UTHealth Houston erstellte drei realistische Hals-Nasen-Ohren-Szenarien in Englisch und Spanisch mit vorgegebenen Dialogzeilen für eine Ärztin bzw. einen Arzt und eine Patientin bzw. einen Patienten. Muttersprachler nahmen jede Zeile auf, die dann auf zwei Arten übersetzt wurde: von zertifizierten medizinischen Dolmetschern und von LingualAI. Neun bilinguale Clinician hörten anonymisierte Audioclips, ohne zu wissen, ob sie von Menschen oder der KI stammten, und bewerteten diese auf einer Fünf-Punkte-Skala. Sie urteilten über verschiedene Qualitätsaspekte, darunter die Korrektheit medizinischer Fachbegriffe, die Verständlichkeit der Bedeutung, die Vollständigkeit der Übersetzung sowie die Natürlichkeit und kulturelle Angemessenheit der Sprache.

Was die Studie über Bedeutung und Stil ergab
Bei der wichtigsten Frage – ob die zentrale medizinische Botschaft übertragen wurde – schnitt das KI-System überraschend gut ab. Sowohl bei medizinischer Terminologie als auch bei der Gesamtbedeutung lagen die Bewertungen von LingualAI sehr nah an denen zertifizierter Dolmetscher. Die Forscher hatten im Voraus festgelegt, wie viel schlechter die KI sein durfte, um noch als „ausreichend“ zu gelten, und LingualAI erfüllte diese Grenze bei Bedeutung, Terminologie und Vollständigkeit der Botschaft. Anders gesagt: In diesen kontrollierten Tests gab das Tool meist die richtige medizinische Aussage in der passenden Sprache wieder.
Worin menschliche Dolmetscher weiterhin glänzen
Das Bild änderte sich, sobald die Hörer auf die Art der Wortübermittlung achteten. Menschliche Dolmetscher erhielten deutlich höhere Bewertungen in Grammatik, Wortwahl und kultureller Passung sowie in der Flüssigkeit, Natürlichkeit und Ausdrucksstärke der Sprache. Die Stimme der KI wirkte tendenziell mechanischer, mit ungelenken Pausen und einem flachen Ton, wodurch Zuspruch oder Empathie weniger echt erscheinen konnten. Als die Bewerter gefragt wurden, welche Version sie bevorzugten, tendierten sie stark zu menschlichen Dolmetschern in puncto Sprachfluss, Rhythmus und allgemeinem Vertrauen. Diese Unterschiede waren so deutlich, dass die KI die vorausgesetzte Norm, in diesen auf Darbietung fokussierten Bereichen „nicht schlechter als“ Menschen zu sein, nicht erreichte.
Geschwindigkeit, Kosten und ein Modell gemeinsamer Verantwortung
LingualAI übersetzte jede gesprochene Zeile in etwa zehn Sekunden, schnell genug für einen natürlichen Dialog. Der Betrieb war zudem deutlich günstiger als herkömmliche Telefon- oder Videodolmetschdienste: Geschätzte Kosten betrugen nur wenige Cent für ein zehnminütiges Gespräch gegenüber mehreren Dollar für einen menschlichen Dienst. Deshalb schlagen die Autorinnen und Autoren ein Modell „Dolmetscher im Loop“ vor. Bei diesem Ansatz würde LingualAI Routine- und gering risikobehaftete Austauschvorgänge übernehmen, während zertifizierte Dolmetscher bei kritischen Entscheidungen, emotionalen Gesprächen oder immer dann einspringen, wenn die KI eine geringe Vertrauenswürdigkeit anzeigt oder Ärztinnen/Ärzte bzw. Patientinnen/Patienten menschliche Hilfe anfordern.
Was das für Patientinnen, Patienten und Klinikpersonal bedeutet
Für Menschen mit Sprachbarrieren bietet diese Studie vorsichtigen Optimismus. LingualAI scheint in der Lage zu sein, medizinische Bedeutungen zwischen Sprachen weitgehend korrekt zu übertragen, insbesondere bei häufigen Englisch–Spanisch-Gesprächen. Gleichzeitig bleibt das Tool hinter menschlichen Dolmetschern zurück, wenn es um Wärme, Nuancen und Zuverlässigkeit in heiklen Gesprächen geht. Die Autorinnen und Autoren kommen zu dem Schluss, dass KI-Übersetzung zertifizierte Dolmetscher nicht ersetzen sollte, wohl aber eine nützliche Unterstützung sein kann, wenn menschliche Hilfe verzögert oder nicht verfügbar ist – vorausgesetzt, menschliche Expertinnen und Experten sind bei den sensibelsten und wichtigsten Teilen der Versorgung weiterhin eingebunden.
Zitation: Singh, U.P., Jaimes Garcia, C.A., Aisenberg, G.M. et al. Evaluating LingualAI: a prospective validation of AI-based real-time translation against certified human interpreters. npj Health Syst. 3, 29 (2026). https://doi.org/10.1038/s44401-026-00080-5
Schlüsselwörter: medizinische Übersetzung, Sprachbarrieren, KI im Gesundheitswesen, klinische Kommunikation, Dolmetscher