Clear Sky Science · fr
Évaluation de LingualAI : validation prospective d’une traduction en temps réel basée sur l’IA face à des interprètes humains certifiés
Combler les lacunes linguistiques au cabinet médical
Des millions de personnes aux États-Unis ont des difficultés à communiquer avec leurs médecins parce qu’elles ne maîtrisent pas l’anglais. Les interprètes professionnels peuvent aider, mais ils ne sont pas toujours disponibles, notamment dans les cabinets très fréquentés, les zones rurales ou lors de consultations tardives. Cette étude examine si un outil téléphonique développé localement, appelé LingualAI, qui propose une traduction anglais–espagnol en temps réel, peut soutenir de manière sûre les échanges entre médecins et patients lorsque l’accès à un interprète humain est limité.

Pourquoi l’aide linguistique compte pour la santé
Plus de 25 millions de personnes aux États-Unis déclarent parler l’anglais moins que « très bien », et cette fracture linguistique est liée à des problèmes tels que la mauvaise compréhension des diagnostics, l’absence aux rendez‑vous de suivi et des résultats de santé moins bons. La recherche montre que lorsque les patients peuvent s’exprimer dans la langue de leur choix, les soins tendent à être plus sûrs et plus efficaces. Pourtant, hôpitaux et cliniques manquent souvent d’un nombre suffisant d’interprètes certifiés pour couvrir toutes les consultations, en particulier en soins primaires et en urgence. À mesure que les outils d’intelligence artificielle se répandent, les systèmes de santé se demandent s’ils peuvent combler une partie de cette lacune sans mettre les patients en danger.
Comment les chercheurs ont testé LingualAI
L’équipe de UTHealth Houston a créé trois scénarios réalistes de clinique oto‑rhino‑laryngologique en anglais et en espagnol, avec des répliques scénarisées pour un clinicien et un patient. Des locuteurs natifs ont enregistré chaque réplique, qui a ensuite été traduite de deux manières : par des interprètes médicaux certifiés et par LingualAI. Neuf cliniciens bilingues ont écouté des extraits audio anonymisés, sans savoir s’ils provenaient d’humains ou de l’IA, et les ont notés sur une échelle en cinq points. Ils ont évalué de nombreux aspects de la qualité, notamment la précision des termes médicaux, la clarté du sens, l’exhaustivité de la traduction et la naturalité et l’adéquation culturelle de la parole.

Ce que l’étude a révélé sur le sens et le style
Sur la question la plus importante — si le message médical central était transmis — le système d’IA s’en est sorti de manière surprenante. Pour la terminologie médicale et le sens global, les scores de LingualAI étaient très proches de ceux des interprètes certifiés. Les chercheurs avaient défini à l’avance combien l’IA pouvait être moins performante tout en étant jugée « suffisante », et LingualAI a atteint ce seuil pour le sens, la terminologie et l’exhaustivité du message. Autrement dit, dans ces tests contrôlés, l’outil formulait généralement la bonne information médicale dans la bonne langue.
Où les interprètes humains excellent encore
Le constat change lorsque les évaluateurs se concentrent sur la manière dont les mots sont délivrés. Les interprètes humains obtiennent des scores nettement supérieurs en grammaire, choix des mots et adéquation culturelle, ainsi qu’en fluidité, naturalité et expressivité de la parole. La voix de l’IA avait tendance à paraître plus mécanique, avec des pauses maladroites et un ton plat qui peuvent rendre les marques de réconfort ou d’empathie moins convaincantes. Lorsqu’on leur demandait quelle version ils préféraient, les évaluateurs se prononçaient majoritairement en faveur des interprètes humains pour le flux de la parole, le rythme et la confiance globale. Ces différences étaient suffisamment significatives pour que l’IA ne remplisse pas le critère prédéfini d’être « pas pire que » les humains dans ces domaines axés sur la livraison.
Vitesse, coût et modèle de responsabilité partagée
LingualAI traduisait chaque réplique parlée en environ dix secondes, suffisamment vite pour s’intégrer à un échange naturel. Il était également bien moins coûteux à exploiter que les services d’interprétariat téléphonique ou vidéo traditionnels, avec des coûts estimés à seulement quelques centimes pour une conversation de 10 minutes contre plusieurs dollars pour un service humain. Pour ces raisons, les auteurs proposent un modèle « interprète dans la boucle ». Dans cette approche, LingualAI prendrait en charge les échanges routiniers et à faible risque, tandis que des interprètes certifiés interviendraient pour les décisions critiques, les discussions émotionnelles ou chaque fois que la confiance de l’IA est faible ou qu’un clinicien ou un patient demande une aide humaine.
Ce que cela signifie pour les patients et les cliniciens
Pour les personnes confrontées à des barrières linguistiques, cette étude offre un optimisme prudent. LingualAI semble capable de transmettre raisonnablement le sens médical entre les langues, en particulier pour les conversations courantes anglais–espagnol. En même temps, l’outil demeure en deçà des interprètes humains en chaleur, nuances et fiabilité pour les échanges à forts enjeux. Les auteurs concluent que la traduction par IA ne doit pas remplacer les interprètes certifiés, mais qu’elle peut constituer une solution de secours utile lorsque l’aide humaine est retardée ou indisponible, à condition que des experts humains restent impliqués dans les moments les plus sensibles et importants des soins.
Citation: Singh, U.P., Jaimes Garcia, C.A., Aisenberg, G.M. et al. Evaluating LingualAI: a prospective validation of AI-based real-time translation against certified human interpreters. npj Health Syst. 3, 29 (2026). https://doi.org/10.1038/s44401-026-00080-5
Mots-clés: traduction médicale, barrières linguistiques, IA en santé, communication clinique, interprètes