Clear Sky Science · es

Evaluación de LingualAI: validación prospectiva de una traducción en tiempo real basada en IA frente a intérpretes humanos certificados

2026-05-12 · Volver al índice

Reduciendo las brechas lingüísticas en la consulta médica

Millones de personas en Estados Unidos tienen dificultades para comunicarse con sus médicos porque no dominan el inglés. Los intérpretes profesionales pueden ayudar, pero no siempre están disponibles, sobre todo en clínicas muy concurridas, zonas rurales o visitas nocturnas. Este estudio analiza si una herramienta telefónica desarrollada localmente llamada LingualAI, que ofrece traducción en tiempo real entre inglés y español, puede apoyar de forma segura las conversaciones entre médicos y pacientes cuando un intérprete humano es difícil de conseguir.

Figure 1. Herramienta de IA ayuda a médicos y pacientes que hablan diferentes idiomas a entenderse durante las consultas

Por qué el apoyo lingüístico importa para la salud

Más de 25 millones de personas en EE. UU. hablan inglés menos que “muy bien”, y esta brecha lingüística se asocia a problemas como malentender diagnósticos, perder visitas de seguimiento y peores resultados de salud. La investigación muestra que cuando los pacientes pueden expresarse en su idioma preferido, la atención tiende a ser más segura y eficaz. Sin embargo, hospitales y clínicas con frecuencia no cuentan con intérpretes certificados suficientes para cubrir todas las consultas, especialmente en atención primaria y urgencias. A medida que las herramientas de inteligencia artificial se vuelven más comunes, los sistemas de salud se preguntan si pueden cubrir parte de esa falta sin poner en riesgo a los pacientes.

Cómo probaron los investigadores a LingualAI

El equipo de UTHealth Houston creó tres escenarios realistas de una consulta de otorrinolaringología tanto en inglés como en español, con guiones para el clínico y el paciente. Hablantes nativos grabaron cada línea, que luego se tradujo de dos maneras: por intérpretes médicos certificados y por LingualAI. Nueve clínicos bilingües escucharon fragmentos de audio anonimizados, sin saber si procedían de humanos o de la IA, y los puntuaron en una escala de cinco puntos. Evaluaron múltiples aspectos de calidad, incluyendo la precisión de la terminología médica, si el significado se transmitía con claridad, la completitud de la traducción y cuán natural y culturalmente apropiado sonaba el habla.

Figure 2. La traducción por IA mantiene el significado médico preciso pero produce un habla que suena menos natural que la de un intérprete humano

Qué encontró el estudio sobre significado y estilo

En la pregunta más importante—si el mensaje médico central se transmitía—el sistema de IA se desempeñó sorprendentemente bien. Tanto en terminología médica como en significado global, las puntuaciones de LingualAI estuvieron muy cerca de las de los intérpretes certificados. Los investigadores definieron de antemano cuánto peor podía ser la IA y aún considerarse “suficientemente buena”, y LingualAI cumplió ese umbral para significado, terminología y completitud del mensaje. En otras palabras, en estas pruebas controladas, la herramienta normalmente decía lo correcto en el idioma adecuado.

Donde los intérpretes humanos siguen destacando

La percepción cambió cuando los oyentes se centraron en cómo se entregaban las palabras. Los intérpretes humanos obtuvieron puntuaciones claramente superiores en gramática, elección de palabras y ajuste cultural, así como en la fluidez, naturalidad y expresividad del habla. La voz de la IA tendía a sonar más mecánica, con pausas incómodas y un tono plano que podía hacer que la reafirmación o la empatía se sintieran menos genuinas. Al preguntarles cuál versión preferían, los evaluadores se inclinaron decididamente por los intérpretes humanos en cuanto a flujo del habla, ritmo y confianza general. Estas diferencias fueron lo bastante notables como para que la IA no alcanzara el estándar preestablecido de ser “no peor que” los humanos en estas áreas centradas en la entrega.

Velocidad, coste y un modelo de responsabilidad compartida

LingualAI tradujo cada línea hablada en aproximadamente diez segundos, lo bastante rápido para encajar en un intercambio conversacional natural. También resultó mucho más económico que los servicios tradicionales de interpretación por teléfono o vídeo, con costes estimados de solo unos pocos céntimos por una conversación de 10 minutos frente a varios dólares por un servicio humano. Por ello, los autores proponen un modelo de “intérprete en el circuito”. En este enfoque, LingualAI se encargaría de los intercambios rutinarios y de bajo riesgo, mientras que intérpretes certificados intervendrían para decisiones críticas, conversaciones emocionales o siempre que la confianza de la IA fuera baja o un clínico o paciente solicitara ayuda humana.

Qué significa esto para pacientes y clínicos

Para las personas que enfrentan barreras lingüísticas, este estudio ofrece un optimismo cauto. LingualAI parece capaz de transmitir el significado médico entre idiomas de forma razonable, especialmente en conversaciones comunes entre inglés y español. Al mismo tiempo, la herramienta aún queda por debajo de los intérpretes humanos en calidez, matices y fiabilidad en conversaciones de alto riesgo. Los autores concluyen que la traducción por IA no debería reemplazar a los intérpretes certificados, pero puede ser un respaldo útil cuando la ayuda humana se retrasa o no está disponible, siempre que los expertos humanos sigan participando en las partes más sensibles e importantes de la atención.

Cita: Singh, U.P., Jaimes Garcia, C.A., Aisenberg, G.M. et al. Evaluating LingualAI: a prospective validation of AI-based real-time translation against certified human interpreters. npj Health Syst. 3, 29 (2026). https://doi.org/10.1038/s44401-026-00080-5

Palabras clave: traducción médica, barreras lingüísticas, IA en salud, comunicación clínica, intérpretes