Clear Sky Science · sv

Utvärdering av LingualAI: en prospektiv validering av AI-baserad realtidsöversättning jämfört med certifierade mänskliga tolkar

· Tillbaka till index

Att överbrygga språkgap i läkarens mottagning

Miljontals människor i USA har svårt att kommunicera med sina läkare eftersom de inte är flytande i engelska. Professionella tolkar kan hjälpa, men de är inte alltid tillgängliga, särskilt i hektiska kliniker, i landsbygdsområden eller vid nattliga besök. Denna studie undersöker om ett hembyggt, telefonbaserat verktyg kallat LingualAI, som erbjuder realtidsöversättning mellan engelska och spanska, säkert kan stödja samtal mellan läkare och patienter när en mänsklig tolk är svår att nå.

Figure 1. AI-verktyg hjälper läkare och patienter som talar olika språk att förstå varandra under besök
Figure 1. AI-verktyg hjälper läkare och patienter som talar olika språk att förstå varandra under besök

Varför språkstöd betyder något för hälsan

Mer än 25 miljoner människor i USA talar engelska mindre än ”mycket väl”, och detta språkgap är kopplat till problem som missförstånd av diagnoser, att missa uppföljningsbesök och sämre hälsoutfall. Forskning visar att när patienter kan tala på sitt föredragna språk tenderar vården att bli säkrare och mer effektiv. Ändå saknar sjukhus och kliniker ofta tillräckligt många certifierade tolkar för att täcka varje besök, särskilt inom primärvård och akutsjukvård. När artificiella intelligensverktyg blir vanligare frågar sig vårdsystem om de kan fylla en del av detta gap utan att utsätta patienter för risk.

Hur forskarna testade LingualAI

Teamet vid UTHealth Houston skapade tre realistiska öron-, näs- och halskliniks-scenarier på både engelska och spanska, med manus för en kliniker och en patient. Modersmålstalare spelade in varje replik, som sedan översattes på två sätt: av certifierade medicinska tolkar och av LingualAI. Nio tvåspråkiga kliniker lyssnade på anonymiserade ljudklipp, utan att få veta vilka som kom från människor eller AI, och betygsatte dem på en femgradig skala. De bedömde många kvalitetsaspekter, inklusive hur korrekta de medicinska termerna var, om innebörden förmedlades tydligt, hur fullständig översättningen var och hur naturligt och kulturellt lämpligt talet lät.

Figure 2. AI-översättning bevarar medicinsk innebörd väl men producerar tal som låter mindre naturligt än en mänsklig tolk
Figure 2. AI-översättning bevarar medicinsk innebörd väl men producerar tal som låter mindre naturligt än en mänsklig tolk

Vad studien fann om innebörd och stil

I den viktigaste frågan—om det centrala medicinska budskapet nådde fram—presterade AI-systemet oväntat väl. För både medicinsk terminologi och övergripande innebörd låg LingualAIs poäng mycket nära de certifierade tolkarnas. Forskarna hade i förväg definierat hur mycket sämre AI:n kunde vara och fortfarande anses "tillräckligt bra", och LingualAI uppfyllde denna gräns för innebörd, terminologi och meddelandets fullständighet. Med andra ord, i dessa kontrollerade tester sade verktyget oftast rätt medicinska sak på rätt språk.

Var mänskliga tolkar fortfarande utmärker sig

Bilden förändrades när lyssnarna fokuserade på hur orden framfördes. Mänskliga tolkar fick klart högre poäng för grammatik, ordval och kulturell anpassning, liksom för hur smidigt, naturligt och uttrycksfullt talet lät. AI:ns röst tenderade att vara mer mekanisk, med klumpiga pauser och en platt ton som kunde göra tröst eller empati mindre äkta. När raters ombads välja vilken version de föredrog lutade de starkt mot mänskliga tolkar för talflöde, rytm och allmän tillit. Dessa skillnader var tillräckligt betydelsefulla för att AI:n inte uppfyllde den förutbestämda standarden för att vara "inte sämre än" människor inom dessa leveransfokuserade områden.

Hastighet, kostnad och en modell med delat ansvar

LingualAI översatte varje talad replik på ungefär tio sekunder, tillräckligt snabbt för att passa in i ett naturligt samtal fram och tillbaka. Det var också mycket billigare att använda än traditionella telefon- eller video­tolktjänster, med beräknade kostnader på bara några cent för ett 10-minuters samtal jämfört med flera dollar för en mänsklig tjänst. På grund av detta föreslår författarna en "tolk-i-loopen"-modell. I detta tillvägagångssätt skulle LingualAI hantera rutinmässiga, låg-riskutbyten, medan certifierade tolkar skulle kliva in för kritiska beslut, känslomässiga diskussioner eller när AI:ns förtroende är lågt eller en kliniker eller patient begär mänsklig hjälp.

Vad detta betyder för patienter och kliniker

För personer som möter språkbarriärer erbjuder denna studie försiktig optimism. LingualAI verkar kunna överföra medicinsk innebörd mellan språk på ett rimligt sätt, särskilt för vanliga engelska–spanska konversationer. Samtidigt saknar verktyget fortfarande mänskliga tolkar i värme, nyans och tillförlitlighet vid höginsats-samtal. Författarna drar slutsatsen att AI-översättning inte bör ersätta certifierade tolkar, men att den kan vara ett användbart backupalternativ när mänsklig hjälp är försenad eller otillgänglig, förutsatt att mänskliga experter förblir involverade i de mest känsliga och viktiga delarna av vården.

Citering: Singh, U.P., Jaimes Garcia, C.A., Aisenberg, G.M. et al. Evaluating LingualAI: a prospective validation of AI-based real-time translation against certified human interpreters. npj Health Syst. 3, 29 (2026). https://doi.org/10.1038/s44401-026-00080-5

Nyckelord: medicinsk översättning, språkbarriärer, AI i vården, klinisk kommunikation, tolkar