Clear Sky Science · sv
EPEE: mot effektiva och ändamålsenliga grundmodeller inom biomedicin
Varför snabbare tänkande AI spelar roll inom medicin
Modern artificiell intelligens kan läsa journaler och granska bilder med imponerande skicklighet, men på riktiga sjukhus räknas varje sekund. Läkare på akutmottagningar och intensivvårdsavdelningar kan inte vänta medan en stor modell långsamt "tänker" genom dussintals steg, särskilt om de extra stegen inte förbättrar svaret. Denna studie presenterar ett sätt att hjälpa stora medicinska AI‑system att avgöra när de redan har sett tillräckligt för att fatta ett säkert, förtroendefullt beslut, vilket sparar tid och beräkningsresurser utan att offra noggrannhet.

Problemet med långsam och krånglig AI
Stora "grund"modeller driver många av de senaste framstegen inom hälsoteknik. Språkmodeller hjälper till att sålla i elektroniska journaler och forskningsartiklar, medan bildmodeller analyserar bilder som röntgen och vävnadsbildskivor. Dessa modeller är dock uppbyggda av många staplade lager som bearbetar samma indata om och om igen. I praktiken tillför senare lager ofta lite värde och kan till och med skada noggrannheten, ett problem författarna kallar övertänkande. För en läkare som väntar på en riskpoäng eller en varning om en farlig läkemedelsinteraktion blir detta extra beräkningsarbete verkliga fördröjningar och ökade kostnader för datorresurser.
Låta enkla fall avsluta tidigt
Tidigare forskning föreslog "tidig avslutning", där en modell innehåller små kontrollpunkter mellan lagren. Om en kontrollpunkt redan är mycket säker på sitt svar kan modellen stoppa där istället för att föra datan genom alla återstående lager. En grupp metoder avgör utifrån konfidenser: om förutsägelsen är starkt fokuserad på ett utfall, lämnar modellen. Dessa tillvägagångssätt är enkla och flexibla men kan tappa i noggrannhet när de lutas mot högre hastighet. En annan grupp väntar på att flera lager i rad ska vara överens om samma svar, en "tålamod"regel som tenderar att skydda noggrannheten men är känslig för hur många överenskommelser som krävs, vilket gör den svår att ställa in för olika kliniska behov.
En hybrid för tidig avslutning kallad EPEE
Författarna introducerar EPEE, förkortning av Entropy‑ and Patience‑based Early Exiting, som blandar dessa två idéer. Vid varje lager i en transformer‑modell kopplar EPEE en lättviktsklassificerare. Systemet kontrollerar två enkla villkor: är den nuvarande förutsägelsen mycket säker, och har de senaste lagren konsekvent fattat samma beslut? Om något av villkoren uppfylls stoppar modellen och returnerar resultatet. Genom att justera hur "säker" definieras och hur många upprepade överenskommelser som krävs kan användare justera både hastighet och försiktighet. Viktigt är att författarna visar att de tidigare metoderna som enbart bygger på konfidens eller enbart på tålamod bara är specialfall av denna mer generella strategi.

Tester på verklig medicinsk text och bilder
För att avgöra om EPEE fungerar i praktiken testade teamet metoden på tre typer av biomedicinska uppgifter: klassificering av anteckningar eller recensioner, identifiering av relationer som läkemedelsinteraktioner, och extraktion av medicinska händelser ur text. De använde åtta populära grundmodeller, inklusive språkmodeller som BERT och GPT‑2 samt en vision‑transformer för medicinska bilder. Över tolv dataset hämtade från intensivvårdsjournaler, patientrecensioner, medicinsk litteratur och bildsamlingar som thoraxröntgen och blodcellsbilder jämförde de EPEE med standard fulldjups‑inferenz och med tidigare tidiga‑avslutsmetoder. I många fall nådde modellen sin bästa eller näst bästa noggrannhet på mellannivålager, vilket visar att det var onödigt att tvinga den genom alla lager. EPEE utnyttjade detta genom att låta enkla fall avsluta tidigt samtidigt som svårare fall fick gå igenom fler lager.
Balansera hastighet och pålitlighet i kliniken
När forskarna mätte körtid minskade EPEE konsekvent inferenstid jämfört med både vanliga fulldjupsmodeller och tidigare tidiga‑avslutsmetoder, ofta genom att skära ned den effektiva beräkningen samtidigt som noggrannheten matchades eller förbättrades något. Metoden krävde endast en liten extra kostnad under träning och fungerade ungefär lika bra för både språk‑ och bildmodeller, inklusive nyare stora biomedicinska modeller. Eftersom dess två inställningar kan justeras för att rikta in sig på en önskad kompromiss mellan hastighet och korrekthet är EPEE väl lämpad för miljöer som intensivvård, där snabba svar är avgörande men misstag är kostsamma.
Vad detta innebär för framtidens medicinska AI
Enkelt uttryckt lär detta arbete stora medicinska AI‑system att stoppa när de redan vet svaret, istället för att oändligt ompröva sitt svar. Genom att kombinera två vanliga avslutsregler i ett flexibelt ramverk visar EPEE att sjukhus kanske inte behöver ännu större modeller för att få bättre prestanda; de kan behöva modeller som använder sin befintliga kapacitet klokare. Om denna typ av tidig‑avslutsstrategi antas i stor skala kan den hjälpa till att föra kraftfulla text‑ och bildmodeller in i realtids kliniska arbetsflöden och stödja snabbare men ändå pålitliga beslut vid patientens sida.
Citering: Zhan, Z., Zhou, S., Zhou, H. et al. EPEE: towards efficient and effective foundation models in biomedicine. npj Health Syst. 3, 30 (2026). https://doi.org/10.1038/s44401-026-00083-2
Nyckelord: tidig avslutning, biomedicinsk AI, grundmodeller, modeleffektivitet, kliniskt beslutsstöd