Clear Sky Science · nl
EPEE: naar efficiënte en effectieve foundation-modellen in de biomedische sector
Waarom snellere denkende AI van belang is in de geneeskunde
Moderne kunstmatige intelligentie kan medische dossiers lezen en beelden met indrukwekkende vaardigheid scannen, maar in echte ziekenhuizen telt elke seconde. Artsen op de spoedeisende hulp en op intensivecareafdelingen kunnen niet wachten terwijl een enorm model langzaam door tientallen stappen “nadenkt”, vooral als die extra stappen het antwoord niet verbeteren. Deze studie introduceert een manier om grote medische AI-systemen te helpen inschatten wanneer ze al genoeg gezien hebben om een veilige, betrouwbare beslissing te nemen, waardoor tijd en rekenkracht worden bespaard zonder in te boeten aan nauwkeurigheid.

Het probleem van trage en pietluttige AI
Grote “foundation” modellen liggen ten grondslag aan veel recente doorbraken in de gezondheidszorg. Taalmodellen helpen bij het doorzoeken van elektronische patiëntendossiers en wetenschappelijke artikelen, terwijl visiemodellen beelden zoals röntgenfoto’s en weefselflakes analyseren. Deze modellen zijn echter opgebouwd uit vele op elkaar gestapelde lagen die dezelfde invoer keer op keer verwerken. In de praktijk voegen de latere lagen vaak weinig toe en kunnen ze zelfs de nauwkeurigheid schaden, een probleem dat de auteurs ‘overthinking’ noemen. Voor een arts die wacht op een risicoscore of een waarschuwing voor een gevaarlijke geneesmiddelinteractie, vertaalt deze extra rekencyclus van de computer zich in vertragingen in de echte wereld en hogere rekenkosten.
Laat eenvoudige gevallen vroeg uitstappen
Eerdere onderzoeken stelden “early exiting” voor, waarbij een model kleine controlepunten tussen lagen bevat. Als een controlepunt al erg zeker is van zijn antwoord, kan het model daar stoppen in plaats van de gegevens door alle resterende lagen te duwen. Een reeks methoden beslist op basis van vertrouwen: als de voorspelling sterk op één uitkomst gericht lijkt, stapt het model uit. Deze benaderingen zijn eenvoudig en flexibel maar kunnen aan nauwkeurigheid inboeten wanneer ze worden afgesteld op snelheid. Een andere reeks wacht op meerdere opeenvolgende lagen die het eens zijn over hetzelfde antwoord, een ‘patience’-regel die de nauwkeurigheid doorgaans beschermt maar gevoelig is voor hoeveel overeenkomsten vereist zijn, waardoor het lastig is die instelling voor verschillende klinische behoeften goed te kiezen.
Een hybride early exit genaamd EPEE
De auteurs presenteren EPEE, een afkorting van Entropy- and Patience-based Early Exiting, die deze twee ideeën combineert. Op elke laag van een transformer-model koppelt EPEE een lichte classifier. Het systeem controleert twee eenvoudige voorwaarden: is de huidige voorspelling erg zelfverzekerd, en hebben recente lagen consequent dezelfde uitspraak gedaan? Als aan een van beide voorwaarden is voldaan, stopt het model en geeft het resultaat terug. Door aan te passen wat als “zelfverzekerd” wordt beschouwd en hoeveel opeenvolgende overeenkomsten vereist zijn, kunnen gebruikers zowel snelheid als voorzichtigheid afstemmen. Belangrijk is dat de auteurs aantonen dat de vroegere methoden die alleen op vertrouwen of alleen op patience vertrouwen, speciale gevallen zijn van deze algemenere strategie.

Tests op echte medische tekst en beelden
Om te onderzoeken of EPEE in de praktijk werkt, testte het team het op drie soorten biomedische taken: het classificeren van aantekeningen of beoordelingen, het vinden van relaties zoals geneesmiddelinteracties, en het extraheren van medische gebeurtenissen uit tekst. Ze gebruikten acht populaire foundation-modellen, waaronder taalmodellen zoals BERT en GPT-2 en een vision transformer voor medische beelden. Over twaalf datasets afkomstig uit intensivecaregegevens, patiëntbeoordelingen, medische literatuur en beeldverzamelingen zoals thoraxröntgenfoto’s en bloedcelpreparaten vergeleken ze EPEE met standaard volledige diepte-inferentie en met eerdere early-exitmethoden. In veel gevallen bereikte het model zijn beste of bijna-beste nauwkeurigheid op tussenliggende lagen, wat betekent dat het afdwingen van alle lagen onnodig was. EPEE profiteerde hiervan door eenvoudige gevallen vroeg te laten uitstappen, terwijl moeilijkere gevallen meer lagen doorliepen.
Balans tussen snelheid en betrouwbaarheid in de kliniek
Toen de onderzoekers de uitvoertijd maten, verminderde EPEE consistent de inferentie-latentie vergeleken met zowel gewone volledige-diepte modellen als eerdere early-exittechnieken, vaak met een forse reductie van de effectieve rekenbelasting terwijl de nauwkeurigheid werd gematcht of licht verbeterd. De methode vergde slechts een kleine extra kost tijdens het trainen en werkte even goed voor zowel taal- als beeldmodellen, inclusief nieuwere grote biomedische modellen. Omdat de twee instellingen kunnen worden aangepast om een gekozen afweging tussen snelheid en correctheid te bereiken, is EPEE goed geschikt voor omgevingen zoals de intensive care, waar snelle antwoorden cruciaal zijn maar fouten kostbaar zijn.
Wat dit betekent voor de toekomstige medische AI
In eenvoudige bewoordingen leert dit werk grote medische AI-systemen te stoppen wanneer ze het antwoord al weten, in plaats van hun werk eindeloos te blijven controleren. Door twee gangbare stopregels te combineren in een flexibel raamwerk, laat EPEE zien dat ziekenhuizen misschien niet per se nog grotere modellen nodig hebben om betere prestaties te krijgen; ze hebben mogelijk modellen nodig die hun bestaande capaciteit slimmer gebruiken. Als zulke early-exitstrategieën breed worden toegepast, kunnen krachtige tekst- en beeldmodellen worden ingebracht in realtime klinische workflows, en zo snellere maar toch betrouwbare beslissingen aan het bed mogelijk maken.
Bronvermelding: Zhan, Z., Zhou, S., Zhou, H. et al. EPEE: towards efficient and effective foundation models in biomedicine. npj Health Syst. 3, 30 (2026). https://doi.org/10.1038/s44401-026-00083-2
Trefwoorden: vroegtijdig stoppen, biomedische AI, foundation-modellen, modelefficiëntie, klinische decision support