Clear Sky Science · sv

Multiplanig vision-transformer för klassificering av blödning med axiala och sagittala MRI-data

2026-03-18 · Tillbaka till index

Varför denna forskning är viktig för patienter och läkare

När någon kan drabbas av stroke eller hjärnblödning är varje minut avgörande. Hjärnavbildningar kan avslöja farliga blödningar, men att läsa dessa bilder snabbt och korrekt är utmanande, särskilt för magnetresonans (MRI) som genererar många bildtyper från olika visningsvinklar. Denna studie presenterar en ny metod inom artificiell intelligens (AI) utformad för att läsa flervinklade MRI-skanningar mer likt en skicklig radiolog, med målet att upptäcka hjärnblödningar mer tillförlitligt i verkliga sjukhusmiljöer.

Utmaningen att hitta hjärnblödningar på MRI

Intrakraniell blödning — blödning inne i skallen — är ett livshotande tillstånd som kräver snabb diagnos. I årtionden har datortomografi (CT) varit huvudverktyget vid misstänkta hjärnblödningar eftersom det är snabbt och relativt lätt att tolka. MRI kan matcha eller till och med överträffa CT vad gäller att upptäcka blödningar och är bättre på att visa blödningens ålder samt avslöja andra problem, till exempel områden i hjärnan som saknar blod. Däremot tar MRI längre tid, är mindre tillgängligt på vissa platser och dess bilder är mer komplexa att tolka. Denna komplexitet gör MRI till ett attraktivt mål för AI-verktyg som kan assistera radiologer genom att skanna stora mängder bilder, flagga misstänkta fall och minska risken att en subtil men kritisk blödning förbises.

Varför flera vyer och skanningstyper är svåra för datorer

I rutinmässig klinisk vård förvärvas ofta hjärn-MRI med relativt tjocka skivor för att hålla undersökningen kort, vilket ger bilder som är mycket skarpare i vissa riktningar än i andra. Radiologer betraktar hjärnan i flera plan — axiala (top-down), sagittala (sido) och ibland koronala (framifrån) — eftersom vissa blödningar syns bättre från särskilda vinklar. Skanningar kommer också i flera ”kontraster” eller varianter, såsom FLAIR, diffusion och susceptibility, som framhäver olika vävnadsegenskaper. De flesta nuvarande AI-system förväntar sig dock att alla bilder är uppradade i en standardorientering och har samma upplösning. För att uppfylla detta krav måste data i praktiken vridas och skalas digitalt, vilket kan sudda ut fina detaljer och potentiellt dölja små blödningar. Riktiga kliniska dataset försvåras dessutom av att inte varje patient skannas med samma uppsättning sekvenser, så modeller måste klara av saknade informationsbitar.

En ny multiplanig AI-modell som bevarar mer av bilden

För att ta itu med dessa problem designade författarna en ”multi-plane vision transformer” (MP-ViT), en typ av AI ursprungligen utvecklad för att förstå naturliga bilder. Istället för att tvinga all MRI-data till en enda visningsvinkel har MP-ViT två dedikerade bearbetningsgrenar: en för axiala bilder och en för sagittala bilder. Varje gren delar upp den tredimensionella hjärnan i små block, omvandlar dem till tokens som transformern kan bearbeta och lär sig mönster som kan indikera närvaro av en blödning. Avgörande är att dessa grenar inte bara körs parallellt och förblir separata. Modellen använder en kors-uppmärksamhetsmekanism för att låta de två grenarna utbyta information, vilket efterliknar hur en radiolog mentalt kombinerar vyer från olika vinklar för att få en tydligare helhetsbild av hjärnan.

Hantering av saknade skanningstyper med en vägledande signal

I verkliga sjukhusflöden har inte alla patienter samma uppsättning MRI-kontraster; vissa saknar särskilda sekvenser som är känsliga för blödning. För att göra AI:n robust mot dessa luckor lade författarna till en ”modality indication vector” — en enkel kod som talar om för modellen vilka bildtyper som finns och vilka som saknas för en given patient. Denna vektor omvandlas till en uppsättning interna signaler som interagerar med modellens inlärda funktioner genom ett ytterligare kors-uppmärksamhetssteg. I praktiken vägleds nätverket att justera sina förväntningar när vissa typer av information saknas, istället för att bli förvirrat eller överkonfident. Denna design gör MP-ViT bättre anpassad till den röriga, inkonsekventa data som uppstår i daglig klinisk praktik.

Hur väl den nya metoden presterar

Forskarna tränade och testade MP-ViT på ett stort, verklighetsnära dataset med över 12 000 MRI-studier från tre stora skannertillverkare, märkta av erfarna radiologer som antingen med akut eller subakut intrakraniell blödning eller inte. På en oberoende testuppsättning uppnådde MP-ViT ett area under kurvan (AUC) på 0,854, ett mått på hur väl den skiljer blödning från icke-blödning över alla möjliga beslutströsklar. Denna poäng var märkbart högre än för en standard vision transformer-modell som arbetade från ett enda plan, liksom flera välkända konvolutionella neurala nätverksarkitekturer som ResNet och DenseNet. Statistiska tester bekräftade att dessa förbättringar sannolikt inte berodde på slumpen. En intern analys visade också att inkluderingen av modality indication vector förbättrade prestandan med mer än en procentenhet, vilket understryker värdet av att uttryckligen informera modellen om vilka skanningstyper den har tillgängliga.

Vad detta kan innebära för framtida vård

För en icke-specialist är huvudpoängen att denna studie visar ett smartare sätt för AI att läsa MRI-bilder: den betraktar hjärnan från flera vinklar, bevarar mer av originaldetaljen och anpassar sig när vissa bildtyper saknas. Även om arbetet utvärderades på ett enda internt dataset och fokuserade på klassificering snarare än exakt avgränsning av blödningar, visar det att väl utformade transformermodeller bättre kan matcha den röriga verkligheten inom klinisk bilddiagnostik. Om metoder som MP-ViT valideras bredare och integreras ansvarsfullt i sjukhusflöden kan de hjälpa radiologer att upptäcka hjärnblödningar mer tillförlitligt både vid akuta strokefall och vid rutinmässiga öppenvårdsundersökningar, vilket potentiellt kan leda till snabbare behandling och säkrare utfall för patienterna.

Citering: Das, B.K., Zhao, G., Mailhe, B. et al. Multi-plane vision transformer for hemorrhage classification using axial and sagittal MRI data. Sci Rep 16, 9333 (2026). https://doi.org/10.1038/s41598-026-44524-2

Nyckelord: hjärnblödning, MRI, medicinsk bildbehandlings-AI, vision transformer, stroke-diagnostik