Clear Sky Science · sv

Jämförelse mellan artificiell intelligens och vårdpersonal vid analys av kirurgiska och interventionella videor: en systematisk översikt och meta-analys

· Tillbaka till index

Skarpare blickar i operationssalen

Varje år genomgår hundratals miljoner människor operationer och minimalt invasiva procedurer som styrs av video—tänk koloskopier, titthålskirurgi eller små kameror som förts in i blodkärl. I dessa ögonblick kan en läkares förmåga att upptäcka subtila varningssignaler på en skärm vara skillnaden mellan att fånga en cancer tidigt eller missa den. Denna studie ställer en fråga som är viktig för varje framtida patient: när kirurgiska och interventionella videor analyseras, hur väl presterar artificiella intelligenssystem jämfört med mänskliga kliniker, och vad händer när de två arbetar tillsammans?

Figure 1
Figure 1.

Bring ordning i en flod av kirurgiska videor

Modern medicin spelar nu in stora mängder procedurvideor, från gastrointestinale endoskopier till robotassisterade ingrepp. Dessa inspelningar är rika på information: små polyper i tarmen, tidiga tumörer i magen eller matstrupen, känsliga nerver som måste undvikas eller steg i en komplex operation. Forskare har tränat AI-system för att skanna dessa bilder, markera misstänkta områden och till och med känna igen var kirurger befinner sig i en procedur. Men hittills har de flesta studier ställt AI mot läkare i artificiella direktmöten, snarare än att undersöka hur tekniken realistiskt kan användas—som en hjälpare vid klinikerns sida. Denna översikt syftade till att systematiskt samla och analysera den spridda evidensen över många specialiteter.

Vad forskarna undersökte

Teamet sökte i stora medicinska och tekniska databaser och började med nästan 38 000 artiklar. Efter att ha tillämpat strikta kriterier—endast primära studier som använde AI på verkliga kirurgiska eller interventionella videor och direkt jämförde dess prestanda med vårdpersonals—återstod endast 146 studier. Dessa täckte ett brett spektrum av procedurer, särskilt gastrointestinell endoskopi, men även lung-, sköldkörtel-, hjärn-, hjärt- och urologiska ingrepp. De flesta använde moderna djupinlärningsmetoder, såsom konvolutionella neurala nätverk, tränade för att upptäcka sjukdom, känna igen anatomi, bedöma tarmrengöring eller identifiera steg i en operation. Sjuttiosex av dessa studier rapporterade tillräckligt med detaljer för att författarna skulle kunna slå ihop resultaten och beräkna hur ofta AI respektive människor hade rätt eller fel.

AI ensam kontra läkare, och AI som lagkamrat

När forskarna jämförde AI med oassisterade kliniker som tittade på samma videor upptäckte man att AI-system i allmänhet fångade fler verkliga problem (högre sensitivitet) utan att orsaka fler falska larm (liknande specificitet). Detta mönster höll i både tester på bekanta data och när modellerna ställdes mot nya, externa dataset. Den mest kliniskt relevanta upptäckten gällde dock när AI användes som assistent. Över ett brett spektrum av uppgifter var kliniker som kunde se AI-förslag bättre på att hitta sjukdom och mindre benägna att felklassificera normalt vävnad än de som arbetade ensamma. Denna förbättring var särskilt tydlig för icke-experter, såsom underläkare och traineer, som drog störst nytta av AI-vägledning. För erfarna specialister presterade AI-assistans och AI ensamt på ungefär samma nivå, vilket tyder på att i expertens händer kan människa–maskin-kombinationen matcha de bästa fristående algoritmerna.

Skillnader mellan laboratorieförhållanden och verkligheten

Trots dessa lovande siffror belyser översikten en klyfta mellan hur AI testas i dag och hur den måste fungera i verkliga kliniska miljöer. Många studier rengjorde sina data genom att ta bort suddiga eller lågkvalitativa video­rutor, trots att operationssalar och endoskopienheter ofta hanterar just sådana brister. Andra analyserade isolerade ögonblicksbilder istället för kontinuerlig video och undvek därigenom utmaningen att följa rörelse och timing. Få studier utvärderade AI i realtid vid sängkanten, och de flesta förlitade sig på avancerad utrustning som kanske inte finns tillgänglig på sjukhus med begränsade resurser. Rapporteringen var också inkonsekvent: nyckeldetaljer om hur modeller ställdes in och validerades saknades ofta, vilket gör det svårt för andra att reproducera eller rättvist bedöma resultaten.

Figure 2
Figure 2.

Bygga trovärdiga människa–AI-partnerskap

Författarna argumenterar för att AI inom kirurgi och interventionell medicin bör utvecklas och testas från början som en partner för kliniker, inte som en ersättning. Det innebär att utforma studier som speglar verkliga förhållanden, dela mångsidiga videodatamängder mellan centra och anta tydliga rapporteringsstandarder så att andra team kan verifiera och förbättra publicerat arbete. Det innebär också att utbilda kliniker att förstå AIs styrkor och biaser, snarare än att blint lita på eller avfärda dess förslag. Medan meta-analysen visar att AI redan kan matcha eller överträffa oassisterad mänsklig prestanda i många video­baserade uppgifter, ligger den mest meningsfulla vinsten i hur den kan skärpa mänskligt omdöme. För patienter är slutsatsen inte att maskiner kommer ta över operationssalen, utan att noggrant utformade människa–AI-team kan göra procedurer säkrare, möjliggöra tidigare diagnoser och förbättra utfallen.

Citering: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2

Nyckelord: kirurgisk video-AI, datorstödd endoskopi, människa–AI-samarbete, medicinsk bildanalys, kliniskt beslutsstöd