Clear Sky Science · sv

R3MV: en ny pålitlig systemarkitektur för hudcancerklassificering med en progressiv heterogen multiblokksmodell

· Tillbaka till index

Varför denna forskning är viktig för din hud

Hudcancer är en av de vanligaste cancerformerna globalt, och tidig upptäckt kan vara skillnaden mellan ett enkelt ingrepp och ett livshotande sjukdomstillstånd. Dermatologer vänder sig i allt större utsträckning till artificiell intelligens (AI) för att hjälpa till att upptäcka farliga födelsemärken i bilder tagna med kameror och dermoskop. Men om olika AI‑system inte är överens om samma hudfläck, vilket system ska läkaren då lita på? Denna studie presenterar ett nytt sätt att kombinera flera AI‑perspektiv till ett enda, mer pålitligt beslut om en lesion är cancerös.

Figure 1
Figure 1.

Problemet med att lita på bara en enda smart maskin

De flesta befintliga AI‑verktyg för hudcancer bygger på att träna en kraftfull modell på en enda datamängd. Dessa system kan se imponerande ut i laboratorietester, men deras prestanda sjunker ofta när de möter bilder från nya kliniker, kameror eller patientgrupper. Tidigare utvärderingar inom dermatologi har pekat på svag extern validering och dålig generaliseringsförmåga: modeller som fungerar bra på en noggrant kurerad datamängd kan få problem i verkliga sjukhusmiljöer. Eftersom ett felaktigt svar kan försena behandling eller leda till onödiga biopsier argumenterar författarna för att förlita sig på en enda modell är riskabelt för kliniska beslut.

Ett nytt flerstämmigt röstningssystem

För att hantera detta föreslår forskarna en tre‑nivåarkitektur kallad R3MV, en förkortning för ett pålitligt tre‑nivå majoritetsröstningssystem. I stället för att fråga en AI‑modell om ett svar låter R3MV samma hudbild passera tre olika beslutsvägar. Den första vägen använder ett djupt konvolutionellt neuralt nätverk som direkt klassificerar bilden. Den andra vägen matar flera olika djupa nätverk, slår samman de mönster de hittar och skickar dessa kondenserade egenskaper till en traditionell klassificerare. Den tredje vägen ser på förutsägelserna från flera individuella modeller och tränar en annan klassificerare på dessa utdata. Slutligen gör systemet en majoritetsomröstning över de tre vägarna, så det slutliga utslaget speglar en konsensus snarare än en enskild uppfattning.

Ett smartare sätt att läsa hudbilder

I hjärtat av den första vägen ligger en egenutvecklad bildmodell kallad Progressive Heterogeneous Multi‑Block CNN (PHMBCNN). Detta nätverk är uppbyggt av flera specialiserade block som var och en framhäver olika visuella aspekter av lesionen, såsom fina texturer eller bredare strukturer, i en progressiv ordning från ytliga till djupa lager. Författarna förbättrar ytterligare denna modell genom att lägga till en Gated Recurrent Unit (GRU), en typ av minnesmodul som hjälper nätverket att fånga relationer över kanaler och lager. Denna uppgraderade version, PHMBCNN‑GRU, fungerar både som en stark fristående klassificerare och som en viktig källa till funktioner för de andra vägarna i systemet.

Låta flera modeller lära tillsammans

Den andra vägen fokuserar på att kombinera styrkor från olika bildnätverk. Samma lesionbild passeras genom PHMBCNN‑GRU och flera populära förtränade modeller som ursprungligen utvecklats för vanliga fotografier. Varje modell extraherar sitt eget högdimensionella ”fingeravtryck” av lesionen. Dessa fingeravtryck sammanfogas och komprimeras sedan med tekniker som tar bort redundanta eller ohelpfulla uppgifter, så att bara de mest informativa egenskaperna behålls. En multilager‑perceptron, ett klassiskt flerskikts neuralt nätverk, lär sig sedan att klassificera lesioner baserat på denna förfinade gemensamma beskrivning, vilket effektivt blandar vad varje modell ”ser” till en enda, skarpare vy.

Figure 2
Figure 2.

Göra oenighet till ett starkare svar

Den tredje vägen, kallad beslutsnivåfusionsvägen, tar en ännu högre nivå av perspektiv. Här behandlar författarna varje modells förutsagda etikett som en ingång och tränar en supportvektormaskin för att känna igen mönster i modellernas överenskommelser och oenigheter. Denna meta‑klassificerare lär sig till exempel när vissa modellkombinationer vanligtvis indikerar en benign fläck eller när en viss modell tenderar att göra fel på specifika lesiontyper. Över alla tre vägar förbehandlade forskarna bilderna noggrant—ändrade storlek, tog bort hårartefakter och balanserade klasser—för att bättre spegla den röriga verkligheten i kliniska bilder tagna med både dermoskop och mobiltelefon.

Hur väl systemet presterar i praktiken

Teamet testade sin metod på två allmänt använda bildsamlingar för hudcancer: HAM10000, som innehåller högkvalitativa dermoskopbilder från kliniska centra, och PAD_UFES_20, som inkluderar mobilbilder med tydligare artefakter som tätt hår och bläckmärken. Den förbättrade PHMBCNN‑GRU‑modellen ensam förbättrade noggrannheten jämfört med sin baskonfiguration på båda datasetten. Viktigare är att när alla tre vägar kombinerades via majoritetsröstning i R3MV‑systemet steg prestandan ytterligare, och nådde cirka 99 % noggrannhet på HAM10000 och omkring 82 % på PAD_UFES_20. Att ta bort hår från lesionerna förbättrade också konsekvent resultaten, vilket visar hur avgörande noggrann bildrensning är för automatiserad diagnostik.

Vad detta betyder för framtida hudundersökningar

För icke‑specialister är huvudbudskapet att detta arbete för AI för hudcancer från en enda ”svart låda” mot en panel av oberoende ”åsikter” som måste vara överens innan en lesion flaggas som misstänkt. Medan R3MV inte helt löser utmaningen att få ett system att fungera lika bra över alla kliniker och kameratyper, visar det att en blandning av olika modeller och röstning mellan dem kan ge mer pålitliga svar än att förlita sig på bara en. Med tiden skulle sådana flerstigssystem kunna stödja dermatologer genom att erbjuda mer stabila, förklarliga och trovärdiga bedömningar av vilka hudfläckar som förtjänar närmare uppmärksamhet eller en biopsi.

Citering: Reshma, S.K., Reeja, S.R. R3MV: a novel reliable system architecture for skin cancer classification using progressive heterogeneous multiblock model. Sci Rep 16, 13599 (2026). https://doi.org/10.1038/s41598-026-40522-6

Nyckelord: upptäckt av hudcancer, dermatologi AI, ensemble av djupa lärmodeller, medicinsk bildanalys, datorstödd diagnos