Clear Sky Science · sv

En lättviktsmetod baserad på YOLOv8n för detektion av onormal människoposition

2026-02-04 · Tillbaka till index

Varför det är viktigt att upptäcka ovanliga kroppsställningar

Fall, plötslig bröstsmärta eller att någon kollapsar i en korridor händer ofta på några sekunder, och om ingen är i närheten kan hjälpen komma för sent. Denna artikel presenterar ett kompakt artificiellt intelligenssystem som kan övervaka vanlig video från övervaknings‑ eller vårdkameror och automatiskt markera farliga, onormala kroppsställningar i realtid. Genom att göra mjukvaran både noggrann och lättviktig vill forskarna göra pålitlig fall‑ och händelsedetektion tillgänglig på vardagliga enheter, från sjukhusmonitorer till billigare kameror i äldres hem.

Från enkla kameror till smartare vaksamhet

Moderna övervakningssystem använder redan datorseende för att upptäcka personer och följa deras rörelser, men ovanliga kroppsställningar är särskilt svåra att fånga. En person kan se helt annorlunda ut när hen står, håller sig för bröstet, kräks eller ligger på golvet, och dessa händelser är korta, varierade och ofta delvis dolda av möbler eller dålig belysning. Befintliga algoritmer kan vara mycket exakta, men de är ofta tunga och långsamma, vilket kräver kraftfull hårdvara och noggrann finjustering. Författarna fokuserar på att göra detektionen både snabb och sparsam med beräkningsresurser så att den kan köras på vanliga grafikkort eller till och med inbäddade enheter utan att tumma på tillförlitligheten.

En slankare kärna för att känna igen riskfyllda poser

Kärnan i arbetet är en förbättrad version av den populära objekt‑detektionsmodellen YOLOv8n. Forskarna bygger en lättare, mer fokuserad variant som de kallar PSD‑YOLOv8n. För det första lägger de till en ny uppmärksamhetsmodul, PoseMSA, som hjälper nätverket att koncentrera sig på de mest informativa delarna av en persons kropp samtidigt som störiga bakgrunder ignoreras. Den gör detta med strömlinjeformade operationer som efterliknar att titta både över bilden och genom olika funktionslager, vilket förstärker de signaler som är viktiga för hållningen samtidigt som antalet beräkningar hålls lågt. För det andra omformar de hur modellen "zoomar in" på detaljer med en KA‑Sample upsamping‑block, som lär sig att skärpa områden kring nyckel‑kroppspunkter — som huvud, torso och lemmar — så att vridna eller kollapsade poser framträder tydligare.

Skarpare ramar och klarare beslut

Med insikten att onormala kroppsställningar ofta flyter ihop med omgivningen — tänk en person utspridd delvis under ett bord — förbättrar författarna även det sista beslutssteget, känt som detektionshuvudet. Deras Detect‑PSA‑modul blandar information från flera skalor och tillämpar ett sannolikhetsbaserat sätt att rita begränsningsrutor. Istället för att gissa en enda skarp kant för var en person börjar och slutar representerar systemet varje sida av rutan som en liten fördelning av troliga positioner och beräknar sedan ett medelvärde. Detta tillvägagångssätt gör konturerna stabilare när lemmar förkortas i perspektiv, är ockluderade eller sträcks ut längs golvet, vilket leder till rutor som bättre matchar mänskligt ritad sann mark‑sanning i utmanande scener.

Sätta systemet på prov

För att se hur väl deras design fungerar i praktiken skapade teamet en dedikerad bildsamling, SSHDataset, byggd från inomhusvideor med flera vinklar som visar personer i fyra tillstånd: normal, bröstsmärta, kräkning och fall. Efter noggrann manuell märkning och dataaugmentation tränade de PSD‑YOLOv8n och en rad konkurrerande modeller under identiska förhållanden. På standardmått för noggrannhet nådde deras metod en detektionspoäng på 97,8 % vid en vanlig överlappströskel och behöll stark prestanda även under striktare kriterier. Samtidigt använde den bara omkring två miljoner parametrar och en viktfil på 4,5 megabyte — ungefär en tredjedel färre parametrar och över en tredjedels mindre beräkning än originalet YOLOv8n — samtidigt som den kördes i mer än 80 bildrutor per sekund. Tester på en oberoende publik fall‑detektionsdatamängd visade att förbättringarna bar över till nya data, med särskilt starka förbättringar för att upptäcka faktiska fall.

Vad detta betyder för vardaglig säkerhet

I enkla ordalag levererar studien en kompakt digital "livräddare" som kan övervaka livevideo och pålitligt märka när någons kroppsställning signalerar fara. Genom att omsorgsfullt omarbeta hur modellen fokuserar på kroppsområden, återskapar fina detaljer och ritar rutor runt personer uppnår författarna en sällsynt kombination av hög noggrannhet, snabbhet och liten storlek. Ett sådant system skulle kunna bäddas in i sjukhusmonitorer, smarta hemhubbar eller kameror i offentliga miljöer för att trigga snabba larm vid fall eller plötslig nöd, även i röriga rum och under varierande ljusförhållanden. När metoden vidareutvecklas och utökas till längre videosekvenser och nya miljöer kan den ligga till grund för en ny generation tysta, ständigt aktiva väktare som hjälper till att hålla sårbara personer säkrare utan att kräva ständig mänsklig övervakning.

Citering: Li, G., Zhang, J., Ji, Q. et al. A lightweight YOLOv8n-based method for human abnormal posture detection. Sci Rep 16, 7222 (2026). https://doi.org/10.1038/s41598-026-37903-2

Nyckelord: falluppfattning, människohållning, datorseende, lättvikts-AI, äldreomsorg