Clear Sky Science · sv

En metod för att upptäcka trötthet vid bilkörning baserad på förarens kroppshållning och ansiktsstatus

· Tillbaka till index

Varför trötta förare berör oss alla

De flesta av oss har känt hur ögonlocken blir tunga på en lång resa, men få inser hur ofta det dåsiga ögonblicket leder till en olycka. Denna artikel beskriver ett kamerabaserat system som bevakar förarens ansikte, hållning och händer för att upptäcka tidiga tecken på trötthet och ge varningar i rätt tid, utan att fästa några sensorer på kroppen eller ändra hur folk kör.

Att övervaka föraren, inte bara bilen

Trafikmyndigheter uppskattar att trötthet ligger bakom en stor andel allvarliga trafikolyckor globalt. Traditionella varningssystem har fokuserat på signaler från bilen, som styrkorrigeringar eller avvikelse från filen, eller på medicinska sensorer som mäter hjärn- eller hjärtaktivitet. Dessa metoder kan vara dyra, obekväma eller opålitliga när förare eller vägförhållanden varierar. Studien förlitar sig istället på vanlig video från små kameror i bilen för att direkt avläsa förarens beteende, med modern artificiell intelligens för att tolka vad som syns.

Figure 1. Inbyggda kameror i bilen följer förarens hållning, ansikte och händer för att upptäcka dåsighet och utlösa en säkerhetsvarning.
Figure 1. Inbyggda kameror i bilen följer förarens hållning, ansikte och händer för att upptäcka dåsighet och utlösa en säkerhetsvarning.

Läsa ögon, mun, huvud och händer

Forskarna bryter först ner hur trött körning ser ut i vardagliga termer. Varningssignaler inkluderar långsammare, längre blinkningar, upprepade gäspningar, hängande eller lätt lutande huvud och att händerna glider bort från ratten. Med hjälp av en pose-estimeringsmetod kallad AlphaPose spårar systemet 119 nyckelpunkter på förarens kropp, särskilt runt ögon, mun, huvud och handleder. Från dessa punkter beräknas enkla mått, såsom hur stort ögon- och munöppningarna är och hur långt huvudet har lutat eller sjunkit i förhållande till nacke och ögon. Det kontrollerar också om varje handled håller sig nära ratten över tid eller driver bort, vilket antyder att föraren inte längre har fast kontroll.

Se från flera vinklar över tid

Eftersom ett enstaka ögonblick kan vara missvisande tittar systemet på korta videoklipp snarare än isolerade bilder. Till exempel kan en normal blinkning likna sömnigt ögonlocksslut, och en snabb blick mot instrumentpanelen kan se ut som att man nickar till om den ses ensam. För att undvika sådana fel analyserar metoden förändringar över minst 20 konsekutiva bildrutor och kontrollerar om trötthetstecken består. Den använder också tre kameravinklar från Driving Monitoring Dataset: en frontvy av ansiktet, en sidovy av överkroppen och en närbild av händerna. Tillsammans gör dessa vinklar systemet mer robust när ansiktet delvis döljs av glasögon, starkt solljus, rörelseoskärpa eller huvudvridningar.

Figure 2. Stegvisa förändringar i ögon, huvudlutning och grepp om ratten över tid avslöjar när föraren går från alert till dåsig.
Figure 2. Stegvisa förändringar i ögon, huvudlutning och grepp om ratten över tid avslöjar när föraren går från alert till dåsig.

Intelligens bakom upptäckten

På insidan har systemet två huvuddelar. Först hittar en snabb objekt-detektor kallad YOLOv11n* föraren i varje bildruta så att AlphaPose kan markera kroppens nyckelpunkter noggrant. Författarna förbättrar denna detektor med en speciell hybrid pooling-block som hjälper nätverket att förstå både bred kontext och fina detaljer som ögon och fingrar. För det andra matas positionerna och konfidenspoängen för alla spårade nyckelpunkter in i ett Long Short-Term Memory (LSTM)-nätverk, en modelltyp som lämpar sig väl för sekvenser. LSTM:n lär sig hur kombinationer av förändringar i ögon, mun, huvud och händer utvecklas över tid när en förare är alert, lätt trött eller kraftigt utmattad, och ger sannolikheten för varje trötthetsnivå för det aktuella tidsfönstret.

Hur väl systemet fungerar i praktiken

Teamet testade sin metod på en stor offentlig dataset med videor inifrån bilen, och tränade samt utvärderade modellerna på tusentals märkta bilder och klipp. Jämfört med flera ledande djupinlärningsmetoder, inklusive andra kombinationer av konvolutionsnät, transformermodeller och LSTM:er, uppnådde det föreslagna AlphaPose*–LSTM-ramverket högst rapporterad noggrannhet, precision och F1-poäng för klassificering av trötthetsnivåer. Det körde även snabbt nog för nästintill realtidsbruk: efter de första 20 bildrutorna kan nya trötthetsuppskattningar uppdateras ungefär var 48 millisekund, vilket är lämpligt för kontinuerlig övervakning i rörliga fordon.

Vad detta betyder för vardaglig körning

Enkelt uttryckt visar studien att en bil kan använda kameror och smart mjukvara för att leta efter kännetecken på en trött förare, genom att kombinera små förändringar i ögon, mun, huvud och händer till en pålitlig bild av vakenhet. Medan det nuvarande systemet är anpassat för dagsljus och skulle behöva justeras för nattkörning eller andra miljöer, tyder resultaten på att icke-invasiv, visionbaserad övervakning kan bli en praktisk säkerhetsfunktion. Genom att känna igen trötthet tidigt och uppmana föraren att ta en paus skulle sådan teknik kunna förebygga många olyckor som i dag inträffar eftersom någon var för trött för att hålla sig fullt vaken vid ratten.

Citering: Hao, Y., Sun, X., Liu, H. et al. A fatigue driving detection method based on driver posture and facial state analysis. Sci Rep 16, 15159 (2026). https://doi.org/10.1038/s41598-026-44994-4

Nyckelord: förartrötthet, dåsig körning, förarövervakning, datorseende, vägsäkerhet