Clear Sky Science · it

Un metodo leggero basato su YOLOv8n per il rilevamento di posture umane anomale

· Torna all'indice

Perché è importante individuare posture corporee insolite

Cadute, improvvisi dolori al petto o il crollo di una persona in un corridoio si verificano spesso in pochi secondi e, se non c’è qualcuno nelle vicinanze, l’aiuto può arrivare troppo tardi. Questo articolo presenta un sistema di intelligenza artificiale compatto che può analizzare video comuni provenienti da telecamere di sorveglianza o di case di cura e segnalare automaticamente posture pericolose o anomale in tempo reale. Rendendo il software accurato e leggero, i ricercatori puntano a portare un rilevamento affidabile di cadute e eventi sanitari su dispositivi di uso quotidiano, dai monitor ospedalieri alle telecamere economiche nelle abitazioni degli anziani.

Dalle semplici telecamere a una sorveglianza più intelligente

I sistemi di monitoraggio moderni già sfruttano la visione artificiale per rilevare persone e tracciare i loro spostamenti, ma le posture anomale sono particolarmente difficili da identificare. Una persona può apparire molto diversa quando è in piedi, si tiene il petto, vomita o giace a terra; questi eventi sono brevi, variabili e spesso parzialmente nascosti da mobili o da scarsa illuminazione. Gli algoritmi esistenti possono essere abbastanza accurati, ma spesso sono voluminosi e lenti, richiedendo hardware potente e messa a punto accurata. Gli autori si concentrano nel rendere il rilevamento sia rapido sia parsimonioso in termini di risorse di calcolo, in modo che possa funzionare su schede grafiche comuni o persino su dispositivi embedded senza compromettere l’affidabilità.

Figure 1
Figure 1.

Un “cervello” più snello per riconoscere pose a rischio

Il nucleo del lavoro è una versione migliorata di un popolare modello di rilevamento oggetti chiamato YOLOv8n. I ricercatori costruiscono una variante più leggera e mirata che chiamano PSD‑YOLOv8n. In primo luogo introducono un nuovo modulo di attenzione, PoseMSA, che aiuta la rete a concentrarsi sulle parti del corpo più informative, ignorando gli sfondi confusi. Lo fa con operazioni snelle che imitano una visione sia trasversale sull’immagine sia attraverso i diversi livelli di feature, potenziando i segnali rilevanti per la postura mantenendo basso il numero di calcoli. In secondo luogo riprogettano come il modello "ingrandisce" i dettagli tramite un blocco di upsampling KA‑Sample, che impara a mettere a fuoco le aree attorno ai punti chiave del corpo — come testa, tronco e arti — in modo che posture contorte o collassate risaltino più chiaramente.

Riquadri più netti e decisioni più chiare

Riconoscendo che le posture anomale spesso si confondono con l’ambiente — pensate a una persona distesa parzialmente sotto un tavolo — gli autori ristrutturano anche la fase finale di decisione, nota come detection head. Il loro modulo Detect‑PSA fonde informazioni a più scale e applica un modo basato sulla probabilità per tracciare i bounding box. Invece di indovinare un singolo bordo netto per dove inizia e finisce una persona, il sistema rappresenta ciascun lato del riquadro come una piccola distribuzione di posizioni probabili e poi le media. Questo approccio rende i contorni più stabili quando arti sono in prospettiva ridotta, occlusi o distesi sul pavimento, portando a riquadri che corrispondono più da vicino ai dati annotati dall’uomo in scene difficili.

Figure 2
Figure 2.

Mettere il sistema alla prova

Per valutare quanto funzioni nella pratica, il team ha creato una raccolta di immagini dedicata, l’SSHDataset, costruita da video indoor ripresi da più angolazioni che mostrano persone in quattro stati: normale, dolore toracico, vomito e caduta. Dopo un attento labeling manuale e l’augmentazione dei dati, hanno addestrato PSD‑YOLOv8n e una serie di modelli concorrenti con impostazioni identiche. Sulle misure standard di accuratezza, il loro metodo ha raggiunto un punteggio di rilevamento del 97,8% a una soglia comune di sovrapposizione e ha mantenuto buone prestazioni anche con criteri più severi. Allo stesso tempo ha utilizzato solo circa due milioni di parametri e un file di pesi di 4,5 megabyte — circa un terzo di parametri in meno e oltre un terzo di calcolo in meno rispetto al YOLOv8n originale — pur girando a più di 80 fotogrammi al secondo. Test su un dataset pubblico indipendente per il rilevamento delle cadute hanno mostrato che i guadagni si trasferiscono a nuovi dati, con miglioramenti particolarmente forti nel riconoscere cadute reali.

Cosa significa per la sicurezza quotidiana

In parole semplici, lo studio offre un “bagnino” digitale compatto che può osservare video in diretta e rilevare con affidabilità quando la posizione del corpo di una persona segnala un pericolo. Rivedendo con attenzione come il modello si focalizza sulle regioni del corpo, ricostruisce dettagli fini e disegna riquadri attorno alle persone, gli autori ottengono una rara combinazione di alta accuratezza, velocità e dimensioni ridotte. Un sistema del genere potrebbe essere incorporato in monitor ospedalieri, hub domestici intelligenti o telecamere in spazi pubblici per attivare allarmi tempestivi in caso di cadute o disturbi improvvisi, anche in stanze ingombre e con illuminazione variabile. Man mano che l’approccio viene ulteriormente raffinato ed esteso a sequenze video più lunghe e nuovi ambienti, potrebbe dare origine a una nuova generazione di guardiani silenziosi e sempre attivi che contribuiscono a mantenere le persone vulnerabili più al sicuro senza richiedere supervisione umana continua.

Citazione: Li, G., Zhang, J., Ji, Q. et al. A lightweight YOLOv8n-based method for human abnormal posture detection. Sci Rep 16, 7222 (2026). https://doi.org/10.1038/s41598-026-37903-2

Parole chiave: rilevamento delle cadute, postura umana, visione artificiale, IA leggera, assistenza agli anziani