Clear Sky Science · ja
YOLOv4 と DeepSORT を用いた会衆・群衆の拡散流動の予測
上空から群衆を監視する意義
何百万もの人が一か所に集まると、ちょっとしたつまずきや突然の突進が数秒で危険な事態に変わり得ます。サウジアラビアで行われる年次のハッジやウムラ巡礼には最大で400万人が集まり、地球上で最も密な群衆が形成されることがあります。本論文は、人工知能を使ってこうした大規模な動く群衆をカメラで監視し、自動で人数を数えて移動を追跡し、危険な混雑が生じる前に当局に警告する方法を探ります。
大規模な集まり、大きなリスク
従来の群衆管理は人間の観察者、固定の柵、綿密に計画された通路に依存してきました。しかし人の目は疲れ、群衆は予測し難い行動をとります。ハッジの際には、参拝者が歩道や道路、広い広場を移動し、そこが瞬時にボトルネックになることがあります。著者らは、人々がどこで密集しているか、どこで広がっているか、そしてどれくらいの速度で出入りしているかをリアルタイムで全体像として把握できるツールが必要だと主張します。
コンピュータに人の見分け方を教える
そのようなツールを構築するために研究者たちは二つの高度なコンピュータビジョン手法を用います。ひとつ目は YOLOv4 と呼ばれるもので、画像中の人を箱で囲んで検出でき、密集した場面でも個々の人を見つけられるよう訓練されています。二つ目は DeepSORT と呼ばれ、検出結果を複数の映像フレームにわたって追跡し、各人に目に見えないIDを割り当てて軌跡を追えるようにします。チームはアラファト山周辺の複数の地点で撮影された2019年のハッジの大規模な画像・映像コレクションを収集し、数万件に及ぶ人の頭部や体に注意深くラベルを付け、ぼやけた素材を取り除き、照明や角度、群衆密度の違いでも信頼性を保てるようにデータ拡張を行いました。

動く点から群衆レベルへ
システムが個人を検出して追跡できるようになると、これらの動く点を群衆の振る舞いの可視化に変換できます。ある領域に出入りする人数や密度を数えることで、群衆の密度を直感的な三段階(低・中・高)に分類します。大まかな推定や遅延した報告に頼る代わりに、運営者はどこで人が滑らかに広がっているか、どこで致命的なネックポイントが形成されつつあるかを把握できます。DeepSORT は、人が互いに視界を遮り合ったり(巡礼者の主に白い衣服のように)非常に似て見えたりする状況にも対応するよう設計されており、視覚的に混乱しやすい密集場面でも安定した追跡を維持できます。
システムの性能
著者らはこのセットアップを徹底的に評価しました。YOLO 系のいくつかのバージョンや異なる追跡手法を比較し、最終的に YOLOv4 と DeepSORT の組合せが実際のハッジ映像で最良の性能を示すことが分かりました。モデルを微調整し、精選したデータセットで訓練した結果、YOLOv4 は95%以上の精度で人物を正しく検出し、検出漏れと誤報のバランスも非常に良好でした。DeepSORT は 91% を超える精度で個人を追跡し、他の人の陰に一時的に隠れても経路を回復しました。交通監視やソーシャルディスタンシングの監視、その他の群衆場面で使われる類似システムと比べて、このハッジに特化したアプローチは、最も良好と報告されている結果と同等かそれ以上の性能を、最も厳しい環境の一つで発揮しました。

現場での実際的な意味
実運用では、この種のシステムは既存の監視カメラの裏側に組み込まれ、巡礼者の動きを継続的に監視できます。歩道の収容上限に近づいたり、広場が不均一に混み始めたりした際に、ソフトウェアが当局へ警報を出し、柵の調整や導線の変更、現場ボランティアへの連絡を促すことができます。安全確保のほか、医療チームや仮設トイレ、輸送の配置改善にも同じ洞察が役立ち、将来のシーズンのために実データに基づくルート再設計を支援します。著者らは、同様の手法が主要なスポーツ大会やコンサート、フェスティバルでも有用であると指摘しています。
群衆を導くより賢く安全な方法
一般向けの要点は明快です。コンピュータは今や大規模な群衆を人間チームよりも丁寧かつ一貫して監視し、生の映像を早期警報や実用的な指示へと変換できます。人物検出と追跡を一つの堅牢なシステムに組み合わせることで、本研究は数百万の巡礼者の流れをリアルタイムで監視し、各領域の混雑度を分類し、危険が生じる前に行動できる可能性を示しています。さらに開発を進め、責任ある運用を行えば、このようなツールは大規模な宗教行事やその他の集会をより安全で円滑、かつ参加者にとってストレスの少ないものにすることができるでしょう。
引用: Aljojo, N., Ardah, H., Alamri, A. et al. Predicting congregational and crowd spread-out flow using YOLOv4 and DeepSORT. Sci Rep 16, 13869 (2026). https://doi.org/10.1038/s41598-026-44719-7
キーワード: 群衆管理, コンピュータビジョン, ハッジの安全性, 物体追跡, 深層学習