Clear Sky Science · ja
人工知能技術下におけるスキー動作認識へのLSTM-CNN応用
ゲレンデでのより賢いコーチング
スキーヤー、コーチ、観客は、カーブやジャンプの一瞬に何が起きているかを理解するために映像に頼ることが増えています。しかし現実の環境では、雪しぶき、木々、変化する光、混雑したゲレンデがコンピュータによる正確な動作認識を難しくします。本稿は、こうした屋外の雑多な条件でも通常の映像から高精度にスキー技術を自動で読み取れる新しい人工知能システムを提示します。この技術は将来、リアルタイムのコーチングツール、安全なトレーニング、そしてウィンタースポーツにおけるより洞察に富んだパフォーマンス解析を実現する基盤になり得ます。
なぜコンピュータにスキーを見せるのは難しいのか
スキーは動きが速く三次元的で、かさばる服や選手自身の体によって部分的に隠れることが多いため解析が難しい競技です。同時に、屋外のシーンには木々、雪の盛り上がり、強い反射、変わりやすい天候などの雑音が多く含まれます。従来の映像ベースのシステムは、単一フレームの静的な外観に偏り過ぎるか、動きの時間的展開を適切に追跡できないことがありました。その結果、類似の動作を混同したり、視界が悪い状況で性能が低下したり、新しい選手や斜面条件に対して堅牢でないという問題がありました。

スキー動作の二眼的な捉え方
著者らは、スキー映像を同時に二つの補完的な方法で観察するモデルを設計しました。一方の“目”は通常のカラーフレームを見て、スキーヤーや周囲の外観を捉えます。もう一方の“目”はフレーム間でピクセルがどのように移動したかを追うオプティカルフローに注目し、動きを重視します。この動きの場から、スキーや脚、胴体などの真に活動的な領域を強調し、木や雪の斜面といった静的な背景を弱めるサリエンシーマップを構築します。両ストリームは3D畳み込みネットワークを通り、空間と短時間にまたがるパターンを学習して、各映像セグメントを外観と動きの簡潔な特徴表現に凝縮します。
見たものと動き方の融合
二つの情報ストリームを単に重ねるか平均する代わりに、モデルは解析する各クリップごとにどちらにどれだけ重みを与えるかを学習します。例えば、プラウブレーキのようにスキーが特徴的な形状を作る動作では外観の手掛かりが重要ですし、パラレルターンのような滑らかな動きではリズムや方向の情報がより有益です。学習可能なフュージョンモジュールは二つの特徴集合を正規化して、常に合計が1になる訓練された重みで組み合わせることで、これらの寄与を自動的に調整します。この適応的な融合により、システムはその時々の動作に最も情報量の多い視覚的証拠に集中でき、多様なスキースタイルや環境にまたがって認識精度と信頼性を向上させます。

各ターンの全体像を読み解く
スキーで動作を認識するには単一のポーズを見るだけでなく、開始から終了までのシーケンスがどのように展開するかを捉える必要があります。そのため、融合された特徴は前後両方向に時間を見渡す双方向の再帰ネットワークに入力されます。過去のフレームだけに依存するのではなく、将来のフレームからのヒントも用いることで、スキーヤーが何をしているかを理解します。これにより、スナップショットでは似て見えるがタイミングや協調性で異なる動作を区別しやすくなります。実世界のスキー映像を大量に集めたSkiTBデータセットでのテストでは、本システムは複数の既存手法を上回り、約93%の精度とF1スコアを達成しました。異なる天候、未見の選手、人工ノイズを加えた映像で評価しても85%を超える正答率を維持しました。
スキーヤーとスポーツ技術にとっての意義
焦点を絞った動作認識、視覚手掛かりの適応的融和、そして時間を意識した動きの読み取りを組み合わせることで、提案モデルは混雑や変化のある環境下でもスキーヤーがターン、ブレーキ、ジャンプをしているかどうかを確実に識別できます。専門外の読者にとっての要点は、システムが単にフレームを数えるだけでなく、どこを見ればよいか、何が最も重要か、そして一連の動作がどのように展開するかを学習する点です。このアプローチは客観的なフィードバックを提供するインテリジェントなトレーニングアシスタント、リスクのあるパターンを検出して怪我を防ぐ支援、より豊かな放送解析の基盤になり得ます。著者らは極端な天候や極めて短い宙返り技などは依然として挑戦的であると指摘していますが、本フレームワークはスキーや他の多くの屋外スポーツにおける将来のスマートコーチングツールのための堅牢な基盤を提供します。
引用: Zhang, W., Xu, L. & Wang, L. Application of LSTM-CNN in skiing action recognition under artificial intelligence technology. Sci Rep 16, 11547 (2026). https://doi.org/10.1038/s41598-026-42324-2
キーワード: スキー動作認識, スポーツ映像解析, 深層学習, オプティカルフロー, 選手パフォーマンス