Clear Sky Science · ja

個体再識別と表現型解析のための野外魚類画像データセット

· 一覧に戻る

魚の顔を詳しく観察することが重要な理由

野生動物は一見似ていることが多いですが、それぞれの個体が成長、移動、生存の独自の履歴を持っています。海洋生物学者がこうした履歴を追うには、通常は魚を捕まえ、タグを装着し、後で再捕獲を期待するという手間と動物への負担を伴う方法が用いられます。本研究は、沿岸に生息する色鮮やかな魚「コルクウィング・ラース(corkwing wrasse)」の大規模かつ公開された画像コレクション「Melops」を紹介します。これは魚の顔の模様だけで個体を識別し、外見の時間的変化を測定できるように設計されています。

Figure 1
Figure 1.

成長する野外魚のフォトアルバム

ノルウェー西部の沿岸で7年間にわたり、研究者は約1万匹に近い野生のコルクウィング・ラースを繰り返し捕獲しました。各個体について、体長、性別、健康状態を記録し、信頼できる識別のために小型の電子タグを埋め込み、標準的な白い背景で左右両側の写真を撮影しました。この入念な手順により24,578枚の画像が生成され、そのうち8,500枚以上は複数回撮影された個体の写真です。多くの個体が数か月から数年にわたり再捕獲されたため、このデータセットは実際の野生個体が年齢や繁殖、傷からの回復に伴って大きさ、色、体調をどのように変えるかを捉えています。

生の写真を機械学習向けデータに変える

これらの画像を人工知能で活用できるようにするため、研究チームは写真を保存するだけにとどまりませんでした。画像の一部は手作業で丹念に注釈付けされ、魚の輪郭、頭部領域、吻(ふん)、眼、尾基部など11か所の解剖学的ランドマークがマークされました。これらの例は、画像内の魚を自動的に検出し、全身や頭部のみを切り出し、重要な体の特徴をコレクション全体にわたって特定できる最新のコンピュータビジョンモデル(YOLOv8)の学習に用いられました。その結果、全身、頭部、頭部を除いた体部といった標準化された画像切り出し群と、魚上の重要点の正確な座標が得られました。

色と形状を一貫して読み取る

フィールドで変化する光条件の下で撮影されたため、研究者たちは画像間で色を比較可能にするという課題にも取り組みました。ほとんどの写真には白い参照カードが含まれており、各画像が既知の基準からどれだけずれているかを測定して明るさや色バランスを補正することが可能です。データセットで公開されたPythonおよびRのスクリプトは、これらの補正をどのように実行し、頬など特定領域から色情報を抽出するかを示しています。この慎重な標準化は、性別、季節、健康、社会的地位に関連する微妙な色差を研究するうえで不可欠です。

Figure 2
Figure 2.

人間と機械は同じ魚を見分けられるか?

コルクウィング・ラースの頭部には、顔の指紋のように機能する複雑で高コントラストの模様があります。人間がこれらの模様をどれほど利用できるかを評価するため、チームはFishFacesというシンプルなオンラインテストを構築しました。参加者には魚の頭部の照合用写真(クエリ)と2枚の候補画像が示され、時には何年も隔たった場合でも同一個体を選ぶよう求められました。経験豊富な8人の観察者は、魚が成長したり全体の色が変わっていた場合でもほぼ完璧に識別しました。データの小規模なサブセットでのこれまでのコンピュータ実験では、現行の深層学習法が困難なケースの約半分で正しい個体を特定できることが示されており、新しい大規模データセットはこれらの手法をさらに押し進めることを意図しています。

水中の生態観察にとっての意義

Melopsと関連ツールを公開することで、著者らは時間を通じて追跡された数千の野生魚に関する稀有で詳しく記録されたデータを提供します。専門外の読者にとっての主要なメッセージは、写真解析によって個体群、性比、成長、健康状態を監視できるようになり、侵襲的なタグ付けの必要性を減らせる可能性があるという点です。同じ枠組みは特徴的な模様を持つ他種にも適用でき、動物の生涯、漁業の影響、環境変化をより多くの個体を干渉せずに研究する強力な手段を提供します。

引用: Sørdalen, T.K., Malde, K., Sauvaitre, C. et al. A wild fish image dataset for individual re-identification and phenotyping. Sci Data 13, 708 (2026). https://doi.org/10.1038/s41597-026-07045-1

キーワード: 動物の個体再識別, コンピュータビジョン, 魚類生態学, 画像データセット, 色彩パターン