Clear Sky Science · ja
人口動態・健康調査データを用いた11か国の女性性器切除の機械学習による分類
この研究が重要な理由
アフリカの一部や世界のほかの地域では、何百万もの少女たちがいまだに女性性器切除(FGM)という深く有害な慣習に直面しており、身体的・心理的に生涯にわたる影響を受けています。政府や地域社会はこれをやめさせたいと考えていますが、資源は限られており、どこで少女が最も危険にさらされているかを示す信頼できるデータを得るのは難しいことがあります。本研究は、機械学習と呼ばれる現代のパターン発見ツールが大規模な健康調査を精査して、どの母親や家族、地域が慣習を続けやすいかを浮き彫りにし、どこで予防策が最も多くの少女を危害から守れるかを示す方法を提示します。
隠れた慣習を理解する
女性性器切除(FGM)は、医療的理由のない目的で女性の外部生殖器の一部を意図的に損傷したり切除したりする行為です。人権侵害として認識されており、痛み、激しい出血、感染、場合によっては死亡といった深刻な短期的問題に加え、出産時の合併症、不妊、心理的トラウマなどの長期的合併症とも関連しています。多くの国ではFGMを禁止する法律がありますが、社会的圧力、伝統、宗教や結婚に関する信念が公的規則を上回る地域では、サハラ以南アフリカの一部で依然として一般的です。より賢明な予防プログラムを設計するためには、単純な国別平均を超えて、誰が最もリスクにさらされているかのパターンを見つけるツールが必要です。
日常家庭から得られるビッグデータ
研究者らは、何千もの世帯を訪問して女性の生活や健康について尋ねる大規模な国別代表調査である人口動態・健康調査(DHS)を利用しました。東アフリカと西アフリカの11か国、2015年から2023年の間に行われた62,249人の女性の最近の調査データを統合しました。対象はすべて15~49歳で少なくとも1人の娘がいる女性でした。各母親には娘がFGMを受けたかどうかが尋ねられました。研究チームはさらに、母親の年齢、都市部か農村部か、教育水準と世帯の富、世帯の主、母親自身の切除の有無、メディアへの接触、居住国、およびFGMに関する態度や信念(宗教上必要だと考えているか、継続すべきか中止すべきかなど)に関する情報を集めました。これら多数の情報は、娘が切られた家族と切られていない家族を見分けることを学習するコンピュータモデルの原材料となりました。

リスクを認識する機械を教える
この豊富だが散発的なデータセットをコンピュータが学習できる形にするため、チームは回答をクリーニング、標準化、エンコードして、数値とカテゴリの両方をアルゴリズムが扱えるようにしました。モデルが娘が切られていない多数派を単に好むことがないよう、SMOTEと呼ばれる手法を用いてクラス不均衡に対処しました。その後、ロジスティック回帰のような単純な手法から、決定木、ランダムフォレスト、サポートベクターマシン、k近傍法、ナイーブベイズ、XGBoostといったより柔軟な手法まで、7種類の分類モデルを検証しました。各モデルはデータの80%で学習させ、残りの20%で評価し、正解率、真のケースを見落としにくいか(感度)、高リスクと低リスクの家族をどれだけ明確に区別できるかなどを示す複数の性能指標を用いました。
際立ったモデルとその判断を導く要因
検証した中で最も優れたのはランダムフォレストモデルでした。多数の決定木を組み合わせたこの手法は、より安定した予測を行い、母親を約85%の正確さで分類しました。特に娘がFGMを受けたケースを特定する点で強く、集団内のリスク水準を区別する能力が高かったです。しかし、単なる精度だけでは不十分であり、公衆衛生担当者はモデルがなぜその予測をするのかを理解する必要があります。そこで著者らはSHAPと呼ばれる解釈手法を用い、各要因がモデルの判断にどのように寄与しているかを示しました。際立って重要だった4つの要素は、母親がFGMの継続をどう考えているか、居住国、母親自身の切除経験、そしてFGMが宗教的に必要だと信じているかどうかでした。FGMの継続を支持し、高有病率国に住み、本人が切除されており、宗教的必要性を信じる母親は、娘が切られていると報告する可能性がはるかに高かったです。

数値から行動へ
これらの知見はFGMを終わらせるために取り組む人々に対する明確な示唆を与えます。モデルは、特に自分自身が切られた経験のある母親や宗教的圧力を感じている母親の態度を変えることが、少女を守る上で強い効果を持ちうることを示唆しています。また、リスクは国ごとに大きく異なることが強調されており、画一的なキャンペーンではなく、各国の状況に応じた対策が必要であることを示しています。著者らは断面データであるため因果関係を証明できないこと、リスク分類を用いる際には地域をスティグマ化しないよう慎重に行う必要があることを注意していますが、彼らの研究は機械学習が教育、地域参加、信仰に基づく働きかけが最も緊急に必要な場所を特定する助けになりうることを示しています。こうして高度なデータツールは、FGMを終わらせ少女の健康と権利を守るための静かだが重要な味方になり得ます。
引用: Gebrehana, A.K., Demoze, L., Yitageasu, G. et al. Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data. Sci Rep 16, 9944 (2026). https://doi.org/10.1038/s41598-026-40723-z
キーワード: 女性性器切除, 機械学習, サハラ以南アフリカ, 公衆衛生データ, 女性の権利