Clear Sky Science · tr
Demografik ve sağlık anketi verileri kullanılarak 11 Sahra Altı Afrika ülkesinde kadın sünnetinin makine öğrenmesi tabanlı sınıflandırılması
Bu araştırma neden önemli
Afrika’nın bazı bölgelerinde ve dünyanın diğer yerlerinde milyonlarca kız çocuk hâlâ kadın sünneti gibi derin zararlı bir uygulamayla karşı karşıya; bu uygulamanın fiziksel ve duygusal yaşam boyu süren sonuçları vardır. Hükümetler ve topluluklar bunu durdurmak istiyor, ancak kaynaklar sınırlı ve kızların en çok hangi risk altında olduğunu gösteren güvenilir veriler elde etmek zor olabiliyor. Bu çalışma, makine öğrenmesi olarak bilinen modern örüntü bulma araçlarının, büyük sağlık anketlerini tarayarak hangi anne, aile ve toplulukların uygulamayı sürdürmeye en yatkın olduğunu ve hangi bölgelerde önleme çabalarının en çok kız çocuğunu zarardan koruyabileceğini nasıl ortaya çıkarabileceğini gösteriyor.
Gizli bir pratiği anlamak
Kadın sünneti (FGM), tıbbi olmayan nedenlerle dış kadın cinsel organlarının kasıtlı olarak zarar görmesi veya alınmasıdır. İnsan hakları ihlali olarak tanınır ve ağrı, şiddetli kanama, enfeksiyon ve hatta ölüme yol açabilen kısa vadeli ciddi sorunlarla; doğum güçlükleri, kısırlık ve psikolojik travma gibi uzun vadeli komplikasyonlarla ilişkilidir. Birçok ülkede FGM’ye karşı yasalar olmasına rağmen, sosyal baskı, gelenekler ve din ile evlilik hakkındaki inançlar resmi kuralları mağlup edebildiği için Sahra Altı Afrika’nın bazı bölgelerinde yaygınlığını korumaktadır. Daha akıllı önleme programları tasarlamak için karar vericilerin, ulusal ortalamaların ötesine geçen kimlerin daha fazla risk altında olduğuna dair örüntüleri tespit edebilecek araçlara ihtiyacı vardır.
Günlük hanelerden büyük veri
Araştırmacılar, binlerce haneyi ziyaret ederek kadınların yaşamları ve sağlıkları hakkında sorular soran, ulusal düzeyde temsili büyük Demografik ve Sağlık Anketleri verilerine başvurdu. Doğu ve Batı Afrika’da 11 ülkeden 2015–2023 dönemine ait 62.249 kadına ilişkin güncel anket verilerini birleştirdiler. Tüm katılımcılar 15–49 yaş aralığında olup en az bir kız çocuğuna sahipti. Her anneye kızlarından herhangi birinin FGM’ye maruz kalıp kalmadığı soruldu. Ekip ayrıca annenin yaşı, kırsal veya kentsel alanda yaşayıp yaşamadığı, eğitim ve hane geliri, hanenin kim tarafından yönetildiği, annenin kendisinin sünnet edilip edilmediği, medyaya erişimi, ikamet ettiği ülke ve FGM hakkındaki tutum ve inançları—örneğin bunun din tarafından gerekli olduğunu düşünüp düşünmediği veya sürdürülmesi/sonlandırılması gerektiğine dair görüşleri—gibi bilgileri topladı. Bu çok sayıda bilgi parçası, kızların kesildiği aileleri kesilmemiş ailelerden ayırt etmeyi öğrenecek bilgisayar modelleri için ham materyali oluşturdu.

Makinelere riski tanımayı öğretmek
Bu zengin ama dağınık veri setini bilgisayarın öğrenebileceği bir şeye dönüştürmek için ekip, yanıtları temizledi, standartlaştırdı ve hem sayılar hem kategoriler olarak algoritmaların anlayabileceği şekilde kodladı. Modellerin, kızların kesilmediği daha büyük grubu tercih etmeyi öğrenmemesi için SMOTE adı verilen bir teknik kullandılar. Ardından lojistik regresyon gibi basit yaklaşımlar ile karar ağaçları, rastgele ormanlar, destek vektör makineleri, k‑en yakın komşu, Naive Bayes ve XGBoost gibi daha esnek yöntemler dahil olmak üzere yedi farklı sınıflandırma modelini test ettiler. Her model verinin %80’i üzerinde eğitildi ve kalan %20 üzerinde değerlendirildi; modelin ne kadar sıklıkla doğru olduğu, gerçek vakaları kaçırmaktan ne kadar kaçındığı ve yüksek riskli aileleri düşük riskli ailelerden ne kadar net ayırabildiği gibi performans ölçütleri kullanıldı.
Öne çıkan model ve tercihlerini belirleyen faktörler
Test edilen yaklaşımlar arasında birçok karar ağacını birleştirerek daha kararlı bir öngörü sağlayan rastgele orman modeli en iyi performansı gösterdi. Anneleri yaklaşık %85 doğrulukla sınıflandırdı ve özellikle kızları FGM’ye maruz kalanları tanımlamada güçlüydü; nüfus genelinde risk düzeylerini ayırt etme becerisi yüksekti. Ancak yalnızca doğruluk yeterli değildir; halk sağlığı yetkililerinin modelin tahminlerini neden verdiğini de anlaması gerekir. Bu “kara kutuyu” açmak için yazarlar, her bir faktörün modele katkısını atayan SHAP adlı bir yorumlanabilirlik yöntemi kullandılar. Dört unsur öne çıktı: annenin FGM’nin sürdürülmesi gerektiğine dair görüşü, yaşadığı ülke, annenin kendi FGM geçmişi ve uygulamanın din tarafından gerekli olduğuna inanıp inanmadığı. FGM’nin sürdürülmesini destekleyen, yüksek prevalanslı ülkelerde yaşayan, kendisi sünnet edilmiş veya uygulamayı dinen gerekli gördüğünü belirten anneler, kızlarının kesildiğini bildirme olasılığı çok daha yüksekti.

Rakamdan eyleme
Bu bulgular, FGM ile mücadele edenler için net rehberlik sağlar. Model, özellikle kendileri kesilmiş olan ve uygulamayı sürdürmek için dinsel baskı hissettiğini belirten anneler arasında tutum değişikliğinin kızları korumada güçlü bir etki yaratabileceğini öne sürüyor. Ayrıca riskin ülkeler arasında keskin biçimde farklılaştığını vurgulayarak tek tip kampanyalar yerine ülke özelinde uyarlanmış stratejilerin gerekliliğini ortaya koyuyor. Yazarlar, kesitsel verilerinin nedensellik kanıtı sunamayacağı ve risk sınıflandırmalarının toplulukları damgalamamak için dikkatle kullanılması gerektiği konusunda ihtiyatlı olsalar da, çalışmaları makine öğreniminin eğitim, toplulukla etkileşim ve inanç temelli iletişimin en acil olarak gerekli olduğu yerleri belirlemede nasıl yardımcı olabileceğini gösteriyor. Bu şekilde gelişmiş veri araçları, FGM’yi sona erdirme ve kızların sağlık ve haklarını koruma küresel çabalarında sessiz ama önemli müttefikler olabilir.
Atıf: Gebrehana, A.K., Demoze, L., Yitageasu, G. et al. Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data. Sci Rep 16, 9944 (2026). https://doi.org/10.1038/s41598-026-40723-z
Anahtar kelimeler: kadın sünneti, makine öğrenmesi, Sahra Altı Afrika, kamu sağlığı verileri, kadın hakları