Clear Sky Science · tr

Box-Cox tabanlı kümeleme ve aşırı rastgeleleştirme kullanarak konuşma sinyallerinden Parkinson hastalığı tanısı için uyarlanabilir regresyon modeli

· Dizine geri dön

Neden sesleri dinlemek Parkinson’u daha erken fark etmeye yardımcı olabilir

Parkinson hastalığı en çok titreme ve sertlik ile bilinir, ancak bu belirtiler belirginleşmeden çok önce ses genellikle ince biçimde değişmeye başlar. Cepimizde neredeyse herkesin bir mikrofon taşıdığı düşünülürse, bu değişiklikler evde izlenebilir; sıradan konuşma erken uyarı sistemine dönüşebilir. Bu makale, yalnızca sesten bir kişinin Parkinson belirtilerinin ne kadar şiddetli olduğunu tahmin etmek için gelişmiş bilgisayar teknikleri kullanan akıllı ve güvenilir bir "dinleme" aracı nasıl inşa edileceğini araştırıyor.

Figure 1
Figure 1.

Ev kayıtlarını anlamlı sağlık ipuçlarına dönüştürmek

Araştırmacılar, her biri yaklaşık altı ay boyunca evde kısa ünlü sesleri kaydeden erken evre Parkinson hastalığına sahip 42 kişiden oluşan zengin bir ses veri setiyle çalıştı. Her kayıttan sistem, sesin titreşimden titreşime perdesinin ne kadar sabit olduğuna (jitter), ses yüksekliğinin ne kadar dalgalandığına (shimmer) ve sesin ne kadar gürültülü veya nefesli olduğuna dair onlarca özellik ölçtü. Bu ölçümler, Parkinson’un konuşmayı kontrol eden kasları nasıl etkilediğiyle ilişkilendirildi. Amaç yalnızca birinin Parkinson olup olmadığını söylemek değil, doktorların genel belirti şiddetini değerlendirmek için kullandığı Motor-UPDRS ve Total-UPDRS adı verilen iki ayrıntılı tıbbi skoru tahmin etmekti.

Bilgisayarların anlayabilmesi için dağınık veriyi temizlemek

Ham ses ölçümleri düzensiz olabilir: bazı değerler güçlü şekilde çarpıktır, bazıları aşırı uçlar içerir ve birçoğu aynı fikirin örtüşen versiyonlarıdır. Doğrudan bir modele verildiğinde bu karmaşa öğrenmeyi yanıltabilir ve sonuçları kırılgan hale getirebilir. Bunu ele almak için ekip önce Box–Cox dönüşümü adı verilen matematiksel bir yeniden şekillendirme adımı uyguladı. Basitçe ifade etmek gerekirse, bu adım aşırı değerleri yatıştırır ve genel dağılımı birçok öğrenme algoritmasının daha iyi işlediği düzgün bir çan eğrisi görünümüne yaklaştırır. Ayrıca verileri kayıt bazında değil, kişi bazında bölmeye özen gösterdiler; böylece bilgisayar aynı hastayı hem eğitim hem de testte görmedi ve bireysel sesleri “hatırlamanın” yol açtığı yüksek doğruluk yanılsamasından kaçındılar.

Figure 2
Figure 2.

Hangi ses özelliklerinin gerçekten önemli olduğuna verinin karar vermesine izin vermek

Veri setindeki 26 ses özelliğinin birçoğu aynı temanın farklı versiyonlarıdır—örneğin perde titreşimsizliğini veya ses yüksekliği değişimini ölçmenin birkaç farklı yolu. Hepsini modele sokmak yerine yazarlar, sadece en yararlı olanları tutmak için birkaç strateji denediler. En başarılı yaklaşımları benzer davranan özellikleri kümelere ayırmak ve ardından her kümeden semptom skorları ile ilişkilerinin gücüne göre tek bir temsilci seçmek oldu. Bu kümeleme tabanlı seçim, orijinal kümeyi yalnızca üç öne çıkan göstergeye indirdi: bir jitter ölçüsü, bir shimmer ölçüsü ve genel ses gürültüsünün bir ölçüsü. Bu keskin basitleştirmeye rağmen, özenle seçilmiş bu üç özellik kayıtlarda gizli olan tıbbi bilginin çoğunu yakaladı.

Ses sinyallerini okumak için rastgeleleştirilmiş karar ağaçları kullanmak

Sadeleştirilmiş ses özellikleriyle ekip, basit doğrusal formüllerden daha esnek ağaç tabanlı modellere ve sinir ağı benzeri otoenkoderlere kadar bir dizi tahmin yöntemini karşılaştırdı. Açık ara kazanan, her biri veriyi yüksek derecede rastgele yollarla bölen çok sayıda karar ağacından oluşan Extra Trees adlı bir topluluk yaklaşımıydı. Bu rastgelelik, azaltılmış ve daha az fazlalık içeren özellik kümesiyle birleştiğinde modelin fazla uyum yapmasını—eğitim verisinin tuhaflıklarını ezberlemesini değil genel desenleri öğrenmesini—engellemeye yardımcı oldu. Ayrı tutulan hastalar üzerinde kümeleme artı Extra Trees kombinasyonu, Motor ve Total UPDRS skorlarını çarpıcı bir doğrulukla tahmin etti; ölçülen skorlarla eşleşme genellikle yüzlerce puan aralığı olan ölçeklerde bir puandan çok daha az fark gösteriyordu.

Parkinson ile yaşayan insanlar için bunun anlamı

Bir genel okuyucu için kilit mesaj şudur: dikkatle seçilmiş az sayıdaki ses ölçümü, düşünülmüş bir öğrenme hattıyla işlendiğinde, evde yapılan kayıtlardan Parkinson şiddetini neredeyse klinik doğrulukla izleyebilir. Çalışma hâlâ tek bir veri setine dayanıyor ve daha büyük, daha çeşitli hasta gruplarında test edilmesi gerekecek olsa da, pratik telemedicine yönünde umut verici bir yol gösteriyor: kısa bir ses kaydının hastaların ve doktorların hastalığın seyrini takip etmesine, ilaçları ayarlamasına ve muhtemelen kötüleşen belirtileri daha erken yakalamasına yardımcı olabileceği bir gelecek—tüm bunlar klinik ziyareti gerektirmeden.

Atıf: Essam, M., Balat, M., Zaky, A.B. et al. Adaptive regression model for Parkinson’s disease diagnosis from speech signals using Box-Cox-based clustering and extremely randomization. Sci Rep 16, 14044 (2026). https://doi.org/10.1038/s41598-026-49065-2

Anahtar kelimeler: Parkinson hastalığı, ses analizi, makine öğrenimi, uzaktan izleme, özellik seçimi