Clear Sky Science · ja

心理音響学に基づく中周波数帯域制限は、失声症における古典的音響指標の診断的有用性を向上させる

· 一覧に戻る

声の音が重要な理由

声がかすれたり、ざらついたり、息っぽく聞こえたりする場合、それは単なる負荷から重篤な病気までさまざまな問題を示すサインになり得ます。臨床医は注意深く耳を傾けますが、人間の判断は完璧ではなく、聴取者によってばらつきがあります。本研究は、コンピュータベースの音声解析に対して単純な調整を行うことで、特に軽度の症例や日常的な連続音声において、かすれや息っぽさの知覚と解析結果との整合性を高められるかを検討します。肝心なのは、我々の耳が最も敏感に反応する音の領域に注目することです。

医師とコンピュータはどう声を評価するか

音声障害を診断するために、専門家は全体的な嗄声(かすれ)、息っぽさ、ざらつきなどを評価する訓練された聴覚尺度に頼ります。同時に、ソフトウェアはピッチや音量の微小な不規則性や、純音と雑音のバランスといった指標を測定します。これらの従来の数値は、持続母音のような長く安定した発声には比較的よく適用されますが、より自然で流れるような発話や問題が微妙な場合にはしばしば性能が低下します。その結果、コンピュータのスコアは専門家の聴取評価と一致しないことがあり、日常的な診療や遠隔医療での有用性が制限されます。

耳の「スイートスポット」

人間の聴覚は全ての周波数に等しく敏感なわけではありません。私たちの耳はおおむね2〜4 kHzの周波数帯に最も鋭敏に調整されており、ここでは音の構成の小さな変化が明瞭に際立ちます。しかし実際の音声記録はエネルギーの多くを下位の低周波に奪われやすく、これが中高域の微細な変化を覆い隠してしまいます。研究者たちは単純な疑問を投げかけました:低域と非常に高域の多くを意図的に取り除き、この中周波数の「スイートスポット」だけを解析すれば、古典的な音響指標は聴取者の知覚をよりよく反映するだろうか?

Figure 1
Figure 1.

単純なフィルタがもたらす大きな効果

研究チームは日本語話者の録音455件(持続母音と標準読文章の両方を含む)を調査し、幅広い音声障害と正常音声をカバーしました。各サンプルについて、オリジナルのフルバンド音声と2–4 kHzの領域だけを保持するバンドパスフィルタを通したバージョンの2種類を作成しました。両方のバージョンからよく知られた音響指標を算出し、専門家による総合的な嗄声(グレード)、息っぽさ、ざらつきの評価と比較しました。統計的手法を用いて、各指標が正常と障害の声をどれだけ区別できるか、また数値が重症度スコアにどれだけ密接に追従するかを検証しました。

嗄声と息っぽさのより明確な兆候

音を中周波数帯に限定すると、総合的な嗄声と息っぽさに焦点を当てた場合に、いくつかの指標が正常と障害の声を区別する能力を一貫して強化しました。これは単純な母音でも連続音声でも当てはまり、変化を検出するのが最も難しい軽度症例で特に有用でした。例えば、サイクルごとの微小な変動に基づく指標や純音と雑音のバランスに基づく指標は、支配的な低周波が抑えられることで感度が高まりました。フィルタは嗄声や息っぽさに関する重要な手がかりを運ぶ高調波や乱流雑音を効果的に「マスク解除」しました。

フィルタが役立つ場合と害する場合

同じ手法はざらつき(ラフネス)には有効ではありませんでした。ざらつきは遅い、低周波域の不規則性や、主に2 kHz以下に存在する追加の音成分に起因することが多いためです。フィルタはこれらの低周波構造の多くを除去してしまうため、ざらつきに関連する情報は弱まり、正常音声とざらつき声を分ける能力や聴取評価との一致は停滞または低下しました。また、グループを広く分離する能力の改善が、重症度スケール全体にわたる段階的な一致の強化と必ずしも一致しないことも示され、単一の指標では複雑な音声障害の全側面を捉えられないことが強調されました。

Figure 2
Figure 2.

実臨床の音声ケアにとっての意味

録音の最初のステップ、すなわちどのようにフィルタリングするかに心理音響学の知見を適用することで、本研究は既存の簡便に計算可能な音響指標が新たな機器や複雑なモデルなしに臨床的有用性を高め得ることを示しています。単純な2–4 kHzの帯域制限トラックをフルサウンドと併用することで、診療や遠隔評価における嗄声や息っぽさの判定に対する手がかりが鋭くなります。一方でざらつきには低周波情報が不可欠です。実用的には、このフィルタ戦略は現行ソフトウェアに低コストでデバイス非依存の改善として組み込むことができ、録音が行われる場所を問わず失声症のより信頼できるスクリーニングとモニタリングを支援します。

引用: Hosokawa, K., Kitayama, I., Iwaki, S. et al. Psychoacoustically guided midfrequency band-limiting improves the diagnostic utility of classical acoustic measures in dysphonia. Sci Rep 16, 13554 (2026). https://doi.org/10.1038/s41598-026-44010-9

キーワード: 音声障害, 失声症, 心理音響学, 嗄声, 音響的音声解析