Clear Sky Science · ru

Моделирование передаточных функций, зависящих от головы и ушной раковины, с помощью краевых элементов и конечно-разностных схем с объёмной пенализацией

· Назад к списку

Почему форма ваших ушей важна для виртуального звука

Когда вы надеваете наушники и слышите звук так, будто он исходит сзади или сверху, ваш мозг использует крошечные акустические подсказки, создаваемые уникальной формой головы и ушей. В этой статье исследуется, как смоделировать эти подсказки на компьютере с высокой реалистичностью, не тратя часы на измерения каждого слушателя в лаборатории. Авторы сравнивают два продвинутых численных подхода, чтобы выяснить, насколько точно они воспроизводят изгибы, отражения и дифракцию звука вокруг головы и наружного уха.

Figure 1
Figure 1.

Как наши уши кодируют трёхмерный звук

У каждого из нас есть личный «акустический отпечаток», называемый передаточной функцией, зависящей от головы (HRTF). Когда звуковые волны сталкиваются с торсом, головой и сложными складками наружного уха, одни частоты усиливаются, другие — ослабляются. Эти изменения зависят от направления: спереди или сзади, сверху или снизу, слева или справа. Мозг научился читать эти паттерны, чтобы определять, откуда идут звуки. Для убедительной виртуальной и дополненной реальности инженерам по звуку нужны HRTF, адаптированные к каждому слушателю и очень плотно дискретизированные в пространстве. Измерить их вокруг реального человека или манекена возможно, но это медленно, технически сложно и подвержено небольшим погрешностям позиционирования, которые могут быть слышны в результате.

Две математические перспективы одной и той же задачи прослушивания

Чтобы обойтись без длительных измерений, исследователи моделируют распространение звука вокруг детализированных 3D-моделей головы и уха. В этом исследовании сравниваются два ведущих подхода. Первый, известный как метод краевых элементов, описывает только поверхность головы и уха и решает, как эта поверхность рассеивает звук. Второй, называемый конечно-разностным методом во временной области (FDTD), заполняет объём вокруг головы сеткой и шаг за шагом продвигает звуковые волны во времени. Объёмный метод более гибок, но может стать очень дорогим для больших областей. Авторы улучшают его приёмом «объёмной пенализации»: вместо аппроксимации поверхности уха ступенчатой лестницей на сетке они плавно смешивают воздух и твёрдый материал через тонкий слой, что значительно улучшает представление отражений и теней.

Тестирование моделей на простых формах и реальном ухе

Прежде чем доверять методам моделирование полной человеческой головы, команда верифицирует их на тщательно контролируемых тестовых случаях. Сначала они моделируют дифракцию звука вокруг жёсткой сферы, для которой существует точное аналитическое решение. Оба метода хорошо согласуются с этой ссылкой по всему слышимому диапазону: краевой метод и мелкие сетки в объёмном методе остаются в пределах долей децибела. Далее они изучают отражение от плоской стены, чтобы выяснить, сколько узлов сетки требуется в переходном слое, чтобы отражённый звук имел правильные пиковые и впадинные частоты. Из этих тестов выводятся простые правила, связывающие шаг сетки с минимальной толщиной стены, которую можно моделировать без введения слышимых ошибок. Применив эти правила, они моделируют высокоразрешённую 3D-печатную ушную раковину и сравнивают результаты с точными измерениями. При достаточно мелкой сетке смоделированные отклики уха отличаются от измеренных в среднем примерно на один децибел — близко к порогу, где тональная окраска становится заметной в прослушивании.

Figure 2
Figure 2.

От отдельного уха к полной голове

В завершающем этапе авторы моделируют полную сетку головы, часто используемую в исследованиях 3D-аудио. Они вычисляют, как звук, приходящий из множества горизонтальных направлений, преобразуется у закрытого слухового канала, и сравнивают объёмный метод с пенализацией и устоявшийся краевой метод. Когда сетка достаточно тонкая, чтобы разрешать самые тонкие части уха, оба подхода чрезвычайно хорошо согласуются для большинства направлений и частот, даже если оценивать через слуховую модель, предсказывающую воспринимаемые тональные изменения. Более грубые сетки, напротив, смещают частоты и силу важных пиков и впадин, связанных с резонансами и отражениями уха, подчёркивая, что геометрические детали нельзя жертвовать без слышимых последствий.

Что это значит для будущего виртуального звука

Для сценариев дальнего поля и больших областей краевой подход остаётся более эффективным на современных компьютерах, но улучшенный объёмный метод даёт важные преимущества. Он естественно справляется с малыми внутренними полостями, пространственно меняющимися материалами и будущими задачами оптимизации, где форму наушников или ушей можно настраивать в симуляции. Исследование показывает, что при выборе шага сетки в соответствии с выведёнными рекомендациями объёмно-пенализированные объёмные симуляции могут соответствовать как аналитическим решениям, так и измеренным данным уха в пределах или близко к едва различимым различиям. Практически это приближает нас к вычислению высокореалистичных, индивидуально настроенных 3D-звуковых сцен — без необходимости измерять каждое ухо в лаборатории.

Цитирование: Hölter, A.B., Lemke, M., Weinzierl, S. et al. Modeling head- and pinna-related transfer functions using boundary elements and finite differences with volume penalization. npj Acoust. 2, 16 (2026). https://doi.org/10.1038/s44384-026-00052-x

Ключевые слова: передаточные функции, зависящие от головы, 3D-аудио, численная акустика, моделирование наружного уха, звук для виртуальной реальности