Как работает пространственный звук? Объясняем
Пространственный звук — один из новых трендов у производителей наушников в 2021 году. Разбираемся, как он работает, и как Apple снова опередила всех.

Пространственное аудио — новый тренд у производителей мобильной техники. Или не совсем новый? На самом деле, производители наушников и раньше успешно делали технику с виртуальным 5.1, 7.1 и пространственным звуком. Одной из самых популярных технологий является THX Spatial Audio, которую лицензировали у себя разные производители. Например, у Razer и Sony есть целое семейство наушников с поддержкой такой особенности.
Правда, это не совсем то, о чём мы с вами привыкли слышать за последний год. Когда Apple добавила функцию Spatial Audio в AirPods Pro и AirPods Max, у пользователей наушников появилась возможность не просто погружаться внутрь виртуальной аудиосцены, но и двигаться внутри неё.
Подобного раньше почти никто не делал, а теперь ещё и Samsung с наушниками Galaxy Buds Pro решили присоединиться. В этом материале вы узнаете, как работает пространственное звучание, что такое Dolby Atmos и как через два наушника можно услышать то, что происходит у вас над головой.
Принцип работы
Просмотр видеоконтента с режимом пространственного аудио можно сравнить с просмотром фильмов или сериалов в кинотеатре. Только здесь смартфон выступает в роли киноэкрана и основного источника звука, а все остальные эффекты кружат вокруг вас в зависимости от того, где они находятся на экране. Причём все они закрепляются на своих местах.

Например, если в сюжете присутствует вертолёт, который находится в левой части сцены, то, повернув голову влево, вы ощутите, как будто этот вертолёт оказался перед вами. А говорящие между собой персонажи, которые находятся посередине экрана, сместятся куда-то в правую часть. Если вдруг в фильме начнёт лететь ряд самолётов, вы услышите их гул прямо над головой. Подняв голову звук вертолётов окажется прямо перед вами.
Изменение положения виртуальных источников звука относительно вас происходит благодаря анализу данных с акселерометров наушников и устройства, с которого вы смотрите видео. Устройство выступает в роли «гаранта» и любые смещения относительного него фиксируются акселерометрами наушников и изменяют положение аудиообъектов. Но это ещё не всё.
Подобные «фокусы» в киноиндустрии существуют уже давно благодаря технологиям Dolby Digital 7.1, 5.1 и Dolby Atmos. В кинотеатрах этими источниками звука выступают физические колонки, которые расставлены в соответствии со специальными схемами. В случае с 7.1 звуком, схема расстановки выглядит так:

С расстановкой источников по схеме 5.1 чуть проще:

Есть ещё технология Dolby Atmos — она даёт звук не только в плоскости, но ещё сверху и снизу. Более подробно о ней мы поговорим дальше, а схема расстановки источников для Atmos ещё сложнее:

Помимо семи источников вокруг, необходимо также от двух до четырёх излучателей сверху (хотя можно больше). И неплохо добавить ещё пару по бокам.
Как вы понимаете, для создания подобных «комнат» с объёмным звуком нужно большое пространство, специальная подготовка акустики и много чего ещё. Наушники с поддержкой пространственного аудио умеют эмулировать такие же источники звука, только в виртуальном пространстве. Но откуда берётся объёмный звук? Давайте разберём это на примере Dolby Atmos.
Как создаётся объёмный звук в кино
Те, кто хоть немного занимался монтажом видео, хотя бы в общих чертах знают, что такое аудиодорожки, панорамирование и так далее. До появления Dolby Atmos звукорежиссёры были вынуждены работать с источниками звука по отдельности, расставляя на каждый канал соответствующую дорожку.
С приходом в 2012 году Dolby Atmos процесс работы изменился — появилась возможность работы со звуком не в плоскости, а в трёхмерном пространстве.

Представьте себе объёмную сферу, в центре этой сферы находитесь вы, а всё остальное пространство звукорежиссёр заполняет аудиообъектами.
Этот термин также появился с выходом Dolby Atmos, так как теперь звукорежиссёры работают не с отдельными каналами, а с объектами, настраивая их положение в трёхмерном пространстве, регулируя высоту и отдалённость от зрителя. Финальное распределение по источникам при воспроизведении теперь производит не человек, а специальный алгоритм в устройствах с поддержкой Dolby Atmos.

Аудиосистемы с этой технологией поддерживают до 128 источников звука. Но может хватить, как мы это поняли выше, и семи источников с двумя динамиками сверху. Фишка кроется в устройстве, которое воспроизводит звук.
Встроенный алгоритм Dolby Atmos знает расположение подключённых динамиков и особым образом самостоятельно распределяет звучание между ними. Это происходит благодаря приписанной к аудиообъектам пространственно-временной информации.
В «классических» 5.1 и 7.1 системах никакого распределительного алгоритма нет — на какой динамик звукорежиссёр выставил дорожку, на таком динамике она и будет звучать. Поэтому в 5.1 или 7.1 увеличение источников звука качественно не поможет, потому что работать будут только пять или семь заданных колонок. В случае с Dolby Atmos ситуация совершенно иная: чем больше источников, тем лучше. Потому и создать нормальный пространственный звук с пятью и семью динамиками невозможно.
Стоп! Если с пятью и семью динамиками добиться всенаправленного объёмного звучания невозможно, как это удаётся провернуть с наушниками? У них же всего два динамика, тогда как производители наушников делают такую «магию»?
Симуляция пространственного звука
С пятью и семью динамиками симулировать полноценный пространственный звук действительно невозможно, но вот с двумя наушниками — легко! Есть такая штука, как «бинауральный эффект» — это когда ваш мозг определяет положение источника звука в пространстве.

По умному это называется так: Head Related Transfer Function (HRTF) — «Моделирование функций восприятия звука головой». И это целый раздел в науке, который с точки зрения математики стали изучать с 70-х годов прошлого века. Мы не будем вдаваться в математические формулы — это всё крайне узконаправленно и сложно, будем говорить в целом.

Наше тело является для наших ушей препятствием, которое создаёт «помехи» звучания. Оказывается, такими препятствиями являются нос, голова, волосы, щёки, челюсти и само туловище. Учёные выяснили, что в изменении итогового звучания через телесные препятствия имеются общие закономерности.
К примеру, если звук исходит откуда-то снизу, наши ноги и туловище создают акустическую деформацию звуковой волны. Если источник находится сверху, то препятствием выступает голова и сами уши. Именно благодаря этой деформации, которая «прошивалась» в наше сознание в течение тысяч лет, наш мозг может понять, откуда идёт звук, даже если мы стоим с закрытыми глазами.
Симуляцию таких деформаций как раз и стараются делать производители наушников. Надев AirPods Pro или аналогичные наушники с поддержкой пространственного звука, алгоритм не только определяет положение виртуальных источников звука в зависимости от положения головы, но и накладывает на аудиоволну специальные шероховатости для создания такого «живого» эффекта присутствия.
В интернете есть множество видеороликов с бинауральным звуком, посмотрев которые вы сможете понять суть этого термина и прочувствовать, как это работает. Но при просмотре обязательно наденьте наушники — любые.
Краткие итоги
- Закрепление виртуальных источников звука работает благодаря акселерометрам на смартфоне и в наушниках;
- Dolby Digital 5.1 и 7.1 не являются стандартами полноценного пространственного звука;
- Объёмное звучание Dolby Atmos работает благодаря умному алгоритму, который распределяет положение аудиообъектов по подключённым устройствам вывода звука;
- Ощущение бинаурального звука в пространственном аудио возникает благодаря специальным закономерностям деформации аудиоволн, к которым привык наш мозг.