В окружении виртуального звука

12 мая 2011

Прежде чем приступить к прочтению данной статьи, предлагаем вам провести небольшой эксперимент. Выйдите на балкон или на улицу, закройте глаза и сосредоточьтесь на своих слуховых ощущениях. Уверен, что многие из вас будут удивлены тем, насколько объемной на самом деле является звуковая панорама - голоса людей, пение птиц, звук проезжающих мимо автомобилей. Только лишь на основании своих слуховых ощущений вы без труда сможете сделать выводы о расположении этих звучащих объектов, о том, на каком расстоянии они находятся, являются ли они статичными или движущимися... Ощущение объемности окружающих нас звуковых образов является привычным, но мало кто из нас задумывается над тем, какие именно механизмы восприятия позволяют нам слышать трехмерное пространство и в точности определять направление и расстояние до звуковых источников. Помимо направления в горизонтальной плоскости наши уши позволяют также сделать выводы о высоте звучащего объекта. Мало кто из людей задумывается над тем, каким образом мы можем услышать 3-мерное звуковое пространство, будучи "вооруженными" только лишь двумя ушами. Ответ на этот вопрос кроется в устройстве человеческого слухового аппарата, которое будет рассмотрено чуть ниже.

МНОГОКАНАЛЬНЫЕ СИСТЕМЫ ДОМАШНИХ РАЗВЛЕЧЕНИЙ

Современные системы домашних развлечений разрабатываются и создаются для того, чтобы вызвать у человека максимальный эмоциональный отклик, погрузить его в действие кинофильма, прослушиваемую музыку или компьютерную игру настолько, чтобы он на время забыл о реальности окружающего мира и полностью погрузился в реальность "виртуальную". Естественно, для достижения данной задачи необходимо, чтобы действие, происходящее на экране, вызывало у человека эмоциональный отклик, качество изображения также должно быть максимальным, приближенным к тем картинам, которые мы привыкли видеть в реальной жизни. Хорошо известно также и то, что значительная часть информации об окружающем мире (более 25%) приходится на звук. Качественное объемное звучание - залог того, что человек получит максимальный эмоциональный заряд от кинофильма или музыкального исполнения.

Традиционным решением задачи по созданию объемного звучания в комнате прослушивания является построение многоканальных систем, в которых звук передается фронтальными, центральным и тыловыми громкоговорителями. С их помощью можно добиться очень равномерной и правдоподобной звуковой панорамы, при которой эффекты будут окружать слушателя именно таким образом, как задумал звукорежиссер. Для того, чтобы повысить достоверность воспроизведения многие производители аудио техники предлагают идти по пути увеличения количества каналов (и соответственно громкоговорителей), строя уже не пяти-, а шести-, семи- и даже девятиканальные системы домашнего кинотеатра. Резоны производителей понятны. Построение многоканальных аудиосистем действительно является самым верным способом повысить достоверность воспроизведения. Кроме того, увеличение количества каналов, естественно, требует увеличения количества акустических систем, длины коммутационных проводов, применения более сложных и более дорогих усилителей, а, следовательно, позволяет увеличивать прибыль от продажи оборудования.

НЕ УВЕЛИЧИВАТЬ, А УМЕНЬШАТЬ!

Впрочем, находятся компании, которые идут по другому пути, предлагая не увеличивать, а наоборот уменьшать количество каналов воспроизведения. Они совершенно справедливо считают, что далеко не всем потребителям необходимы многоканальные аудиосистемы. Для кого-то это неприемлемо по экономическим соображениям, кто-то не может выделить под систему домашних развлечений специальную комнату, в которой можно было бы проложить все необходимые коммутационные провода и выделить место для установки тыловых громкоговорителей, у кого-то уже есть "нормальная" большая система домашнего кинотеатра, и он хочет построить дополнительную (резервную) систему в маленькой комнате - спальне, кабинете или детской комнате, в которой также хочется "малой кровью" получить объемное звучание.

Казалось бы, что получение объемного звука без использования тыловых громкоговорителей не возможно. Если сзади нет звукового источника, то и звуку там неоткуда взяться. Впрочем, очевидность данного утверждения можно поставить под сомнение одним простым утверждением. У человека всего лишь два уха, которые обеспечивают его всей необходимой информацией о расположении источника звукового сигнала, а это значит что для ее передачи по идее достаточно всего лишь двух громкоговорителей (наушников или акустических систем), воспроизводящих аудио сигнал, в котором эта информация содержится. Не следует забывать о том, что наш слух - это не просто какое-то абстрактное, ничем не объяснимое качество. Слух имеет свои механизмы, в том числе и механизмы локализации звуковых источников в пространстве, изучением которых не один десяток лет занимаются не самые глупые люди. Понимание этих механизмов в теории позволяет "обмануть" нашу слуховую систему путем введения в акустический сигнал, воспроизводимый фронтальными громкоговорителями, дополнительных частотных и фазовых составляющих. Кроме того, воспроизведение звука в большинстве случаев происходит не в чистом поле, а в помещении. Помещение имеет стены и потолок, которые отражают звуковые волны. Правильно рассчитав конструкцию акустических систем, можно добиться того, что отраженный звуковой сигнал будет приходить к слушателю сбоку и сзади - т.е. имитировать звучание тыловых громкоговорителей.

"Избавиться" же от центрального громкоговорителя не представляет особой сложности - достаточно лишь соответствующим образом "подмешать" его сигнал в звучание правого и левого фронтальных каналов и звук локализуется в пространстве посередине между ними.

Конечно, реализация этих методов на практике представляет собой значительные трудности, но попытки создания позиционированного трехмерного звука при помощи только фронтальных громкоговорителей ведутся уже давно и определенные результаты достигнуты. В том числе и в серийно выпускаемых домашних аудио-видео комплектах. Для того чтобы лучше понимать особенности их работы, давайте разберемся, как же устроен наш слух, каким образом он позволяет нам производить локализацию звуковых источников, т.е. определять направление и расстояние до них.

ЧЕЛОВЕЧЕСКИЙ СЛУХ

Основной особенностью нашего слуха, которая позволяет определить место расположения звукового источника в пространстве, является его бинауральное строение - т.е. тот неопровержимый факт, что человек имеет 2 приемника звуковой информации (уха). Звуковые сигналы, воспринимаемые нашими ушами, обрабатываются в периферической части слуховой системы, подвергаются спектрально-временному анализу, после чего информация поступает в соответствующие отделы головного мозга, где на основе сравнения сигналов, поступивших с каждого из слуховых каналов, делаются выводы о месте расположения звукового источника.
Человеческий слуховой аппарат представляет собой очень эффективное устройство, созданное природой. Удивительным является то обстоятельство, что для большинства звуковых сигналов мы можем определить месторасположение источника с очень высокой степенью достоверности. Конфигурация ушной раковины позволяет осуществлять пространственное декодирование поступающих сигналов и подавать на барабанную перепонку звуковой сигнал, в котором уже содержится информация о месторасположении источника в пространстве.

Очень интересным является то обстоятельство, что для определения места расположения звукового источника в пространстве слуховая система использует не один, а несколько механизмов, каждый из которых наиболее эффективен при решении определенной задачи.

Механизмы слухового восприятия принято делить на основные и вспомогательные. К основным механизмам обычно относят локализацию по разнице амплитуд приходящих сигналов, временной разнице, а также спектральным различиям звука в правом и левом слуховых каналах. К вспомогательным механизмам обычно относят отражения звука от туловища и плеч человека, анализ реверберационных эффектов, а также эффект психологического восприятия, приводящий слышимое расположение звукового источника в соответствие с его расположением, которое мы видим глазами.

СТРОЕНИЕ ЧЕЛОВЕЧЕСКОГО УХА. 1.Слуховой канал 2.Барабанная перепонка 3.Молот 4.Наковальня 5.Стремечко 6.Овальное окно 7.Евстахиева труба 8.Улитка 9.Слуховой нерв

ОСНОВНЫЕ МЕХАНИЗМЫ СЛУХОВОГО ВОСПРИЯТИЯ

Локализация по уровню интенсивности звукового сигнала

Этот механизм основан на том, что при излучении звука источником, расположенным под определенным углом к фронтальному направлению, уровень звукового давления на барабанные перепонки в разных ушах будет различным. Это связано с тем, что одно ухо будет находиться как бы "в тени", которую создает голова и туловище. Естественно разница в уровнях звукового давления на барабанные перепонки будет зависеть от угла расположения источника. Анализируя эту разницу наш мозг способен сделать вывод о направлении на источник звука. Данный механизм, основанный на разнице уровней интенсивности сигналов, поступающих к ушам, является достаточно эффективным, но лишь на звуковых частотах более 2000 Гц. Дело в том, что при длине звуковой волны, сравнимой с диаметром человеческой головы, дальнее от источника ухо перестает находиться в "акустической тени", что обусловлено явлением дифракции звуковой волны на поверхности головы.

Локализация по временной разнице звуковых сигналов

На более низких частотах в действие вступает механизм анализа фазового сдвига звуковых сигналов, приходящих к разным ушам. За счет "разнесенности" ушей в пространстве звуковой сигнал, приходящий от источника, расположенного под некоторым углом к фронтальному направлению, затрачивает различное время для достижения барабанных перепонок в разных ушах. Это приводит к появлению фазового сдвига в сигналах, пришедших от одного и того же источника к разным ушам. Данный фазовый сдвиг может быть проанализирован нашим мозгом и на основании этого анализа делается вывод о направлении на звуковой источник.

С повышением частоты (а соответственно, с уменьшением длины звуковой волны) фазовый сдвиг сигналов, пришедших от одного и того же источника к разным ушам, увеличивается, и как только он достигает значения близкого к половине длины звуковой волны, данный механизм локализации перестает работать, поскольку наш мозг не может однозначно определить отстает ли звуковой сигнал в одном из слуховых каналов от другого или наоборот опережает его. Естественно, чем больше угол между направлением на звуковой источник и плоскостью симметрии человеческой головы, тем больше фазовый сдвиг в пришедших к ушам сигналах. Соответственно с повышением частоты звука угол, в котором мы можем локализовать источник, пользуясь данным механизмом, уменьшается.

Конус неопределенности

Кроме того, данный метод локализации страдает еще одним ограничением. Представьте себе, что источник звука находится под углом 30 градусов к фронтальному направлению головы. При восприятии звукового сигнала мы получим определенный фазовый сдвиг в левом ухе относительно правого, и на основе анализа этого сдвига наш мозг сделает вывод о расположении источника. Рассмотрим теперь звуковой источник, расположенный под углом 30 градусов к направлению в котором "смотрит" затылок или (что то же самое) под углом 150 градусов к фронтальному направлению. Для этого источника фазовый сдвиг будет точно такой же, как и для первого. Если не ограничиваться только теми источниками, которые находятся на одном уровне с ушами, а рассмотреть также те, которые располагаются выше или ниже, то можно продолжить наши рассуждения и получить конус с вершиной, расположенной в слуховом канале. На основании этого конуса могут расположиться звуковые источники, для которых разность фаз в правом и левом ушах будет одинаковой. Этот эффект, мешающий точному и однозначному определению местоположения звуковых источников с помощью анализа разности фаз для правого и левого слуховых каналов, получил название "конуса неопределенности".

Для того чтобы устранить эту неопределенность человек пользуется третьим, пожалуй, наиболее эффективным механизмом пространственной локализации звука.

Локализация по спектральным различиям звуковых сигналов

Еще один механизм локализации звука человеком, который, кстати, является наиболее точным, относится к сложным звуковым сигналам и импульсам, и основывается на возможности анализа спектрального состава звука нашим мозгом. При излучении сложного звукового сигнала (т.е. такого сигнала, в спектре которого присутствуют различные частоты) источником, расположенным под определенным углом к плоскости симметрии головы, спектральный состав звука в правом и левом ушах будет различным. Это связано, во-первых, с экранирующим воздействием головы, которое проявляется сильнее на высоких частотах (поэтому в дальнем от излучателя ухе высокочастотных составляющих будет меньше). Кроме того, ушная раковина человека не зря имеет такую сложную форму - по сути, она является точно рассчитанным частотным фильтром, которым наделила нас природа.

Фильтрация звуков различной частоты ушной раковиной зависит от направления на источник. При изменении направления звуковой сигнал по-разному отражается от участков ушной раковины и соответственно происходит усиление и ослабление различных участков спектра принимаемого звукового сигнала. Анализ спектрального состава звукового сигнала, поступающего в слуховые каналы, является также основным механизмом при определении того, находится ли звуковой источник спереди или сзади. По вполне очевидным причинам, механизмы, основанные на оценке разницы интенсивности и фазового сдвига, о которых мы написали выше, в данном случае практически не работают. Ушная же раковина по-разному фильтрует сигналы, приходящие спереди и сзади, поэтому мы и можем сделать вывод об их месторасположении.

Сложный спектральный состав для простоты локализации

В целом, можно сказать, что наилучшим образом определяется местоположение звуковых источников, которые излучают сигнал со сложным спектральным составом. Чистые тона, которые, кстати, практически не встречаются в природе, поддаются локализации с большим трудом и разрешающая способность человеческого слуха при этом крайне невелика. Высокие частоты (свыше 8000 Гц) практически не поддаются локализации, точно так же невозможно определить и местоположение источников звука очень низкой частоты (менее 150 Гц) - не зря же производители рекомендуют размещать сабвуферы в домашнем кинотеатре в любом, наиболее удобном для вас месте комнаты прослушивания. Аккуратная спектральная обработка воспроизводимого сигнала является одной из приоритетных задач производителей систем пространственного звучания.
Важно понимать, что наш мозг - это не совсем вычислительная машина, которая, воспринимая импульсы, формируемые в слуховых каналах, производит вычисления по какому-то сложнейшему алгоритму. На самом деле мозг производит не вычисления, а скорее сравнения. Он сравнивает информацию, полученную от ушей, с той информацией, которая уже хранится в нашей памяти. Иными словами, механизм локализации источника основывается, прежде всего, на личном опыте человека. В нашей памяти хранится информация о том, как звучат те или иные источники в разных точках пространства. Когда мы слышим звук, то наш мозг сравнивает поступающую информацию с той, что хранится в памяти, выбирает наиболее подходящую и на основании этого делает вывод о расположении источника в пространстве.Е

ще один момент, на который хотелось бы обратить внимание, это то, что точность определения месторасположения звукового источника в пространстве существенно возрастает, когда источник не является неподвижным, а перемещается в пространстве. Это дает нашему мозгу дополнительную информацию, которую он может проанализировать. Если источник является неподвижным, то для его локализации человек подсознательно совершает микроперемещения головы (например, еле заметно поводит ей из стороны в сторону). Этих микроперемещений вполне достаточно, для того, чтобы мозг получил информацию, на порядок повышающую точность определения положения источника в пространстве.

ДОПОЛНИТЕЛЬНЫЕ МЕХАНИМЫ ПРОСТРАНСТВЕННОГО ВОСПРИЯТИЯ ЗВУКА

Отражение и экранирование звука плечами и туловищем

При описании процессов пространственной локализации звукового источника необходимо учитывать то, что наши уши находятся в непосредственной близости от плеч и туловища. Распространяющийся звук может отражаться от них или поглощаться, вследствие чего спектральные и временные характеристики звука будут меняться. Человеческий мозг анализирует эти изменения и на их основании делает дополнительные выводы о направлении на звуковой источник. Наибольшее значение данный эффект имеет при определении расположения источников, находящихся выше или ниже головы слушателя.

Реверберация

Как известно, при воспроизведении звука в помещении мы слышим не только прямой звуковой сигнал, но и сигналы, отраженные от стен. Эти сигналы являются результатом многократных переотражений и имеют достаточно сложную структуру. Эффект, при котором затухание звука происходит не сразу, а постепенно, за счет этих самых переотражений, носит название реверберации. Время, за которое уровень звука в помещении снижается на 60 дБ, носит название времени реверберации. Оно характеризует, как размеры помещения (в малых помещениях за единицу времени происходит большее количество переотражений, и звук затухает быстрее, чем в больших), так и отражающие свойства его поверхностей (стен, пола и потолка).

Спектральный состав отраженных сигналов в больших и малых помещениях также отличается, поэтому реверберация несет в себе информацию о размере помещения. Помимо размеров спектр реверберационного сигнала характеризует материалы, из которых изготовлены отражающие поверхности. Например, реверберация, в которой высок уровень высокочастотных составляющих, ассоциируется с комнатой с твердыми стенами, хорошо отражающими высокие частоты. Если же звук реверберации глухой, то слушатель приходит к выводу, что стены комнаты покрыты коврами, драпировками и прочими абсорберами высоких частот.

Помимо определения характеристик помещения, включение реверберационного сигнала в состав воспроизводимого звука полезно и для определения расстояния до звукового источника. Оценивая отношение уровня прямого звука к отраженному, мы можем сделать выводы о том, находится ли он близко (слабая реверберация) или далеко (сильная реверберация).Имитация реверберации в системах позиционированного объемного звука необходима для передачи пространственного контента. Она дает информацию о размере и характеристиках помещения, расстоянии до звукового источника и таким образом существенно добавляет реализма воспроизводимой записи.

Для имитации реверберационных эффектов зачастую используют геометрическую модель воспроизводимого звукового пространства. Эта модель учитывает позицию слушателя, звукового источника и отражающих поверхностей. Вводя коэффициенты отражения, геометрическая модель позволяет построить систему мнимых источников, уровень которых ослаблен в соответствии с этими коэффициентами и получить достаточно правдоподобную реверберационную картину, учитывающую ранние отражения звука от стен.

Особенности психоакустического восприятия

Создание 3-мерного позиционируемого звука с помощью 2 громкоговорителей является весьма сложной, практически невыполнимой на сегодняшний день задачей. Это утверждение было бы справедливо, если бы не одна важнейшая особенность нашего слуха. Дело в том, что при недостатке информации или же при поступлении такой информации, которая не соответствует той, что хранится у нас в памяти, человеческий мозг самостоятельно достраивает звуковую картину до той, которая укладывается в его представления о звуках, существующих в реальном мире. Иными словами, для того, чтобы "обмануть" наш мозг совершенно не обязательно в точности воссоздавать желаемый звуковой образ. Достаточно лишь "намекнуть" ему, чтобы он "извлек из памяти" ту 3-мерную картину, которая нам нужна. В качестве аналогии можно привести метод записи музыки в формате MP3. Всем известно, что в этих записях отсутствует множество информации, которая, казалось бы, просто необходима для адекватного восприятия музыки. Тем не менее, информации все же оказывается достаточно для более или менее достоверной передачи - недостающую звуковую информацию мозг достраивает самостоятельно.

Помимо этого, не следует забывать, что в домашнем кинотеатре кроме звука есть еще и изображение, т.е. наш мозг помимо звуковой получает еще и зрительную информацию. Это очень существенный момент, поскольку появление еще одного (кстати, основного) информационного канала позволяет существенно упростить процедуру "введения нашего мозга в заблуждение", а следовательно добиться пресловутого "эффекта присутствия" к которому мы собственно и стремимся, просматривая фильмы в домашнем кино.

КАКИЕ ЗАДАЧИ ДОЛЖНЫ РЕШАТЬ СИСТЕМЫ ОКРУЖАЮЩЕГО ЗВУКА?

Итак, наш слуховой аппарат использует различные механизмы для определения местоположения источника звука в пространстве. Поскольку все эти механизмы строятся на сравнении поступающих в головной мозг сигналов с теми, что "хранятся" у него в памяти, то, используя определенные алгоритмы обработки звука можно "обмануть" его и заставить поверить в то, что звуковой источник расположен там, где на самом деле его нет. Именно на этом и построены современные алгоритмы построения 3-мерного звукового пространства в компьютерных играх и, что более важно для нашего издания, домашних аудио-видео системах.

Прежде чем перейти к рассмотрению конкретных алгоритмов построения виртуального звукового окружения, мы рассмотрим основные задачи, которые этим системам приходится решать.

Определение направления на звуковой источник

Как уже упоминалось выше, для определения направления на источник звукового сигнала используются все три основных алгоритма пространственной локализации: - по амплитудной разнице сигналов в слуховых каналах, по фазовой задержке звука, пришедшего к правому и левому уху, а также по оценке спектрального состава звука, трансформированного ушной раковиной в зависимости от направления его распространения.

Вертикальная (высотная) локализация

Все, о чем мы говорили выше, относилось в первую очередь к локализации звукового источника в горизонтальной плоскости. Однако, как нам кажется, мы не раскроем особой тайны, если скажем, что человек может определять направление на звуковой источник не только в горизонтальной, но и в вертикальной плоскости. Механизм определения высоты источника имеет некоторые отличия от способов, описанных выше. Если при оценке угла в горизонтальной плоскости основополагающим инструментом является бинауральное свойство слуха (т.е. наличие двух приемников звукового сигнала - ушей), то определение высоты в основном моноауральное - используется в первую очередь строение ушной раковины. Как уже упоминалось, ушная раковина представляет собой своеобразный частотный фильтр с параметрами фильтрации, зависящими от направления на источник. В сложном звуковом сигнале определенные частоты усиливаются ушной раковиной, а другие наоборот ослабляются. При изменении высоты источника частотная характеристика сигнала поступающего в слуховой канал также будет меняться.

Определение расстояния до источника

Помимо того, что человек может определять направление на звуковой источник, свойства слуха позволяют ему оценивать и расстояние до него. Одним из механизмов определения расстояния является оценка интенсивности звукового сигнала. Например, при относительно небольших расстояниях увеличение расстояния до источника в 2 раза соответствует изменению уровня звукового давления на 6 дБ. Однако данный механизм не всегда оказывается работоспособным, поскольку уровень звука от слабого, но близко расположенного источника может быть таким же, как от мощного, но удаленного на значительное расстояние.

При малых расстояниях до источника в действие вступает механизм оценки изменения спектральных составляющих сложного сигнала, которое происходит в связи с искажением фронта звуковой волны головой и ушными раковинами.Одним из важнейших механизмов, позволяющих нам определять расстояние до источника в помещении, является сравнение прямых сигналов и отраженных от стен и потолка. Таким образом, эффект реверберации позволяет использовать один из наиболее точных механизмов локализации звукового источника в помещении.

Воспроизведение звука движущихся объектов

Для того чтобы правдоподобно передать звук от движущегося источника недостаточно только тех механизмов, которые были описаны выше. В соответствии с эффектом Доплера частота звука движущегося источника изменяется (звук становится более высоким при приближении объекта и более низким при его удалении). При прохождении объекта мимо позиции слушателя его звук резко меняет тональность.

Поглощение звука в воздухе

При передаче звучания удаленных объектов необходимо учитывать, что воздух поглощает высокие частоты значительно сильнее, чем низкие. Это означает, что чем дальше от вас находится виртуальный звуковой источник, тем более глухим должен быть его звук.

Огибание препятствий

Сюжеты кинофильмов зачастую подразумевают, что звук приходит к слушателю из-за препятствия, расположенного на пути к его источнику. Для того чтобы симулировать звук, доносящийся из-за препятствия, необходимо учитывать, что волны с малыми по сравнению с размерами препятствия длинами не смогут его обогнуть, и будут эффективно гаситься. Таким образом, высокочастотные составляющие звука источника, расположенного за препятствием, будут сильно ослаблены по сравнению с низкочастотными.

МЕТОДЫ ПОСТРОЕНИЯ СИСТЕМ ВИРТУАЛЬНОГО ЗВУКОВОГО ОКРУЖЕНИЯ

Бинауральное воспроизведение звука

Одним из методов построения 3-мерного звукового пространства с помощью 2 громкоговорителей являются так называемые бинауральные звуковые системы. Идея бинауральной записи и воспроизведения появилась достаточно давно, что, однако, не мешает нам рассмотреть ее более подробно.

Давайте предположим, что у нас есть возможность расположить два микрофона с абсолютно линейной амплитудно-частотной характеристикой непосредственно в слуховых каналах головы человека. В этом случае звуковые сигналы, воспринимаемые этими микрофонами будут содержать в себе всю информацию, необходимую для определения месторасположения звукового источника головным мозгом (об этом мы писали выше). Предположим, что нам удалось без изменений записать эти сигналы. Если затем подать их на головные телефоны (наушники) которые мы смогли бы поместить на место микрофонов, т.е. опять непосредственно в слуховые каналы, то воспринимаемый нами звук соответствовал бы первичному звуковому полю источника и также содержал бы всю необходимую информацию для локализации его источника в 3-мерном пространстве.

Эксперименты по созданию бинауральных звуковых систем проводились с помощью специального манекена, имитирующего человеческую голову, и продолжаются по сей день. Нужно отметить, что в этом направлении были достигнуты значительные успехи. Например, отмечено, что при бинауральной схеме звуковоспроизведения значительно повышается способность слушателя к локализации звуковых источников в 3-мерном пространстве, усиливается так называемый "эффект присутствия", который и является нашей целью в домашних развлекательных системах.
Однако, как легко догадаться, не все так гладко, иначе про обычную стереофонию и многоканальные системы домашнего кинотеатра мы бы уже давно забыли.

Во-первых, все люди разные и все они отличаются формой головы, тела, ушной раковины и т.д., поэтому записи, сделанные с использованием "искусственной головы" носят более чем усредненный характер, а этого порой бывает недостаточно для того, чтобы ввести в заблуждение наш мозг и создать иллюзию трехмерности.

Во-вторых, даже произведя идеальную запись сигнала непосредственно в ушных каналах "искусственной головы", мы не можем воспроизвести записанные сигналы непосредстевенно в слуховых каналах реального слушателя.

В-третьих, не существует аппаратуры, которая могла бы абсолютно точно записывать и воспроизводить звук (любая аппаратура вносит свои изменения, а в данном случае важны мельчайшие нюансы).

Наконец, многие просто не любят прослушивать музыку в наушниках, испытывая при этом значительный дискомфорт. Этот дискомфорт в частности связан еще и с тем, что при использовании качественных студийных или Hi-Fi наушников закрытого типа наши ушные раковины оказываются прижатыми к голове, а такое положение является для них неестественным, что приводит к снижению точности пространственного восприятия и быстрой утомляемости.
Широкому распространению бинауральных звуковых систем мешает также и то, что записи для них, очевидно, должны быть сделаны специальным образом (обычные стерео записи не подойдут, поскольку они не несут всей необходимой для пространственной локализации информации). Такие записи в принципе есть, но их крайне немного, да и стоят они достаточно дорого, поэтому их следует рассматривать скорее как демонстрационный материал, нежели реальную возможность для использования в системах домашнего развлечения.

Функции HRTF

Идея записи и воспроизведения 3-мерного звука с помощью бинауральных систем получила свое развитие с появлением и совершенствованием процессоров звуковой обработки. Действительно звуковой сигнал, поступающий в слуховые каналы человека, получается за счет определенной трансформации (по частоте, фазе и уровню) сигнала излучаемого источником звука. Функции, по которым производится данная трансформация, получили название HRTF (Head Related Transfer Function или Передаточная Функция Головы). Стоит ли говорить, что эти функции слишком сложны для того, чтобы их можно было получить обычными вычислительными методами. Как правило, эти функции получают экспериментальным путем, измеряя параметры звукового сигнала с использованием описанных выше манекенов.

Проведение многочисленных экспериментов позволило разработчикам пространственных звуковых систем создать обширные базы данных, использование которых в современных звуковых процессорах позволяет добиться впечатляющих результатов. Действительно, если звуковой процессор, занимающийся обработкой сигнала, обладает достаточным быстродействием для расчета звуковых характеристик с использованием HRTF в реальном времени, то система, в которой он работает, сможет создавать 3-мерное звучание без использования специальных бинауральных записей и головных телефонов в слуховых каналах. Кстати, библиотека HRTF фильтров создается в результате лабораторных измерений, производимых с использованием манекена, носящего гордое название KEMAR (Knowles Electronics Manikin for Auditory Research) или с помощью специального "цифрового уха".

Алгоритм Crosstalk Cancelation

Современные процессоры позволяют обходиться вообще без наушников, а использовать обычные акустические системы, используя так называемый алгоритм Crosstalk Cancellation. Суть этого алгоритма в следующем. Предположим, что мы используем сигнал, обработанный звуковым процессором с использованием функций HRTF на обычные акустические системы. Предположим также, что используемые в процессоре функции позволяют учесть тот факт, что звуковые сигналы излучаются не наушниками, а удаленными от слушателя громкоговорителями. Однако даже при этом мы не сможем просто так получить желаемый результат. Дело в том, что наушники без проблем позволяют подвести сигнал, предназначенный для правого уха именно к этому уху и только к нему, левое ухо его слышать не будет. То же самое можно проделать с сигналом, предназначенным для левого уха. В случае использования обычных громкоговорителей это, к сожалению, невозможно. Сигнал, излучаемый левым громкоговорителем, будет восприниматься обоими ушами - и левым и правым, и наоборот.

Предположим, что при помощи 2 акустических систем необходимо спозиционировать виртуальный звуковой источник, находящийся в определенной точке слева от слушателя. Если запись звука этого источника производилась двумя микрофонами, разнесенными на расстояние эквивалентное расстоянию между ушами, то вполне вероятна ситуация, когда правое ухо вначале услышит кросстолк-сигнал с левого громкоговорителя и лишь затем полезный сигнал с правого. В силу эффекта Хааса (или иначе эффекта предшествования) полезный сигнал правой колонки в этом случае будет полностью проигнорирован. Эффект Хааса, кстати, заключается в том, что при обработке пакета аудио информации, состоящего из отдельных звуковых импульсов, слегка разделенных во времени, наш мозг использует только первый импульс для вычисления направления на источник, приписывая всем последующим те же самые пространственные координаты.

В рассмотренной выше ситуации слушателю будет казаться, что звучит только левая (т.е. ближайшая к записанному виртуальному источнику) колонка. Пространственной звуковой панорамы в этом случае получить не удастся.Для того чтобы устранить негативное влияние кросстолк сигнала в том или ином канале на восприятие аудио информации был разработан алгоритм Crosstalk Cancellation, который подразумевает "подмешивание" в левый громкоговоритель сигнала, предназначенного для правого громкоговорителя, но с определенной задержкой во времени. Эта задержка подбирается таким образом, чтобы звук, пришедший к правому уху от левого громкоговорителя, оказался в противофазе с "подмешанным" сигналом от правого громкоговорителя. При этом они нейтрализуют друг друга, и левое ухо будет воспринимать только сигнал с левой колонки, а правое - только с правой.

Зона комфортного прослушивания или Sweet spot

Даже в теории, как видите, все получается достаточно непросто, на практике же построение 3-D звука с помощью двух акустических систем является архисложной задачей. В частности, все расчеты, о которых мы написали выше, можно произвести только для конкретной области прослушивания, которая называется Sweet Spot (дословно - "сладкое пятно"). Как только слушатель покинет пределы этой области, алгоритм Crosstalk Cancellation естественно перестанет работать, поскольку требуемые сигналы перестанут приходить в противофазе. Естественно, очень многое зависит и от характеристик самого звуковоспроизводящего тракта и в первую очередь от акустических систем.

Впрочем, на практике ситуация не такая уж безнадежная. Чрезмерная чувствительность алгоритма Crosstalk Cancellation проявляется только на высоких частотах (более 1 кГц), где содержится не так уж много звуковой информации, а голова начинает служить хорошим экраном от проникновения паразитного кросстолк-сигнала и, следовательно, необходимость в его применении становится меньше.

Большинство производителей все же пока ограничивается использованием упрощенных алгоритмов построения 3-D звука с применением усредненных (подходящих для большинства людей) функций HRTF. К сожалению, в результате, создаваемая звуковая картина также получается весьма усредненной либо же не получается вовсе.

Системы, работающие по принципу отражения от стен

Для того, чтобы создать эффект виртуального звукового окружения вовсе не обязательно производить сложную процессорную обработку аудиосигнала. Можно воспользоваться тем обстоятельством, что аудиосистемы в большинстве своем работают в закрытых комнатах, в которых есть отражающие звук поверхности - стены, пол и потолок. Именно этот принцип использует, к примеру, английская компания KEF, выпустившая систему громкоговорителей, состоящих из традиционного для этой компании модуля UniQ, обеспечивающего звучание фронтальных и центрального каналов, а также плоских звуковых панелей NXT, расположенных по бокам акустических систем и излучающих звук тыловых каналов. При корректном расположении акустических систем относительно места прослушивания и стен помещения звук тыловых каналов, отраженный от стен помещения придет к слушателю не спереди, а сбоку, обеспечив таким образом правдоподобное окружение.

Системы использующие только процессорную обработку

В принципе, к системам, использующим процессорную обработку для создания эффекта виртуального окружения, можно отнести практически любой современный AV-ресивер. Почти все эти аппараты имеют тот или иной алгоритм для имитации тыловых эффектов при помощи только двух громкоговорителей. Интересное решение предложила немецкая компания Audica, производящая стильные дизайнерские акустические системы. К примеру, в одном из наших тестов приняла участие 2-канальная система виртуального окружения, однако в ней были использованы не 2 фронтальных громкоговорителя, а фронтальный и тыловой. Эти акустические системы располагаются горизонтально (наподобие АС центрального канала в обычных 5-канальных театральных системах) и имеют возможность подключения сразу нескольких каналов (правого, левого и центрального для фронтальной АС и левого и правого тыла для задней колонки). При этом каждый канал звуковоспроизведения использует свой собственный набор динамических головок, заключенных в едином корпусе. Данные АС требуют подключения к обычному AV-ресиверу, и как показал дальнейший тест их желательно использовать с теми или иными алгоритмами расширения звукового пространства.

Системы с особой конфигурацией динамиков и процессорной обработкой

Как мы уже упоминали разработка и применение комплекса функций HRTF для системы, воспроизводящей звук через обычные громкоговорители, является очень сложной задачей. В связи с этим многие производители идут на определенный компромисс, проводя обработку звука по упрощенному алгоритму, но зато используя специальную конфигурацию установки динамиков в громкоговоритель.

Например, компания Polk Audio предложила горизонтальный громкоговоритель Surround Bar, в котором основной сигнал виртуального тыла подается на один комплект динамиков, а корректирующий сигнал для устранения кросстолк-эффекта - на другой комплект динамиков, отстоящих от основных на расстояние, примерно равное расстоянию между человеческими ушами.

Компания Aleks Digital Technology предложила использовать комплект, состоящий из горизонтальной АС с тремя комплектами фронтальных динамиков и двумя боковыми, расположенными на торцах колонки. Эффект виртуального окружения достигается за счет аналоговой обработки аудиосигнала, которая манипулируя фазовыми сдвигами позволяет подать необходимый сигнал на тот или иной комплект динамических головок.

Очень интересное решение предложила датская компания Final Sound, известная производством электростатических громкоговорителей самого высокого уровня. В системе Final звук, подвергаясь процессорной обработке, подается на 2 фронтальные электростатические системы. Как известно, электростаты имеют биполярную характеристику направленности. Подавая на них дополнительный сигнал с фазовой задержкой, можно получить практически однородное звуковое пространство, окружающее слушателя в любой точке комнаты прослушивания.

Звуковые проекторы

Японская компания Yamaha, известная своими многочисленными достижениями в области цифровой обработки звука, продолжает развивать направление звуковых проекторов, которые стали весьма успешным коммерческим продуктом в ряде стран мира. Идея звукового проектора заключается в размещении большого количества динамических головок в одной плоскости громкоговорителя. Каждый из динамиков имеет собственный усилитель и управляется цифровым процессором, который может производить фазовые манипуляции.

Таким образом, звуковой проектор Yamaha представляет собой фазированную антенную решетку. Варьируя фазы звуковых сигналов, поступающих на те или иные динамики, можно управлять направленностью звука всего проектора. При необходимости получить эффект звучания тыловых громкоговорителей можно направить звуковые лучи таким образом, чтобы они, отразившись от стен комнаты прослушивания, достигли зрительского места сбоку или сзади.

По материалам портала AVREPORT.ru