Пространственное восприятие

Человек слышит двумя ушами и поэтому способен различать направление прихода звуковых сигналов. Эту способность слуховой системы человека называют бинауральным эффектом . Механизм распознавания направления прихода звуков сложен, и надо сказать, что в его изучении и способах применения еще не поставлена точка.

Уши человека расположены на расстоянии друг от друга (по ширине головы). Скорость распространения звуковой волны невелика. Сигнал, приходящий от источника звука, находящегося напротив слушателя, приходит в оба уха одновременно, и мозг интерпретирует это как расположение источника сигнала либо позади, либо спереди, но не сбоку. Если же сигнал приходит от источника, смещенного относительно центра головы, то звук приходит в одно ухо раньше, чем во второе, что позволяет мозгу интерпретировать это как приход сигнала слева или справа и даже приблизительно определить угол прихода. Численно разница во времени прихода сигнала в левое и правое ухо, составляющая от 0 до 1 мс, смещает мнимый источник звука в сторону того уха, которое воспринимает сигнал раньше. Такой способ определения направления прихода звука используется мозгом в полосе частот от 300 Гц до 1 кГц. Направление прихода звука для частот выше 1 кГц определяется мозгом человека путем анализа громкости звука. Дело в том, что звуковые волны с частотой выше 1 кГц быстро затухают в воздушном пространстве. Поэтому интенсивность звуковых волн, доходящих до левого и правого ушей слушателя, отличаются, что позволяет мозгу определять направление прихода сигнала по разнице амплитуд. Если звук в одном ухе слышен лучше, чем в другом, следовательно, источник звука находится со стороны того уха, в котором он слышен лучше. Подспорьем в определении направления прихода звука является способность человека повернуть голову в сторону кажущегося источника звука, чтобы проверить верность определения. Способность мозга определять направление прихода звука по разнице во времени прихода сигнала в левое и правое ухо, а также путем анализа громкости сигнала используется в стереофонии.

Имея всего два источника звука, можно создать у слушателя ощущение наличия мнимого источника звука между двумя физическими. Причем этот мнимый источник можно "расположить" в любой точке на линии, соединяющей два физических источника. Для этого нужно воспроизвести одну аудиозапись (например, со звуком рояля) через оба физических источника, но сделать это с некоторой временной задержкой в одном из них и соответствующей разницей в громкости. Грамотно используя описанный эффект, можно при помощи двухканальной аудиозаписи донести до слушателя почти такую картину звучания, какую он ощутил бы сам, лично присутствуя, например, на каком-нибудь концерте. Такую двухканальную запись называют стереофонической. Одноканальная же запись называется монофонической.

На самом деле для качественного донесения до слушателя реалистичного пространственного звучания обычной стереофонической записи не всегда достаточно. Основная причина этого кроется в том, что стереосигнал, приходящий к слушателю от двух физических источников звука, определяет расположение мнимых источников лишь в той плоскости, в которой расположены реальные физические источники звука. Естественно, "окружить слушателя звуком" при этом не удается. По той же причине заблуждением является и мысль о том, что объемное звучание обеспечивается квадрофонической (четырехканальной) системой (два источника перед слушателем и два позади него). В целом путем выполнения многоканальной записи нам удается лишь донести до слушателя тот звук, каким он был "услышан" расставленной нами звуковоспринимающей аппаратурой (микрофонами). Для воссоздания же более или менее реалистичного, действительно объемного звучания прибегают к принципиально другим подходам, в основе которых лежат более сложные приемы, моделирующие особенности слуховой системы человека, а также физические особенности и эффекты передачи звуковых сигналов в пространстве.

Спектральные различия

Наибольшая острота локализации достигается при восприятии сложных звуков и звуковых импульсов, когда, кроме рассмотрен­ ных ранее причин, сказывается еще и спектральный фактор. На пример, если звук, приходящий под углом 90° на ближайшее ухо, содержит как низкочастотные, так и высокочастотные состав­ ляющие, то в спектре звука, действующего на дальнее ухо, высо­ кочастотных составляющих будет меньше, так как на этих часто тах оказывает влияние теневое действие головы. Кроме того, сами ушные раковины производят сложную фильтрацию звука, завися­щую от его частоты. Существенное значение для ло кализации имеет также энергия переходных процессов, причем наибольшее значение имеет наличие в звуке низкочастотных со­ставляющих переходного процесса. Поэтому при прослушивании музыкальных и речевых сигналов изменение спектрального соста­ ва сигнала (а следовательно, и его тембра) в зависимости от рас­ положения источника помогает в его локализации.

В целом анализ способности к локализации в горизонтальной плоскости показывает, что наименьший ощутимый угол отклонения источника при восприятии звуковых импульсов составляет около 3". Эту величину следует считать угловой, или бинауральной, раз­ решающей способностью слуха. Однако слух замечает угловое смещение на 3", но при определении направления совершает ошибку в среднем на 12°. Поэтому точность локализации имеет величину 12" для источников, находящихся в передней полуплос­ кости; для источников, расположенных позади слушателя, эта точ­ ность еще меньше.

Вертикальная (высотная) локализация

Способность опре­ делять направление прихода звука в вертикальной плоскости у че­ ловека развита значительно слабее, чем в горизонтальной. Она со­ ставляет 10-15° (по сравнению с 3° в горизонтальной). Эту способность связывают обычно с ориентацией и формой ушных ра­ ковин. Ушная рако­ вина действует как фильтр, внося максимальные искаже­ ния в области 6-16 кГц, при­ чем форма этих искажений зависит от того, спереди или сзади находится источник звука и под каким углом по дъема он расположен в ме­ дианной плоскости.

Глубинная локализация (оценка расстояния до источни­ ка).

При изменении расстояния до источника меня­ ются одновременно громкость и тембр, что и служит различи­ тельными признаками. Общая точность глубинной локализации не очень велика, при смещении широкополосного звукового источни­ ка от 50 до 150 см ошибки составляют 15-30%;

Среди основных факторов, определяющих оценку глубины, можно выделить следующие:

- уменьшение уровня звукового давления с расстоянием. П ри отсутствии визуального контроля в условиях свободного поля решающим признаком, по которому оценивается расстояние до источника, является уровень звуково­ го давления в месте расположения эксперта.

- Затухание звука, которое начинает сказываться при больших расстояниях, проходимых звуковой волной (больше 15 м). При э том высокочастотные составляющие затухают быстрее и спект ральный состав сигнала при удалении источника меняется (тембр становится «темнее»).

- на близком расстоянии (менее 3 м) на глубинную локали­ зацию начинает оказывать влияние также дифракция на ушной раковине и голове, т. е. сказываются разности уровней интенсивностей (выше 1500 Гц) и временные задержки (ниже 1500 Гц), как и в предыдущих случаях.

Таким образом, существенную роль для глубинной локализации играет лич­ ный опыт: если слушателю знаком сигнал или если он имеет воз­ можность сделать визуальную оценку, тогда точность глубинной локализации многократно увеличивается.

Точность глубинной локализации звукового источника значи­ тельно повышается в закрытом помещении. При пере­ мещении звукового источника по глубине меняется отношение энергии прямого звука к энергии отраженного (реверберационного) звука, что помогает точнее определить расстояние до источника.

Важнейшее значение имеет также разность по времени между при ходом прямого звука и приходом первых отражений и соотношени ях по уровням.

Эффект Доплера

Одним из важнейших факторов, связанных с восприятием звука, излучаемого движущимся в пространстве источником, является эффект, открытый в 1645 году австрийским ученым Доплером. Он состоит в том, что длина волны (а, значит, и ее частота) изменяется в соответствии со скоростью движения слушателя относительно источника волны. Чем быстрее слушатель (регистрирующий датчик) приближается к источнику звуковых колебаний, тем регистрируемая им длина волны становится меньше и наоборот. Если слушатель движется навстречу источнику звука, то в секунду он пе ресекает больше фронтов звуковых волн (встречает больше зон сжатия-разрежения), т. е. воспринимает более высокую частоту и слышит более высокий тон. Аналогичная картина имеет место, когда навстречу слушателю движется источник (например, гудок приближающегося поезда кажется выше, чем в действительности). В том случае, когда источник (или слушатель) удаляется, число звуковых волн, проходящих в секунду, уменьшается, и высота тона падает. По изменению частоты, а следовательно, и высоты тона можно определить скорость и, отчасти, направление движения источника (например, для контроля скорости движущегося транспорта).