Представьте себе ситуацию: вы стоите в лесу, и откуда-то слышится треск ветки. Слева. Вы поворачиваете голову влево — хотя никто вас не просил, хотя вы не принимали никакого сознательного решения, хотя, строго говоря, источник звука мог быть ложью. Мозг уже всё сделал сам, пока вы только начинали думать. Это не случайность и не рефлекс в обычном смысле — это следствие того, как именно слуховая система обрабатывает временну́ю разницу между двумя ушами. И понять этот механизм — значит понять довольно много о том, почему звук в кино, концертных залах и акустических системах устроен именно так, а не иначе.
Хельмут Хаас и его диссертация 1949 года
Хельмут Хаас — немецкий акустик, который в 1949 году защитил диссертацию в Гёттингенском университете. Его интересовал конкретный вопрос: как мозг локализует источник звука, когда тот же самый звук приходит с небольшой задержкой с другого направления? Это был не абстрактный вопрос — речь шла о практической проблеме проектирования систем звукоусиления в залах. В большом пространстве звук из динамика на сцене доходит до задних рядов с заметной задержкой по сравнению с прямым звуком, и добавление дополнительных колонок по залу создавало путаницу: зрители слышали несколько источников и не могли понять, откуда именно идёт речь.
Хаас провёл серию экспериментов с двумя громкоговорителями, воспроизводящими один и тот же сигнал с контролируемой временно́й задержкой, и зафиксировал результаты, которые противоречили интуиции. Если задержка между первым и вторым сигналом составляла от 1 до примерно 30–35 миллисекунд, испытуемые воспринимали звук как идущий из одного источника — из того, который пришёл первым, — даже если второй громкоговоритель был на 10 дБ громче. Мозг буквально игнорировал более громкий источник в пользу более раннего.
Механизм: почему первый всегда прав
За эффектом Хааса стоит эволюционная логика, которую несложно реконструировать. В естественной среде звук от одного источника всегда приходит к двум ушам с небольшой разницей во времени — Interaural Time Difference, ITD, — поскольку уши разнесены примерно на 17–21 сантиметр. Максимальная ITD при источнике строго сбоку составляет около 690 микросекунд — менее одной тысячной секунды. Мозг научился считывать эту разницу с поразительной точностью и использовать её для локализации.
Но в реальной акустической среде к прямому звуку всегда примешиваются отражения от стен, потолка, пола и различных поверхностей, которые приходят с задержкой — и если бы каждое отражение воспринималось как отдельный источник, пространственная картина превратилась бы в хаос. Слуховая система решает эту проблему через механизм, который психоакустики называют precedence effect, или законом первого волнового фронта: первый пришедший сигнал получает полное доверие в вопросе локализации, а всё последующее в течение примерно 30–50 миллисекунд интерпретируется как его продолжение или эхо, но не как отдельный источник.
Хаас открыл не что-то новое в физике — он точно измерил и описал то, что слуховая система делает постоянно, с рождения. Граница в 30–35 миллисекунд, после которой задержанный сигнал начинает восприниматься как отдельное эхо, стала известна как «окно Хааса», и эта цифра с тех пор входит в каждый учебник по психоакустике и акустике помещений.
Где это работает на практике
В системах звукоусиления эффект Хааса используется повсеместно и совершенно сознательно. Когда в большом концертном зале устанавливают дополнительные колонки для задних рядов, их нельзя просто включить синхронно с основным источником — иначе зрители в задних рядах будут слышать два источника и локализовать звук как идущий от ближайшей боковой колонки, а не со сцены. Поэтому в задержке (delay) для этих колонок устанавливается компенсация: сигнал задерживается на время, примерно соответствующее расстоянию от сцены до точки установки колонки. Зрители слышат прямой звук со сцены как первый, а колонка его лишь усиливает, оставаясь психоакустически «невидимой».
В студийной записи и сведении эффект Хааса используется как техника панорамирования без использования классического панпота. Если взять один и тот же сигнал, направить его в оба канала стерео, но задержать правый канал на 10–30 миллисекунд, — звук сместится влево, потому что левый канал будет воспринят мозгом как первый и следовательно как источник. Это так называемый Haas panning, и он даёт более широкое и «живое» ощущение стерео по сравнению с просто разной громкостью в двух каналах, хотя и создаёт потенциальные проблемы с фазой при сведении в моно — о чём ниже.
В акустике помещений понимание окна Хааса помогает проектировать отражающие поверхности так, чтобы ранние отражения приходили в нужный момент. Отражения, приходящие в первые 20 миллисекунд после прямого звука, воспринимаются как часть прямого звука и делают его более «широким» и насыщенным. Отражения от 20 до 50 миллисекунд создают ощущение объёма и «живости» зала. Отражения после 50 миллисекунд начинают восприниматься как отдельные звуковые события — эхо, которое может мешать разборчивости речи.
Ловушка: проблема моно-совместимости
Haas panning — техника красивая, но с засадой. Когда стереосигнал с задержкой в одном канале сворачивается в моно, два канала суммируются, и задержка превращается в фазовую разность. В зависимости от величины задержки и частоты конкретного звука, некоторые частоты при суммировании усиливаются, а другие взаимно уничтожаются — это называется comb filtering, гребенчатая фильтрация, и звучит она именно так, как описывается: как будто звук пропущен через гребень, вырывающий из него отдельные частоты. Результат неприятен и непредсказуем, и именно поэтому любой микс, в котором используется Haas panning, должен быть проверен в моно до утверждения.
Это тот случай, когда психоакустический эффект, безупречно работающий в стерео, создаёт артефакты при суммировании — и игнорирование этого факта заканчивается некрасиво. Особенно в контексте кино и телевидения, где звук в итоге может воспроизводиться через один центральный канал или через маленькие телевизионные колонки, которые де-факто работают в моно.
Эффект Хааса в кино
В кинозвуке эффект Хааса имеет особое значение из-за центрального канала. Человек, сидящий в центре зала, слышит диалог из центральной колонки раньше, чем из боковых, — всё корректно. Но зритель, сидящий далеко сбоку, получает левую или правую колонку значительно ближе, и без временно́й компенсации диалог начнёт «тянуться» к ближайшей боковой колонке, разрывая связь звука с экраном. Именно поэтому профессиональные системы звукоусиления в кинозалах содержат компенсацию задержки для каждой группы колонок, и именно поэтому неправильно откалиброванный зал может испортить даже безупречно сделанный микс.
Хаас описал механизм, который работал задолго до него и продолжит работать вне зависимости от того, знает ли о нём конкретный звукорежиссёр. Но разница между тем, кто знает, и тем, кто не знает, — это разница между человеком, который пользуется инструментом осознанно, и человеком, который иногда получает хороший результат случайно. В профессии, где дедлайны сжаты, а переделки дороги, случайные хорошие результаты — ненадёжная стратегия.