Эта статья ранее была снята с публикации, по причине того, что затягивались дополнительные исследования, связанные с техническими характеристиками усилителей, а соответственно и откладывалось написание второй части этой статьи. На сегодняшний день все аспекты исследований формирования сцены в аудиосистеме завершены, по этому вновь публикую этот материал, теперь как первую часть. Приятного чтения…
Любая аудио система может быть характеризована качественными параметрами оценки ее звучания. Все оценочные параметры, применяемые в аудио, укрупнено можно разделить на две большие группы: формальные (конкретные формализованные параметры и характеристики поддающиеся измерениям, эталонные значения которых указаны в соответствующей нормативно-технической документации) и неформальные (параметры и характеристики, не отраженные в отраслевой НТД, применяемые для субъективной оценки качества звукового тракта и аудио системы в целом).
Занимаясь вопросами совершенствования оценочных параметров качества усилителей низкой частоты и аудиосистем в целом, мне приходиться работать как с формальными так и с неформальными (субъективными) показателями. Работа одновременно выполняется по двум направлениям: 1 — формализация субъективных качественных оценочных параметров; 2 — установление новых формальных показателей, в связи с недостаточностью существующих, не базируясь при этом на субъективной оценке показателей аудио системы.
Характерным примером параметром субъективной оценки качества аудио системы является сцена, под которой понимается локализация источников звука в пространстве. Наличие или отсутствие сцены в аудио материале определяется исключительно субъективным методом — по результатам прослушивания аудио фонограммы (тут следует понимать, что речь идет прежде всего о стерео системах Hi-Fi и High End уровня). При этом говоря о локализации инструментов в пространстве имеется ввиду не только их расположение по оси Х, т.е. справа, по центру и слева, но и расположение по осям Y и Z. Под осью Z в пространстве понимается локализация по признаку сверху и снизу, под осью Y — дальше ближе, иногда так же говорят о глубине сцены.
Наиболее распространено следующее определение сцены: «Звуковая сцена — это точность, с которой воспроизводящая система передает звуковую информацию о размере, форме и акустических характеристиках исходного пространства записи и размещения исполнителей в помещении для прослушивания».
Прошу вас внимательно прочитать и обратить внимание на фразу из определения: «система передает звуковую информацию», что подразумевает тот факт, что в исходной записи (в прослушиваемом звуковом файле) присутствует вся необходимая составляющая для формирования звуковой сцены в комнате.
По итогам оценки системы сцена может проявляться в полной мере (слушатель четко может локализовать в пространстве всех исполнителей и инструменты, которые присутствуют в аудио материале), может проявляется недостаточно явно (слушатели с трудом локализуют инструменты в пространстве) либо сцена не проявляется вовсе, т.е. при прослушивание не удается определить пространственного распределения звучащих в аудио материале инструментов.
С целью дальнейшего изучения вопроса формирования звуковой сцены решено было провести аудио эксперимент, суть которого заключалась в прослушивании одного очень интересного аудио файла (свободно гуляющего в сети). Происхождение данного файла мне не известно, информация о владельце в мета тегах файла так же отсутствует. MP3 файл продолжительностью 1 мин. 9 сек., имеющий скорость потока в 192 кбит в сек., содержит запись звуков потряхивания спичечного коробка с одновременным перемещением звука из правого в левый канал и на оборот. Для большей наглядности распределение звуков в файле между левым и правым каналом можно посмотреть скриншот аудио дорожки сделанный в программе Sound Forge.
Собственно вы и сами можете прослушать этот тестовый файл (рекомендую выполнить прослушивание в наушниках в спокойной обстановке).
Для эксперимента была выбрана не профессиональная не подготовленная аудитория студентов различных специальностей. Все участники эксперимента были разбиты на три равные по численности группы. Участникам этих групп было предложено прослушать опубликованный выше тестовый аудио файл в наушниках и по результатам прослушивания заполнить анкету, форма которой представлена ниже.
Первая группа. Для первой группы мной была дана подробнейшая информация о том, что записано в файле, о том как будет перемещаться звук в пространстве, т.е. когда движение будет перед прослушивающим, когда позади, а когда звук спичечного коробка будет над ним.
Вторая группа. Вторая группа получила туже информацию что и первая, однако в процессе прослушивания все участники этой группы располагались спиной к стене, на расстоянии примерно 10 см.
Третья группа. Участникам этой группы информация о прослушиваемом файле не предоставлялась вообще, т.е. перед прослушиванием мной были сказаны следующие слова: «Сейчас вы по очереди прослушаете аудио файл, а затем молча уходите в соседнюю аудиторию и заполняете предложенную вам анкету, после чего возвращаетесь обратно и сдаете анкету мне».
После обработки всех анкет было установлено, что участники первой группы смогли услышать движение по осям X, Y и Z, при этом локализация движения объектов на записи полностью совпадала с предложенным мной вариантом. Участники второй группы так же подтверждали предложенный мной вариант за исключением движений сзади, т.е. ответ на вопрос «Перемещались ли объекты в пространстве за вами…» у всех участников этой группы был однозначным — Нет. В третьей группе результаты локализации по оси Z и Y разнились значительно, т.е. часть участников этой группы фиксировали сначала движение спереди, затем сзади, часть — сначала сзади затем спереди, некоторые (меньше всего участников) фиксировали движение только над ними и сзади. Составить какую то закономерность локализации объектов в аудиозаписи представлялось возможным только по оси Х, т.к. движение справа налево и наоборот совпадало у всех участников третьей группы прослушивания.
Эксперимент проводился мной в период 2019-2020 гг. В общей сложности в эксперименте приняло участие 45 студентов. Обработка результатов экспериментальных данных выполнялась с использованием классических методик оценки экспериментальных исследований, ошибка составила 1%. (Под ошибкой в данном случае понимается ситуация когда были сданы испорченные и пустыне анкеты).
Обобщая результаты эксперимента мной было выделено несколько ключевых событий, которые были зафиксированы участниками исследования: А — перемещение объектов на записи в трехмерном пространстве слышали 99% участников; Б — участники из первой группы в точности подтвердили рассказанное им мной направление движения; В — участники сидевшие во время прослушивания спиной к стене не отмечали движения объектов за ними, но легко отмечали движение спереди и сверху; Г — участники не имеющие информации о движении объектов на записи до эксперимента, отмечали движение объектов в трехмерном пространстве, однако направление движение не совпадало внутри участников группы (т.е. некоторые участники говорили что вначале было движение спереди затем сзади, другие отмечали движение спереди и сверху и .п.)
Анализирую результаты, полученные в ходе этого экспериментального исследования удалось получить четкое понимание того, как происходит формирование звуковой сцены при прослушивании аудиозаписи в помещении. Наиболее важным моментом исследования является доказанный факт того, что формирование звуковой сцены как целостной пространственной картины, происходит в сознании человека посредствам соединения информации получаемой из аудиофайла и информации о пространственной локализации объектов (источников звука — музыкальных инструментов, вокалистов и .п.), которые были им получены в результате жизненного опыта. Результаты полученные во второй и третей группах особенно ярко свидетельствуют о том, что огромную роль в формировании звуковой сцены при прослушивании играет исключительно воображение человека. При этом если слушатель не имеет конкретной информации о локализации источников звука (инструментов, вокалистов и т.п.), то звуковая сцена все равно будет сформирована, при этом недостаток этой конкретной информации будет компенсирован из предыдущего жизненного опыта и в случае его полного отсутствия локализация источников звука будет сформирована по принципу, который может быть описан как генератор псевдослучайных событий.
Доказывают ли результаты прослушивания факт того, что сама аудиозапись не имеет отношения к формированию звуковой сцены — однозначно нет! Правильное сочетание громкости различных инструментов, присутствующих на записи, а так же корректная расстановка акустических систем помогают нашему воображению сформировать ту звуковую сцену, которую пытается донести до нас звукорежиссёр, однако в случае возникновения противоречивой информации (взаимоисключающие события), человеческое воображение отдает предпочтение в формировании целостной картины исключительно личному опыту, логично структурированных последовательностей. Этот факт доказывается результатами прослушивания, полученными во второй группе, где не смотря на то, что имелась информация о движении источника звука сзади слушателя, факт близкого расположение последнего спиной к стене, не позволил их воображению расположить источник звука позади себя, т.е. непосредственно в стене.