21 подписчик

О динамическом диапазоне, на примере альбома ''End Of The World'' (1968) группы Aphrodite's Child

16 сентября 202316 сен 2023

237

9 мин

Динамический диапазон (англ. Dynamic Range) описывает разницу в уровне громкости между самым громким и самым тихим звуком. Характеристика измеряется в децибелах (дБ), и это очень широко применяемое понятие. На мой взгляд, следует чётко разделять его на три взаимосвязанные категории:

1. Динамический диапазон человеческого слуха.
2. Динамический диапазон носителей записи.
3. Динамический диапазон фонограммы.

Давайте рассмотрим их по порядку.

Совершенно очевидно, что первое, что нас должно интересовать, это возможности человеческого слуха, которые довольно сильно ограничены :

Диапазон громкости слышимого звука

5 дБ SPL — почти ничего не слышно;
10 дБ SPL — почти не слышно — шёпот, тиканье часов, тихий шелест листьев;
15 дБ SPL — едва слышно — шелест листьев;
20 дБ SPL — едва слышно — уровень естественного фона на открытой местности при отсутствии ветра, норма шума в жилых помещениях;
25 дБ SPL — тихо — сельская местность вдали от дорог;
30 дБ SPL — тихо — настенные часы;
35 дБ SPL — хорошо слышно — приглушённый разговор;
40 дБ SPL — хорошо слышно — тихий разговор, учреждение (офис) без источников шума, уровень звукового фона днём в городском помещении с закрытыми окнами выходящими во двор;
50 дБ SPL — отчётливо слышно — разговор средней громкости, тихая улица, стиральная машина;
60 дБ SPL — шумно — обычный разговор, норма для контор;
65 дБ SPL — шумно — громкий разговор на расстоянии 1 м;
70 дБ SPL — шумно — громкие разговоры на расстоянии 1 м, шум пишущей машинки, шумная улица, пылесос на расстоянии 3 м;
75 дБ SPL — шумно — крик, смех с расстояния 1м; шум в железнодорожном вагоне;
80 дБ SPL — очень шумно — громкий будильник на расстоянии 1 м; крик; мотоцикл с глушителем; шум работающего двигателя грузового автомобиля;
85 дБ SPL — очень шумно — громкий крик, мотоцикл с глушителем;
90 дБ SPL — очень шумно — громкие крики, пневматический отбойный молоток, тяжёлый дизельный грузовик на расстоянии 7 м, грузовой вагон на расстоянии 7 м;
95 дБ SPL — очень шумно — вагон метро на расстоянии 7 м;
100 дБ SPL — крайне шумно — громкий автомобильный сигнал на расстоянии 5—7 м, кузнечный цех, очень шумный завод;
110 дБ SPL — крайне шумно — шум работающего трактора на расстоянии 1 м, громкая музыка, вертолёт;
115 дБ SPL — крайне шумно — пескоструйный аппарат на расстоянии 1 м, мощный автомобильный сабвуфер;
120 дБ SPL — почти невыносимо — болевой порог, гром (иногда до 120 дБ), отбойный молоток, вувузела на расстоянии 1 м

Из этой таблицы следует, что нас может интересовать диапазон громкости от 30 дБ (звук настенных часов), до 100 дБ (кузнечный цех). Правда, я с большим трудом могу представить себе реальную фонограмму, в которой присутствовали эти звуки. Только представьте: еле слышно тикают часы, а в следующую секунду на вас обрушивается паровой молот! Так и заикой можно стать, если не хуже…

Так вот, для воспроизведения такого чудовищного диапазона громкостей, нам понадобится устройство (и фонограмма) с динамическим диапазоном всего 70 дБ (100 дБ – 30 дБ).

Теперь мы плавно переходим к динамическому диапазону носителей записи. Информацию я взял из англоязычной википедии, но она есть и во множестве других источников.

В теории цифрового звука динамический диапазон ограничен ошибкой квантования. 16-разрядный компакт-диск имеет динамический диапазон около 96 дБ. Цифровой звук с 20-битным квантованием способен поддерживать динамический диапазон 120 дБ, в то время как 24-битный цифровой звук обеспечивает динамический диапазон 144 дБ.

Виниловые пластинки обычно имеют динамический диапазон 55-65 дБ.

Магнитофоны Ampex в 1950-х годах имели динамический диапазон в 60 дБ. В 1960-х годах усовершенствования в процессах изготовления ленты привели к увеличению диапазона на 7 дБ. Рэй Долби разработал систему шумоподавления типа Dolby A, которая увеличила динамический диапазон низких и средних частот на магнитной ленте на 10 дБ, а высокочастотных - на 15 дБ, используя компандирование (сжатие и расширение) четырех частотных диапазонов. На пике технологии профессиональной аналоговой магнитной записи был достигнут динамический диапазон 90 дБ на средних частотах при 3% искажений, или около 80 дБ в полном диапазоне частот. Система шумоподавления Dolby SR увеличила диапазон на 20 дБ, что привело к диапазону 110 дБ на средних частотах при 3% искажениях.

Динамический диапазон компакт-кассеты колеблется от 50 до 56 дБ в зависимости от типа ленты, при этом кассеты типа IV обеспечивают наибольший динамический диапазон, а такие системы, как XDR, dbx и система шумоподавления Dolby, еще больше его увеличивают.

Отсюда мы видим, что желательный динамический диапазон в 70 дБ перекрывают только цифровые фонограммы и студийные магнитофоны. Однако, даже лучшие из последних, при этом, имеют жуткий уровень нелинейных искажений, целых 3%!

Виниловые пластинки и компакт-кассеты до уровня в 70 дБ не дотягивают 10 – 15 дБ, но и то, что они дают, на мой взгляд, вполне достаточно. Просто, самым тихим звуком, который на них можно записать, будет не «звук настенных часов» (30 дБ), а «тихий разговор» (40 дБ). А самым громким при этом будет «кузнечный цех» (100 дБ)!

Наконец, перейдём к динамическому диапазону, собственно, фонограмм
(информация, с некоторыми сокращениями, взята отсюда):

«Для аудиофайлов и отдельных дорожек динамический диапазон описывает разницу в децибелах между самым громким и самым тихим моментом в аудиофайле на дорожке.

Звуковая волна состоит из пиков и спадов — вершин и впадин. Расстояние между пиками и спадами напрямую зависит от динамики сигнала: чем динамичнее звук, тем больше дистанция между вершинами и впадинами. Такое поведение напрямую влияет на подход к мастерингу, а значит и на само звучание музыки.

Сильная динамика и большое расстояние между пиками и спадами приводит к более явному звучанию транзиентов — начальных импульсов сигнала.

Такие моменты сильно выделяются на общем фоне: транзиенты слышны в мельчайших подробностях и обладают большей детализацией. То же справедливо и для других переходных состояний звука: спадам и хвостам сигналов, моментам тишины и паузам, крещендо и декрещендо (диминуэндо).

Из-за того, что транзиенты и переходные звуки обладают сильной динамикой, слишком активное сжатие и лимитирование приведёт искажениям, клиппингу и пикам при каждом проявлении транзиентов. По этой причине миксы с большим динамическим диапазоном отличает более низкий уровень громкости и малое количество компрессии: трек делают тише, чтобы оставить достаточно места для самых активных элементов.

Тихие динамичные мастер-треки чаще всего встречаются в живых и импровизационных стилях (джазе, блюзе, фанке и фьюжн), а также в классической и академической музыке.

Для достижения максимально возможной громкости и некоторой агрессии в звуке мастеринг-инженеры уменьшают динамический диапазон трека. Благодаря этому микс звучит более плотно и монолитно, а его громкость может быть практически вплотную приближена к допиковым значениям.

Уменьшение динамического диапазона происходит с помощью компрессоров и лимитеров. Важную роль здесь играет баланс между громкостью и естественностью: чем громче звук, тем более искусственно он звучит после компрессии.»

К этому я хотел бы добавить, что существует такое понятие, как «средний», точнее «среднеквадратичный» уровень сигнала. Разницу между ним, и пиковым (максимальным) уровнем измеряет плагин Dynamic Range Meter к плееру foobar2000. Результаты измерений Dynamic Range Meter выдает, как условное обозначение «DR», и число, показывающее разницу между средним и максимальным уровнем записи. Чем эта разница больше, тем шире должен быть динамический диапазон записи. Например, на рипах с виниловых пластинок, и хороших компакт дисков, он, в зависимости от композиции, колеблется от DR10 до DR12 (или выше).

При DR9 звук может ещё считаться приемлемым, при DR8 – предельно допустимым (на отдельных треках). При DR7 и ниже слушать можно только в наушниках затычках в вагоне метро, на что такие записи, вероятно, и рассчитаны.

А что делать, если интересующий вас альбом, например, “End Of The World” 1968 года группы Aphrodite's Child можно найти только на CD, в ремастере с жуткой компрессией?

Вот, что представляет собой издание Esoteric Recordings 2010 года:

--------------------------------------------------------------------------------
Analyzed: Aphrodite's Child / End Of The World (Esoteric Remaster)
--------------------------------------------------------------------------------

DR Peak RMS Duration Track
--------------------------------------------------------------------------------
DR7 -0.09 dB -8.41 dB 3:17 01-End of the world
DR8 -0.10 dB -9.64 dB 3:42 02-Don't cry to catch a river
DR7 -0.10 dB -10.13 dB 2:53 03-Mister Thomas
DR8 -0.09 dB -9.63 dB 3:15 04-Rain and tears
DR8 -0.09 dB -10.38 dB 6:08 05-The grass is no green
DR8 -0.10 dB -9.19 dB 3:16 06-Valley of sadness
DR6 -0.09 dB -7.66 dB 3:58 07-You always stand in my way
DR8 -0.09 dB -9.71 dB 3:06 08-The shepherd and the Moon
DR8 -0.09 dB -13.38 dB 6:02 09-Day of the fool
DR8 -0.10 dB -10.74 dB 2:34 10-Plastics nevermore (bonus)
DR8 -0.10 dB -10.34 dB 3:08 11-The other people (bonus)
--------------------------------------------------------------------------------

Number of tracks: 11
Official DR value: DR8

Samplerate: 44100 Hz
Channels: 2
Bits per sample: 16
Bitrate: 900 kbps
Codec: FLAC

Слушать это, в таком виде, решительно невозможно.

К счастью, существует такая замечательная вещь, как экспандер (расширитель) динамического диапазона. Обычно, это компрессор, работающий в «инвертированном» режиме, когда он не «сжимает», а «расширяет» динамический диапазон записи. Надо ли говорить, что такое устройство, большая редкость?

После долгих поисков, я наткнулся на такой VST плагин, который называется Renaissance Compressor. Для расширения динамического диапазона я использую его с вот такими настройками:

И вот, что получилось после его применения (предварительно я пересчитал исходный файл в 24/96, выкинув два бонус-трека, и обрабатывал уже его, снизив начальный уровень на 2 дБ):
--------------------------------------------------------------------------------
Analyzed: Aphrodite's Child / End Of The World
--------------------------------------------------------------------------------

DR Peak RMS Duration Track
--------------------------------------------------------------------------------
DR10 -3.04 dB -14.47 dB 3:17 01-End of the world
DR12 -2.17 dB -15.08 dB 3:42 02-Don't cry to catch a river
DR11 -2.50 dB -15.90 dB 2:53 03-Mister Thomas
DR10 -3.16 dB -15.01 dB 3:15 04-Rain and tears
DR10 -3.43 dB -16.14 dB 6:08 05-The grass is no green
DR10 -3.81 dB -15.16 dB 3:16 06-Valley of sadness
DR9 -3.11 dB -14.83 dB 3:58 07-You always stand in my way
DR10 -3.07 dB -15.62 dB 3:06 08-The shepherd and the Moon
DR11 -3.03 dB -18.70 dB 6:02 09-Day of the fool
--------------------------------------------------------------------------------

Number of tracks: 9
Official DR value: DR10

Samplerate: 48000 Hz
Channels: 2
Bits per sample: 24
Bitrate: 1613 kbps
Codec: FLAC

Послушать, и скачать то, что у меня получилось, можно вот здесь:
https://disk.yandex.ru/d/zYiJfDIyIPZKPQ