Нельзя приступить к обзору, не уделив внимания такому важному вопросу, как природа звука и физические характеристики, влияющие на качество воспроизводимого аудио. Без этой базы сложно будет понять, какое именно оборудование выбрать и на какие характеристики делать упор. В первой части статьи - об этом.
Вступление
И снова мы говорим о звуке. На эту тему написано неимоверное количество популярных и научных статей. Но когда дело касается восприятия звука человеком, тут начинается область споров до хрипоты, до срыва голосовых связок. Восприятие - действительно самый сложный момент. Орган слуха у каждого свой, со своими характеристиками, и порой эти характеристики плохо анализируемы.
Для того, чтобы разобраться во всех деталях - что же такое звук, его оцифровка и воспроизведение оцифрованного звука, мы вынуждены окунуться в матчасть. Не слишком глубоко, чтобы статья не стала научной, но и не по верхам, чтобы не было так: «покупай это - и будет тебе счастье!».
Для тех, кто не любит скучную теорию и умозаключения, можно перейти сразу к части рекомендаций к покупке, пропустив всю теорию.
Базовые понятия
Что такое звук?
Мы живем в мире, где все, что нас окружает, кажется нам самим собой разумеющимся. Слышим, как поют птицы, как лает собака, как шумит прибой и крякает спецсигнал машины скорой помощи. Все это мы воспринимаем как обычные, привычные вещи.
А почему мы все это слышим? Что есть этот самый звук?
Тут следует вернуться в курс физики за 5-й – 6-й класс, где рассказывают о том, что все вокруг состоит из молекул - вода, дерево, стул и, конечно, воздух.
Очевидно, когда лает собака, между собакой и слушателем есть только воздух. Никаких проводов, микрофонов и наушников. Значит, проводником звука является сам воздух.
Но помимо воздуха проводником звука является, к примеру, вода. Более того, все материалы являются проводниками звука в большей или меньшей степени.
С проводниками звука определились. Так как слушать музыку нам привычнее на воздухе, а не под водой, будем описывать звук именно в воздушной среде. В любой другой среде будет все тоже самое, но с небольшими оговорками, о которых ниже.
Для того, чтобы было проще понять, как распространяется звук, представим себе совсем крохотный воздушный шарик. Его надули, а затем коварно поднесли иглу, и он лопнул, издав при этом хорошо слышимый хлопок.
Когда мы надували этот шарик, мы создавали в нем избыточное давление. Так дело в давлении? Да, именно так. Если бы шарик внутри имел то же давление, что и окружающая его среда, то при прокалывании такого шарика мы бы ничего не услышали. Это важно понимать.
Но наш шарик все-таки был надут избыточным давлением. В момент, когда он лопнул, произошло следующее: тесно прижатые друг к другу молекулы воздуха при разрыве оболочки шарика устремились в разные стороны и стали расталкивать другие молекулы в оболочке лопнувшего шарика.
Процесс этот не мгновенный, то есть молекулы, которые были внутри шарика, сперва расталкивают ближайших соседей, так как им наконец перестало быть тесно в шарике. Ближайшие соседи, в свою очередь, получив от молекул внутри шарика некий импульс, начинают расталкивать другие, более удаленные от центра шарика молекулы.
То есть мы видим, по сути, выходящую из центра лопнувшего шарика звуковую волну, которая формируется колебанием (расталкиванием) молекул воздуха. Но дальше происходит следующее.
Те молекулы, которые были внутри шарика, летят в разные стороны и расталкивают соседей, а те - своих соседей, и так далее. В какой-то момент оказывается, что в центре лопнувшего шарика молекул стало даже меньше, чем было до хлопка, то есть там образовалась область пониженного давления. И молекулы стремясь заполнить все пространство спешат занять эту свободную область. И они делают это, проталкивая молекулы уже в обратном направлении.
Через определенный момент после прокалывания шарика звук хлопка доносится и до наших ушей. Это произойдет тем быстрее, чем ближе Вы находитесь к шарику.
Наше ухо – это прежде всего барабанная перепонка и датчик ее смещения. Когда давление снаружи головы (до перепонки) и внутри головы (после перепонки) равны, мы ничего не слышим, так как барабанная перепонка не двигается.
Хлопок есть ничто иное, как волна избыточного давления, которая, достигая уха, продавливает барабанную перепонку внутрь (внутри головы давление остается тем, какое и было, то есть меньшим в момент прихода звуковой волны), а затем, когда гребень волны проходит - приходит зона меньшего давления, и барабанная перепонка выгибается уже изнутри наружу.
Так как этот процесс происходит быстро, наш слуховой нерв фиксирует колебание перепонки и передает информацию в мозг, где мы в силу опыта можем опознать этот звук как хлопок.
Это очень простое объяснение, которое не учитывает переотражение звука от стен, от ушной раковины и т.п.
Знаете, для чего в Советской Армии при штурмовых операциях пехота кричала протяжное «ура-а-а-а»? Для того, чтобы при сильнейшем хлопке (разрыве снаряда) выровнять давление внутри головы и снаружи, тем самым спасая барабанные перепонки от разрыва. Давление звуковой волны при взрыве вполне может произвести такое воздействие. А открытый рот пропускает звуковую волну в голову в зону барабанной перепонки изнутри через соответствующие пазухи.
Вернемся к музыке, а точнее к воспроизведению тех звуков, с которыми привык работать музыкант.
Генератором звуковой волны в примере выше являлся шарик, который лопнул и распространил вокруг себя звуковую волну (то есть область повышенного давления или область с большим количеством молекул).
Если же в качестве генератора звуковых волн взять, к примеру, диффузор динамика и заставить его колебаться с определенной частотой, то будет образовываться звуковая волна определенной частоты (той же, что и частота колебания диффузора динамика). Она будет состоять из областей высокого давления и разряженных областей, как показано на рисунке.
Под воздействием таких колебаний давления барабанная перепонка начнет колебаться, и мы услышим звук с частотой, равной частоте колебаний диффузора динамика (при условии, что сам динамик неподвижен относительно слушателя).
Чем выше будет частота звука, тем чаще должен колебаться диффузор и тем чаще будет колебаться наша барабанная перепонка.
Но у всего есть предел.
Большинство людей не услышат колебания воздуха (звука), частота которого будет более 20 кГц. Такая же ситуация с низкими частотами. Звуковые колебания ниже 10 Гц наше ухо, как правило, тоже бессильно воспринимать.
С частотой разобрались.
Но у звука есть еще один важный параметр – громкость. А точнее - амплитуда звуковой волны. Чем она больше, тем сильнее разница давления в точке, где молекул много (давление высокое) и точке, где молекул мало (давление низкое). Иными словами, чем больше амплитуда колебания диффузора динамика, тем громче будет звук (амплитуда звуковой волны будет больше).
Запись и воспроизведение звука
Итак, теперь понятно, что такое звук и как он распространяется. Осталось разобраться, как его запечатлеть, сохранить и при необходимости воспроизвести.
Для того, чтобы реализовать запись, хранение и воспроизведение, необходимы следующие компоненты, образующие так называемый звуковой тракт:
⦁ Источник звуковых колебаний, например, вокал или какой-то аналоговый музыкальный инструмент;
⦁ Микрофон – преобразователь механического колебания в электрическое колебание;
⦁ Усилитель электрического сигнала (нужен для того, чтобы согласовать амплитудный диапазон полученного с микрофона сигнала с входным амплитудным диапазоном следующего компонента тракта – АЦП);
⦁ АЦП – аналогово-цифровой преобразователь. Устройство, которое преобразует аналоговый электрический сигнал (электрические колебания) в цифровое представление, а точнее в последовательность значений, записанных с определенным интервалом;
⦁ Цифровой информационный канал. Это обычные соединительные провода, по которым, согласно выбранному интерфейсу, происходит передача цифровых данных далее по тракту;
⦁ Электронное запоминающее устройство. Например, жесткий диск или флеш-накопитель;
⦁ Цифровой информационный канал;
⦁ ЦАП – Цифроаналоговый преобразователь. Его функция является обратной функцией АЦП, то есть превратить последовательность цифровых значений в электрический сигнал;
⦁ Усилитель аналогового сигнала. Требуется для мощностного и амплитудного согласования полученного с помощью ЦАП сигнала с акустической системой;
⦁ Акустическая система (динамик, наушники). Преобразует электрический сигнал в звуковые колебания, которые мы можем слышать.
Нас будет больше волновать вторая часть звукового тракта - выходная. Это пункты с 6-го по 10-й включительно. Именно на эти пункты мы можем как-то влиять. Все, что происходило в пунктах с 1-го по 5-й, происходило в студии звукозаписи, и мы не можем уже никак повлиять на это.
Тем не менее, для понимания формирования требований к исходным файлам нужно разобраться со всем звуковым трактом. И самым важным элементом его входной части, безусловно, является АЦП.
АЦП, назначение и принцип работы
АЦП – аналогово-цифровой преобразователь. С помощью него электрический аналоговый сигнал (например, от микрофона) превращается в последовательность цифровых значений с определенной частотой.
Разрядность АЦП – предельное количество цифровых уровней (чисел), с помощью которых данный АЦП может оцифровать электрический сигнал. Чем больше разрядность, тем более точно будет произведена оцифровка, то есть ближе к оригиналу. Грубо: разрядность – это количество уровней громкости, которое может воспринять АЦП. Единицу разрядности еще называют квантом.
Разрядности 8 бит будет соответствовать всего 256 уровней громкости. Именно такой звук мы помним из игр с приставкой Денди и как можно легко понять – этого совсем недостаточно.
А вот разрядности 16 бит будет уже соответствовать 65536 уровней громкости. Это уже неплохо. Но можно и побольше. Да, большинство людей уже не услышат разницы 16-битной разрядности и разрядности 24 бит, но, когда речь идет о деталях, важным становится все. Особенно в свете того, что качество звукозаписывающей аппаратуры растет из года в год: разрядностью 32 бита в музыке уже никого не удивишь.
И уж точно Ваша звуковая карта должна поддерживать разрядность воспроизведения минимум 24 бит. Но об этом позже.
Частота дискретизации – частота, с которой происходит очередное измерение уровня электрического сигнала на входе АЦП. Чем выше частота дискретизации, тем чаще происходит очередное преобразование и тем точнее будет произведена оцифровка.
Мы уже говорили, что формат компакт-диска подразумевает частоту дискретизации 44,1 кГц. Это означает, что именно с этой частотой будут считываться значения громкости с заданной разрядностью.
А так как частотой дискретизации можно оцифровать электрический сигнал частотой не выше ее половины, то предельная частота входного электрического сигнала составляет 22,05 кГц, что является предельной частотой восприятия для большинства людей. Именно эти рассуждения и принимались во внимание при создании цифрового стандарта компакт-диска.
Кстати, для передачи голоса или разговора (его частотный диапазон лежит в промежутке от 300 Гц до 3400 Гц) достаточно всего 12 бит (то есть 4096 уровней громкости) и частоты дискретизации 8000 Гц, что по теореме Котельникова более, чем достаточно.
Итак, в результате работы АЦП, на его выходе получаем множество чисел соответствующей разрядности, которые и описывают наш звук. В чистом (несжатом) виде они могут хранится, например, в файлах с расширением WAV. Сжатие мы рассматривать в этой статье не будем, так как эта тема очень обширна и по большому счету не влияет на работу ЦАП, а скорее на требуемый для хранения записи объем памяти.
ЦАП, назначение и принцип работы
ЦАП - это обратный АЦП-преобразователь, который преобразует цифровой сигнал в аналоговый, который затем можно усилить и подать на динамик, в результате чего мы и услышим звук.
Основные параметры ЦАП аналогичны параметрам АЦП. Те же разрядность и частота дискретизации. И вот тут важно понять, что лучше иметь запас по этим параметрам и слушать формат компакт-диска на избыточной разрядности и частоте дискретизации, чем не иметь возможности послушать музыку в более качественном формате, так как аппаратура не позволяет этого сделать.
Например, относительно современный формат FLAC позволяет хранить музыкальные композиции разрядности до 32 бит и частотой дискретизации до 655 кГц (явно с запасом для будущего поколения людей, способных различить такое качество с параметрами, например, DVD-Audio, где аналогичные параметры составляют 24 бит и 192 кГц соответственно).
Продолжение в следующей статье. Поделитесь в комментариях, что нового вам удалось узнать?