В конце позапрошлого века появился винил (вернее, шеллак, но сейчас не об этом), а в середине прошлого века — магнитная запись. В принципе, это всё, что вам нужно знать про аналоговые носители звука. Теоретически его можно фиксировать и в оптической форме, например с помощью кинопленки, но ограничения частотного и динамического диапазона, а также уровень шумов делают этот метод сомнительным с точки зрения качества конечного результата. В отличие от аналога, носителем цифры может выступать практически всё, от перфокарты и дискеты до оптики и даже голографии. При этом самое известное отличие этих доменов — дискретность, то есть аналог фиксируется непрерывно, а цифра через равные промежутки времени, определяемые опорной частотой. Про нее и поговорим.
Дискретизация — это представление непрерывной функции дискретной совокупностью ее значений. В общем случае период времени от одной выборки до следующей может различаться для каждой пары соседних выборок, но обычно при обработке сигнала, выборки следуют через фиксированный и постоянный промежуток времени. Этот промежуток называют периодом дискретизации, а величину, обратную ему, — частотой дискретизации. Для последующей цифровой обработки аналоговые непрерывные сигналы предварительно подвергаются дискретизации и квантованию по уровню с помощью аналого-цифровых преобразователей.
Согласно теореме Котельникова у нас и теореме Найквиста-Шеннона у «наших западных партнеров», если спектр исходной функции ограничен, то есть спектральная плотность нулевая свыше некоторой частоты, то эта функция однозначно восстановима по совокупности ее выборок, взятых с частотой дискретизации вдвое выше этой самой частоты. Проще говоря, для кодирования и последующего корректного восстановления, например, звукового сигнала с верхней частотой 20 кГц, частота дискретизации должна быть не ниже 40 кГц. В свою очередь глубина квантования по уровню определяет не частотный, но динамический диапазон фонограммы, однако об этом мы поговорим в другой раз.
Когда появились цифровые записи и в каких форматах они выпускались? Вы не поверите, но самые первые — почти 60 лет назад! В 1967 году японская вещательная корпорация NHK разработала АЦП с параметрами 30 кГц/12 бит, а полученный с его помощью сигнал смогла записать на видеомагнитофон. Через пару лет этот ЦАП стал стереофоническим, а разрешение увеличилось до 32 кГц/13 бит. В 1972 году еще одна японская компания, Denon, представила уже 8-канальный рекордер DN-023R с параметрами 47,25 кГц/13 бит, а через 5 лет он стал 14-битным, да еще и с эмфазисом, что было эквивалентно 15,5 битам.
Из Японии перенесемся в Соединенные Штаты. В 1976 году американская компания Soundstream представила прототип аудиорекордера с разрешением 37 кГц/16 бит. Результаты пробных записей были раскритикованы, в частности руководством аудиофильского лейбла Telarc, в лице ее директора и звукоинженера Джека Реннера, а также основателя и президента Роберта Вудса. Выводы последовали незамедлительно и уже через год был представлен 4-канальный аппарат с разрешением 50 кГц/16 бит. Таких аппаратов было в итоге сделано примерно полтора десятка — часть была продана, а остальные сдавались в аренду таким студиям, как Telarc, Delos, RCA, Philips, Vanguard, Varèse Sarabande, Angel, Warner Brothers, CBS, Decca, Chalfont и др.
В 1979 году был выпущен так называемый PCM-адаптер Sony PCM-1600. Он был предназначен для записи цифрового аудиосигнала на видеокассеты U-Matic. «Родной» видеосигнал мог записываться в форматах PAL и NTSC, соответственно разрешение аудиосигнала нужно было выбрать так, чтобы в любом из форматов получить идентичный результат, при этом совпадали только число в строке, 3 штуки. 588 строк при 25 кадрах в секунду были равны 490 строкам при 30 кадрах в секунду — пазл сложился, так и появились общеизвестные 44,1 кГц. В 1982 году всё та же компания Sony представила студийный цифровой аудиоформат DASH (Digital Audio Stationary Head), в котором впервые фигурировала частота 48 кГц. Считается, что это значение было выбрано как, во-первых, наиболее близкое к уже имеющемуся разрешению компакт-диска, во-вторых, удовлетворяющее условиям вышеописанной теоремы, а в третьих — оно нацело делилось на все основные кадровые частоты в кино и на телевидении: 24, 25 и 30, что существенно облегчало процесс синхронизации картинки и звука при монтаже. Плюс уже тогда индустрия задумывалась о защите авторских прав — некоторые из вышедших 5 лет спустя потребительских DAT-магнитофонов могли записывать внешний цифровой сигнал только со значениями 32 и 48 кГц, то есть сделать копию с компакт-диска было невозможно физически. Впрочем, как все мы прекрасно знаем: «Ален нови, ностра алис! Что означает — ежели один человек построил, другой завсегда разобрать может».
Последним из маркетинговых вывертов был крайне невнятный формат CD-XA образца 1988 года, в котором внезапно фигурировала частота 37,8 кГц. Очевидно, что его судьба оказалась предрешена. Сегодня все имеющиеся хайрезные форматы целочисленно кратны двум опорным частотам — 44,1 либо 48 кГц, но произойдет ли когда-нибудь выбор единого стандарта для всей аудиопродукции, предсказать сложно. Очевидно одно — это точно будет не DSD, впрочем, как мы рассказывали в одном из прошлых материалов, он тоже кратен 44,1 кГц.
Вместо послесловия. В хайрезах нет ничего плохого, впрочем, искать в них панацею и манну небесную тоже не стоит. Качество записи состоит в первую очередь из талантливости исполнителя и мастерства звукоинженера. С научной точки зрения чуть ли не единственный очевидный и объективный плюс высокой частоты дискретизации — это возможность использования максимально щадящих аналоговых фильтров низкого порядка, что безусловно и существенно снижает фазовые проблемы.