Найти тему
Oleg Rogoz

Теорема Котельникова - к аудио не имеет отношения.

Формулировок данной теоремы или теоремы Шеннона - Найквиста, более чем достаточно - это и математическое представление и множество трактовок.

На бытовом аудиофильском уровне можно представить такую трактовку - частота дискретизации должна быть выше частоты сигнала в два раза.

Массы населения узнали о Котельникове и его теореме после внедрения CD формата или компакт дисков. Именно тогда появились такие цифры - 16-бит импульсно-кодовой модуляции (PCM) и частотой дискретизации 44,1 кГц.

В чем тут проблема? Вот в чем. Реклама представила такие параметры:

- Диапазон частот: 0..22050 Гц
- Динамический диапазон: 98 дБ
- Уровень шума: -98 дБ
- Коэффициент нелинейных искажений: 0,0015% .

А, теперь давайте возьмем карандаш бумагу нарисуем синусоиду и отсчеты на ней в два раза выше, как на компакт диске и посмотрим что получится.

Нарисовали? Действительно, если частота дискретизации ровно в два раза выше и на каждый период сигнала попадает один отсчет дискретизации то проблем нет. Проблемы начинаются если частота сигнала не в два раза меньше, а допустим в 1,8 раз. Получается, что отсчеты дискретизации уже не попадают точно на каждый период и начинается полная чепуха. Начинаются потери. Т.Е. информация о частоте в условном виде еще передается, но возникает амплитудная модуляция с потерей информации о амплитуде сигнала. Получается вот, что:

Это синусоида частотой 10 кГц оцифрованная с частотой дискретизации 44,1 кГц, как у CD формата. Мы видим громадного уровня искажения, а ведь это даже не 20 кГц, как нам обещали а всего лишь 10...

Что же происходит. А, вот, что если частоты соотносятся в два раза точно - то теоремы работают и все прекрасно. А, если не в два раза, то вся эта кухня, разваливается. Получается, что если мы хотим без потерь оцифровать к примеру - 18 кГц, то нужно изменить и частоту дискретизации и сделать ее точно в два раза выше. А, на самом деле формат CD имеет постоянную частоту дискретизации и соответственно теоретически может передать полосу частот в 20 кГц, только с огромными искажениями.

На следующей картинке можно подробно рассмотреть сигнал частотой 10 кГц с дискретизацией - 44,1 кГц.

-2

Мы отчетливо видим, что на каждый период сигнала сигнала попадает всего 4 отсчета дискретизации и вместо синусоиды мы видим, непонятно, что.

Ну на закуску - возьмем ту же самую частоту 10 кГц и оцифруем ее с частотой дискретизации 192 кГц, как у хай-резных форматов.

-3

Вот теперь мы видим, что искажения пропали и синусоида остается синусоидой.

Сделаем выводы - на самом деле в CD формате можно без потерь оцифровывать высокие частоты не более, чем 5 кГц, частоты более высокой частоты будут" безбожно" искажены.

И тут на меня, конечно наваливаются теоретики и меломаны-аудиофилы и приведут мне факты и записи, что реально на тестах CD формата, на тестовых дисках и они сами слышат ушами высокие частоты до 20 кГц, (ну как у кого получится). И, действительно возьмем тестовый диск и можем увидеть осциллографом с него синусоиды до 20 кГц включительно. Почему это так, ведь в лабораторных работах не получается оцифровать 20 кГц дискретизацией 44,1 кГц? Ответ такой - на выходе ЦАПа, как правило стоит восстанавливающий фильтр, который и исправляет ситуацию. И кроме того при записи, применяются специальные алгоритмы и методы обработки, которые все это безобразие - скрывают.

Но физически и совершенно однозначно с помощью карандаша и листка бумаги, каждый человек может реально нарисовать этот процесс и сделать выводы.

Но, и этого мало и мы перейдем теперь к другому параметру, а именно 16 бит и динамическому диапазону в 98 дБ.

И тут нас ожидают не менее веселые открытия. Дело в том, что эти цифры - обман. Они приведены для максимально возможного уровня сигнала, по амплитуде 0 дБ. Как только уровень сигнала начинает уменьшаться, происходит примерно тоже самое, что и с частотой начинают расти искажения и падает разрядность. Грубо говоря, большой сигнал обрабатывается 16 битами, а маленький, теми, что остаются. Чем меньше уровень, тем больше искажений и шумов. Вот например, ка выглядит синусоида на малых уровнях квантования:

-4

А, на совсем уже малых уровнях, на уровнях чувствительности - синусоида вообще превратится в меандр.

Как же решается это ограничение? Все просто - записи компрессируются. Т.Е. уровни каждого инструмента и всей записи загоняются в некоторые ворота, как правило все записи на CD сжимаются на студиях до 40 - 60 дБ. Во первых, записи с компрессией лучше звучат, слитно, плотно и монолитно, отчетливо слышны даже самые тихие звуки. Во вторых здесь тоже используются специальные алгоритмы обработки, приводящие сигнал в приличный вид.

Можем взять любой звуковой редактор и поэкспериментировать с синусоидами и частотами дискретизации и убедиться самостоятельно, как все это работает. А, можем и проще, все это нарисовать на бумаге.

Какие же мы можем сделать выводы?

Вывод такой - формат CD безнадежно устарел и в реальности не соответствует рекламным обещаниям, вернее там есть некоторые умолчания и недомолвки, которые неприятно удивляют.

И второй и главный вывод - на самом деле мы не такие уж и придирчивые слушатели, мало кто может отличать форматы, на слух, и в реальности там не такая уж и большая разница в звучании, мы не в состоянии оценить эти нюансы, они не столь и очевидны.

Как эпилог - стоит сказать, что современные форматы 24-х битовые, с частотами дискретизации 96 или 192 кГц таких проблем уже не имеют, а скорее даже являются избыточно качественными, для музыкальных записей.
Наука
7 млн интересуются