Найти тему

MP3 лучше, чем аудиокассета - это ложь: сравнительный анализ

Здравствуйте, уважаемые слушатели!

Сегодня вновь коснемся вопросов магнитной звукозаписи на кассеты. Почитал я комментарии к своим статьям о кассетах, где-то что-то написал в ответ. К дискуссии присоединились и другие подписчики. Прежде всего, речь о том, что один из подписчиков утверждает, что запись на аудиокассете проигрывает даже цифровому аудио в формате MPEG 1 Layer 3 (в простонародье mp3) с битрейтом 128 kbit/s. Я хочу сказать, что я категорично не согласен с этим утверждением.

Для начала небольшая справка по алгоритмам сжатия:

Все существующие методы сжатия информации условно делятся на две основные группы. Первая из них объединяет методы сжатия информации без потерь (losless compression), а вторая группа – сжатие с потерями (lossy compression). Файлы с расширением mp3 получаются в результате применения метода сжатия с потерей информации. Основная идея, на которой основаны все методики сжатия звукового сигнала с потерями – пренебрежение тонкими деталями звучания оригинала, лежащими за пределами восприятия человеческого уха.

Здесь можно выделить несколько моментов [1]:

- уровень шума, маскирующий эффект (звуковое сжатие базируется на факте, что человеческое ухо фактически теряет звуки, лежащие в том же диапазоне частот, что и более громкий звук; этот эффект носит название маскирующего);
- распределение полосы звуковых частот на полосы, каждая из которых далее обрабатывается отдельно (программа кодирование выделяет самые громкие звуки в каждой полосе и использует эту информацию для определения приемлемого уровня шума для этой полосы; громкий звук в одной полосе может повлиять на маскирующий эффект и на близлежащие полосы);
- использование психоакустической модели (сжатие основано на удалении заведомо неслышных) частот с более тщательной сохранностью звуков, хорошо различающихся человеческим ухом);
- использование совмещенного стерео (слуховой аппарат человека может определить направление только средних частот – высокие и низкие звучат как бы отдельно от источника. Эти фоновые частоты можно кодировать в моно сигнал).

MP3 (MPEG 1 Layer 3) – это самый популярный формат сжатия звуковых данных на сегодняшний день. Формат МР3 основан на маскирующем эффекте и предназначен для значительного уменьшения объема данных, который необходим прослушивание записи и сохранение качества звука максимально близкого к исходному. Такой файл с средним битрейтом (128 Кбит/с) приводит к получению файла примерно в 1/11 от исходного файла, имеющий средний битрейт около 1411 Кбит/с. Качество полученного файла зависит от битрейта, с которым могут создаваться mp3-файлы. Наиболее приемлемым является битрейт от 128–320 Кбит/с, но для нормального качественного звучания достаточно всего 256 Кбит/с [1].

Оставим в стороне вопросы использования эффектов сжатия на основе психоакустики. Я уверен, что найдутся люди, которые действительно не услышат ухудшения качества при маскирующем эффекте, но и будут слушатели, которые все-таки услышат разницу при воспроизведении оригинала и сжатого файла. Но эффекты сжатия на основе ограничения частотного диапазона, скорее всего, распознают гораздо больше людей. Я предлагаю взять оригинальный файл, оцифровку аудиокассеты и несколько файлов в стандарте mp3 с различной степенью сжатия и посмотреть частотную диаграмму.

  1. В качестве оригинала я взял композицию Chris Rea под названием Driving to the Christmas в формате Wav 16 bit 44100 Hz Stereo. Файл изначально являлся оцифровкой винила в формате flac и был скачан с ресурсов с Hi-Res альбомами. Пришлось перекодировать в Wav, так как flac файлы не поддерживает звуковой редактор.
  2. На кассетном аппарате Вильма 104 стерео ( по паспорту полоса частот 31.5 – 18 000 Гц) была сделана запись с Hi-Res файла в формате flac. Аппарат Вильма 104 Стерео только что после полной профилактики. Запись произведена на ленту первого типа TDK A90 (это не самая лучшая лента первого типа от TDK). Затем была проведена оцифровка в формат Wav 16 bit 44100 Hz Stereo.
  3. Оригинальный файл в формате Wav (который из flac) был записан с сжатием в файл формата mp3 с битрейтом 320 kbit/s с постоянным битрейтом.
  4. Оригинальный файл в формате Wav (который из flac) был записан с сжатием в файл формата mp3 с битрейтом 256 kbit/s с постоянным битрейтом.
  5. Оригинальный файл в формате Wav (который из flac) был записан с сжатием в файл формата mp3 с битрейтом 192 kbit/s с постоянным битрейтом.
  6. Оригинальный файл в формате Wav (который из flac) был записан с сжатием в файл формата mp3 с битрейтом 128 kbit/s с постоянным битрейтом.
  7. Оригинальный файл в формате Wav (который из flac) был записан с сжатием в файл формата mp3 с битрейтом 96 kbit/s с постоянным битрейтом.

Ниже приведены частотные диаграммы для различных файлов и форматов записи.

Рис. 1. Частотная диаграмма оригинал Wav 16 bit 44100 Hz Stereo
Рис. 1. Частотная диаграмма оригинал Wav 16 bit 44100 Hz Stereo
Рис. 2. Частотная диаграмма оцифровка с кассеты TDK A90
Рис. 2. Частотная диаграмма оцифровка с кассеты TDK A90
Рис. 3. Частотная диаграмма mp3 320 kbit/s
Рис. 3. Частотная диаграмма mp3 320 kbit/s
Рис. 4. Частотная диаграмма mp3 256 kbit/s
Рис. 4. Частотная диаграмма mp3 256 kbit/s
Рис. 5. Частотная диаграмма mp3 192 kbit/s
Рис. 5. Частотная диаграмма mp3 192 kbit/s
Рис. 6. Частотная диаграмма mp3 128 kbit/s
Рис. 6. Частотная диаграмма mp3 128 kbit/s
Рис. 7. Частотная диаграмма mp3 96 kbit/s
Рис. 7. Частотная диаграмма mp3 96 kbit/s

На рисунках желтым цветом обозначены частоты с максимальной амплитудой звучания, оранжевым средний уровень звучания и фиолетовый – минимальный уровень звучания. Анализ частотной диаграммы оригинального файла в формате Wav показывает, что полезный сигнал присутствует в полосе до 20 000 Гц гарантированно. Срез звукового файла в полосе 17 000 – 20 000 Гц также показывает ритмичное появление полезного сигнала (отзвуки ударных инструментов). Анализ частотной диаграммы оцифровки звука с кассеты TDK A90 также показывает присутствие полезного сигнала вплоть до 20 000 Гц, но надо отметить, что на некоторых частотах происходит снижение его уровня (что не удивительно для ленты первого типа). Анализ частотной диаграммы файла в формате mp3 с битрейтом 320 kbit/sпоказывает, что все высокочастотные звуки (выше 16 000 Гц) низкой интенсивности полностью удалены из фонограммы. Многие этого, конечно, не услышат, а многие все-таки услышат. При прослушивании на хорошей аппаратуре проявляется как “упрощение” или “менее яркое” звучание фонограммы на высоких частотах. Анализ частотных диаграмм mp3 файлов с битрейтом 256 и 192 kbit/s не позволяет выявить ограничений в частотном диапазоне фонограммы. На самом деле качество меняется из-за применения маскирующего эффекта, но мы договорились его не учитывать. А вот анализ частотной диаграммы mp3 файла 128 kbit/s показывает, что весь полезный сигнал с частотой выше 16 000 Гц полностью удален из фонограммы. Такая резекция сигнала опытному слушателю однозначно слышна при его воспроизведении. Справедливости ради следует отметить, что мне попадались музыкальные композиции, которые при сжатии в формат mp3 128 kbit/s показывали полное отсутствие полезного сигнала уже на частотах выше 14 000 Гц. А если посмотреть на частотную диаграмму mp3 файла с битрейтом 96 kbit/s, то вообще срезаны все звуки с частотой выше 12 000 Гц.

В качестве резюме, как бы не хотели некоторые индивидуумы очернить запись на аудиокассеты, но даже при рассмотрении только частотных характеристик фонограммы ясно, что даже средняя магнитная лента первого типа превосходит mp3 формат в принципе, не говоря уже о таком битрейте как 128 kbit/s. А есть еще кассеты второго (хром) и четвертого (метал) типа, которые обладают гораздо более высокими эксплуатационными качествами, в том числе, по возможности записи звука в более широком диапазоне частот. Вам может казаться, что Вы не слышите высокочастотную составляющую, но при урезании частот общий окрас фонограммы будет меняться, она будет звучать более “блекло”.

Никого не призываю бросить прослушивание mp3 файлов, сам периодически их тоже слушаю, но факт есть факт – кассета звучит лучше (если это, конечно, не МК-60 лохматого года), чем любой файл в формате mp3, не говоря про совсем урезанный файл с битрейтом 128 kbit/s. Подчеркиваю, это мы еще исключили из рассмотрения маскирующий эффект, который также применяется при кодировании в mp3 и приводит к потере данных.

Справочная литература

1. Нечипоренко О.В. Исследование эффективности методов сжатия звуковых данных // Вестник Хмельницкого национального университета. Технические науки. 2015. № 4. С. 127 – 131.

На этом всё!

До встреч на волнах Интернета!