Ключевые моменты
Вы, возможно, слышали, что ваша музыка «сжата», и что если бы она была менее сжата, или даже несжатой, звучала бы значительно лучше. Тем не менее, если вы знаете, что такое сжатие и как оно работает, возможно, вы не так спешите «расширить» свои музыкальные горизонты.
Познакомьтесь с мистером Найквистом
Прежде чем углубиться в тему, важно поговорить о теореме дискретизации Уиттакера–Найквиста–Шеннона, так как она основана на работах Гарри Найквиста, Клода Шеннона и (всё ещё в 1915 году) Э.Т. Уиттакера. Однако Найквист является наиболее известным сторонником этой теоремы, поэтому вы часто будете видеть её просто как теорему Найквиста.
Оставив заслуги в стороне, теорема Найквиста является основой цифрового аудио. Она утверждает, что для цифрового представления звука необходимо проводить его дискретизацию как минимум в два раза чаще, чем самая высокая частота в звуке. Например, компакт-диски проводят дискретизацию звука на 44,1 кГц, захватывая частоты до 22,05 кГц — чуть выше верхнего предела человеческого слуха.
Дискретизация может рассматриваться как базовая форма цифрового сжатия аудио. В конце концов, вы можете увеличить частоту семплирования и технически получить более точную запись оригинального аналогового звука, но размер ваших файлов будет расти экспоненциально. Увеличение вашей точности за пределами того, что человеческие уши могут воспринять, не стоит места на носителе, необходимого для хранения, и таким образом вы имеете обоснование того, сколько места должна занимать аудиозапись в целом.
Конечно, в наши дни более качественное аудио предлагает возможности, превышающие качество компакт-диска, с частотами, такими как 48 кГц, но точка убывающей отдачи относительно ясна.
Сжатие с потерями убирает «лишние» звуки
Аудиосжатие бывает двух видов: с потерями и без потерь. Сжатие без потерь (например, FLAC) сохраняет каждый бит оригинальных данных, но приводит к более крупным файлам, которые составляют примерно половину размера записи на компакт-диске.
Сжатие с потерями (например, MP3 или AAC) отбрасывает «необходимые» данные для экономии места, основываясь на психоакустических моделях человеческого слуха. Эти модели предполагают, что мы не заметим определенные звуки, заглушаемые более громкими, или частоты на границах типичного диапазона слуха человека.
Тем не менее, этот подход не идеален. Хотя сжатие с потерями убирает избыточные аудиоданные, оно также может устранить тонкие детали, такие как реверберация комнаты или гармоническое богатство инструментов. Это приводит к тому, что некоторые аудиофилы могут описывать звук как «плоский» или «безжизненный», особенно при низких битрейтах, таких как 128 кбит/с.
Частота дискретизации и глубина битов имеют наибольшее значение
Сжатие — это не единственный фактор, влияющий на качество; первоначальная частота дискретизации и глубина битов также являются критически важными.
Как я уже упоминал, частота дискретизации — это то, как часто звук измеряется за секунду. Более высокие частоты дискретизации (например, 96 кГц) захватывают больше деталей, но требуют больше места для хранения.
Глубина битов определяет динамический диапазон — разницу между громчайшими и тишайшими звуками. Более высокая глубина битов, такая как 24-битное аудио, сохраняет больше нюансов, чем стандарт 16 битов для компакт-дисков.
Когда аудио сжимается в форматы с потерями, оно часто уменьшается как в частоте дискретизации, так и в глубине битов, что может устранять тихие фоновый детали и приводить к «резкому» или «зернистому» звучанию.
Конечно, благодаря более дешевому хранению, более мощным процессорам и лучшим алгоритмам сжатия, которые варьируют битрейт в зависимости от потребностей музыки в данный момент, исходное качество музыки может быть практически полностью сохранено. И всё это с использованием лишь части объема, необходимого для хранения таких форматов, как FLAC.
Плохое сжатие легко различить
Даже если вы не аудиофил, плохое сжатие может быть заметно. Обычные аудио «артефакты» включают:
Хотите услышать это сами? Сравните высокобитный MP3 (например, 320 кбит/с) с низкобитной версией (например, 128 кбит/с). Разница ощутима, особенно в сложной музыке, такой как оркестровые или живые записи.
Тем не менее, переход на более высокие битрейты быстро приводит к одинаковому звучанию, что означает, что существует «золотая середина», при которой 320 кбит/с является хорошим примером для MP3 в частности.
Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!
Вы также можете читать меня в:
- Telegram: https://t.me/gergenshin
- Яндекс Дзен: https://dzen.ru/gergen
- Официальный сайт: https://www-genshin.ru