Здравствуйте! Послушайте это:
На примере этого я буду объяснять как устроен формат сжатия музыки .mp3
Для моего объяснения оно подходит лучше всего. Мне не платили за накручивание прослушиваний этой песни в Яндекс. Музыке через Яндекс. Дзен. Эта песня просто подходит. Можете включить свою любимую группу, но главное - в треке должны быть переходы
Нус, приступим!
Алгоритм сжатия .mp3 очень сложный, но я постараюсь вкратце и максимально коротко объяснить что происходит. Но сначала нужно разобраться. Посмотрите сюда:
Что же это? Ну для самых маленьких читателей объясню. Это CD-проигрыватель в него вставлялся во такой CD-диск
на него помещалось до 74 минут музыки. Файл кодировался наитупейшим образом. Просто записывался уровень аналогово сигнала через очень короткие промежутки времени. На CD это делается 44100 раз в минуту всё это кодируется 16 битным числом и если подсчитать, то получиться, что 1 секунда аудио на CD - диске 1411,2 кбит, а минута уже 84672 кбит, а трёхминутная песенка больше 254016 кбит. В формате .mp3 всё меньше 1 секунда - 128 кбит, 1 минута - 7680 кбит, а трёхминутная песенка - 23040 кбит. (Битрейт) Но как удаётся сжать файл в 11 раз, не потеряв качества? Не можем жы мы вырезать каждый 10-ый сигнал. Сейчас объясню.
Вот смотрите.
Шаг 1. Преобразование Фурье
Сейчас расскажу что это такое, как оно происходит и зачем оно надо
Что такое звук?
Вспоминаем физику. Звук - это волна. Например, такая
И это не запись такая уродливая, а класика. Это вообще то "Лунная соната" Бетховена
Секрет в том, что звук, внимание, это не волна, а смесь волн! Накладывался друг на друга они приобретают вид очертания гор Кавказа.
При преобразование Фурье происходит вот что: Для начала нужно понять из каких частот и с какой интенсивностью сложилась волна. По такому принципу работает и шазам, "Алиса, распознай мелодию"и другое. Он раскладывает звук на частоты, выделяет особенные моменты. конкретные ноты и сверяет со своей базой. А не как то так
Шаг 2. Разбить на кусочки
Когда кодируется файл mp3 трек сперва разрезается на кусочки. Один такой кусочек называется Фрейм. Его длина, обычно, составляет 0,026 секунды, то есть 1152 отсчёта. Над каждым из них производится преобразование Фурье. И тут начинается самое интересное!
Шаг 3. Отсечь лишние
С возрастом мы хуже воспринимаем высокие частоты. Да и звучат они противно. Сами послушайте
Шаг 4. Убираем испорченное
Наш слух не идеален. оказывается, на какой то частоте если звук довольно таки громкий, он может заглушить средние частоты, и частоты ему кратные - гармоники. Это можно убрать. Никто не заметит
Шаг 5. Сделай тише
Особо громкие звуки приводят к временной глухоте. Она продлевается 0,05 с. Кроме того временна глухота наступает и перед громким звуком. Почему не убрать всё, что не слышно? Ведь никто не заметит.
Шаг 6. Математика
При записи стерео, кодируются не оба канала, а их полусумма и разность. Звуки микшируются
Так, многие инструменты звучат почти одинаково и закодировать это можно грубее. Отсекается много всего.
Шаг 7. Создаём шифр
С одно стороны мы убрали кучу не нужной информации, но получили огромное кол-во ерунды. Что то типа
(01000010000000001010000000011000000000000011) и это раз 25 с некоторой периодичностью. давайте мы это сожмём до 01010 и укажем на это то есть 01010 будет равно 01000010000000001010000000011000000000000011, укажем, где и как это повторять и файли сразу же похудеет в 25 раз
Готово
Вот мы и получили наш файл "моя новый проект.mp3"
Как то так.
На этом пока всё.
Спасибо, что дочитали мою статью до конца. Нажимайте жёлтую кнопку Подписаться, что бы она стала серой, ставьте статье "Палец вверх" и пишите комментарии.
Также вступайте в группу WhatsApp и канал в Яндекс. Мессенджере.
А ещё можно пройти опрос, который займёт у Вас не больше 5 минут. Там 6 простых вопросов (последние 2 не обязательны). Можно даже предложить тему для новых статей. Каждый ответ будет учтён. Всё анонимно.
Предыдущие выпуски рубрике: