Вступление
Все мы слушаем музыку и разговариваем по телефону. Нам в этом помогают аудиокодеки: без них звуковая информация бы занимала слишком много места. Выясним, какие аудиокодеки лучше для каких целей.
Аудиокодеки для рассмотрения
Сравним следующие аудиокодеки:
- MP3
- HE-AAC
- Opus
- AMR-NB (только для речи)
- AMR-WB (только для речи)
Эксперименты
1. MP3
Была отобрана группа респондентов. Респондентам было предложено прослушать 7 аудиообразцов, закодированных кодеком MP3 на различных битрейтах из одного и того же оригинала. Эксперимент проводился следующим методом: каждый респондент в наушниках по очереди прослушивал образцы в порядке возрастания битрейта. После каждого образца респонденту задавались следующие вопросы:
- По-вашему, это приемлемое качество для музыки?
- Слышите ли вы разницу с предыдущим образцом?
Вопрос №1 переставал задаваться, когда респондент называл тот или иной образец приемлемым. Битрейт этого образца затем записывался как битрейт приемлемого качества.
Вопрос №2 задавался, начиная со второго образца. Когда респондент отвечал на этот вопрос «нет», эксперимент останавливался и битрейт предыдущего образца записывался как битрейт прозрачности (битрейт, после которого разница в качестве звука неразличима). В случае, если респондент слышал разницу между 256 кбит/с и 320 кбит/с, давался на прослушивание оригинал (FLAC). В случае, если респондент слышал разницу между 320 кбит/с и оригиналом, в графе «Битрейт прозрачности» для данного респондента ставился прочерк.
2. HE-AAC и Opus
Среди респондентов, наилучшим образом слышавших разницу между аудиообразцами в эксперименте №1, была отобрана подгруппа. Было проведено 2 эксперимента по методу, описанному выше. Один из экспериментов включал в себя образцы, закодированные кодеком HE-AAC, а другой - образцы, закодированные кодеком Opus. После проведения экспериментов было подсчитано, насколько кодеки HE-AAC и Opus эффективнее MP3.
3. Речь
Была отобрана группа из 6 респондентов. Респондентам было предложено прослушать 7 аудиообразцов, закодированных из одного и того же оригинала различными кодеками, предназначенными для речи, на различных битрейтах. В эксперимент были включены следующие кодеки:
- AMR-NB (наиболее используемый в телефонных разговорах речевой кодек)
- AMR-WB (разработан как современная альтернатива AMR-NB)
- Opus (кодек, используемый некоторыми VoIP сервисами, например Discord)
Эксперимент проводился следующим методом: каждый респондент по очереди прослушивал образцы через речевой динамик смартфона (расположенный на передней стороне). Это сделано для имитации сценария телефонного разговора. После прослушивания каждого образца респондентам было предложено оценить понятность и качество речи по шкале от 1 до 10.
После записи результатов опроса для каждого образца был подсчитан коэффициент: средняя разность между оценкой данного образца и наивысшей оценкой, данной респондентами.
Выводы
Если Вы просто слушатель музыки, используйте HE-AAC с битрейтом 64 кбит/с. Этот кодек поддерживается большинством современных устройств и позволяет сэкономить место по сравнению с устаревшим кодеком MP3.
Если Вы обладаете тонким слухом и слышите огрехи в качестве, можно повысить битрейт вдвое: использовать HE-AAC с битрейтом 128 кбит/с.
Разработчикам следует использовать кодек Opus, так как он является бесплатным, демонстрирует высокую эффективность по сравнению с альтернативами и поддерживается большинством современных устройств. Для голосового общения достаточно битрейта 12 кбит/с, а для музыки и звука в видео можно использовать битрейт 160 кбит/с.
Не используйте MP3 - он устарел и является крайне неэффективным по сравнению с более современными альтернативами.