Широко известный в узких кругах разработчик Фабрис Беллар, основатель проектов FFmpeg, QEMU др., представил аудиокодек TSAC, призванный обеспечить не отличимое от оригинала качество звука при передаче по каналам со сверхнизким битрейтом.
За основу TSAC был взят кодек Descript, задействующий для сжатия алгоритмы искусственного интеллекта. В модифицированной версии была добавлена поддержка стереорежима, но, главное, удалось добиться воспроизводимости результатов на различном оборудовании благодаря применению детерминированной генеративной модели Transformer.
Многочисленные тесты подтвердили высокую эффективность TSAC даже при упаковке сложных музыкальных произведений. Так, 3,5-минутная стередорожка с частотой дискретизации 44,1 кГц после компрессии занимает всего 192 Кб. Для сравнения, 1 минутный MP3-файл требует 960 Кб дискового пространства, а 3,5 мин. — 3360 Кб. Таким образом, новый кодек в 17,5 раз эффективнее MP3.
Разработчик опубликовал на своем сайте готовые сборки как для Linux, так и для Windows. Хотя сжатие возможно силами одного лишь CPU, для ускорения процесса рекомендуется использовать видеокарты NVIDIA Ampere, Ada и Hopper с как минимум 4 ГБ VRAM.
Хотя перспектива применения TSAC в мессенджерах очевидна, ограниченные вычислительные мощности мобильных устройств пока сдерживают данное направление. Однако, в будущем это препятствие определенно будет преодолено.