Найти в Дзене
NOVIX

Звонки в MAX не «булькают» даже на парковке! Разбираем NoLACE и DRED

Когда-то ахиллесовой пятой VoIP-звонков был отвратительный звук — «бульканье» и голос, как у робота, стоило сигналу чуть просесть. Но в новой реальности на первый план вышла не просто чистота звука, а сама стабильность связи. Я решил разобраться, почему у MAX с этим дела обстоят заметно лучше. Спойлер: дело в технологиях с хитрыми названиями NoLACE и DRED. Чтобы понять, как MAX чинит связь, нужно сначала разобраться, почему она вообще ломается. Представьте, что ваш голос во время звонка — это не сплошной поток, а длинное письмо, которое вы отправляете другу. Только перед отправкой вы разрезаете его на отдельные слова, каждое слово кладете в отдельный пронумерованный конверт и бросаете в почтовый ящик. В идеальном мире все «конверты» (или пакеты) долетят до вашего друга мгновенно и в правильном порядке. Он их вскроет, сложит слова в предложения, и все будут счастливы. Но интернет — не идеальный мир, и у нашей «голосовой почты» есть три главных врага. Самая очевидная проблема. Некоторые
Оглавление

Когда-то ахиллесовой пятой VoIP-звонков был отвратительный звук — «бульканье» и голос, как у робота, стоило сигналу чуть просесть. Но в новой реальности на первый план вышла не просто чистота звука, а сама стабильность связи. Я решил разобраться, почему у MAX с этим дела обстоят заметно лучше. Спойлер: дело в технологиях с хитрыми названиями NoLACE и DRED.

Почему вообще связь лагает? Объясняю на конвертах

Чтобы понять, как MAX чинит связь, нужно сначала разобраться, почему она вообще ломается. Представьте, что ваш голос во время звонка — это не сплошной поток, а длинное письмо, которое вы отправляете другу. Только перед отправкой вы разрезаете его на отдельные слова, каждое слово кладете в отдельный пронумерованный конверт и бросаете в почтовый ящик.

В идеальном мире все «конверты» (или пакеты) долетят до вашего друга мгновенно и в правильном порядке. Он их вскроет, сложит слова в предложения, и все будут счастливы. Но интернет — не идеальный мир, и у нашей «голосовой почты» есть три главных врага.

Враг №1: Потеря пакетов (Packet Loss)

Самая очевидная проблема. Некоторые «конверты» просто теряются по дороге. Застряли на перегруженном роутере, утонули в слабом сигнале Wi-Fi — неважно. Их нет. Для вашего собеседника это выглядит так, будто из вашей речи вырвали случайные слова или слоги. Именно из-за этого появляется то самое «бульканье» и голос, как у робота под водой.

Враг №2: Джиттер (Jitter)

Слово страшное, но суть простая: «конверты» летят к вашему другу по разным каналам и с разной скоростью. Пятый конверт прилетел раньше третьего, а десятый задержался на полсекунды. Телефон собеседника пытается навести порядок. У него есть специальный «зал ожидания» (джиттер-буфер), где он собирает пришедшие пакеты и расставляет их в нужном порядке. Но если опоздания конвертов слишком большие, речь начинает «дрожать», а ее темп — то растягивается, то, наоборот, ускоряется.

Враг №3: Задержка (Latency)

Это общее время путешествия «конверта» от вас до собеседника. Если оно слишком большое (больше 200 миллисекунд), начинается классическая ситуация: вы оба молчите, думая, что другой сейчас что-то скажет, а потом начинаете говорить одновременно. Это дико раздражает и убивает всю естественность разговора.

«Эффект обрыва» и предел старых технологий

Большинство мессенджеров пытаются бороться с этими проблемами стандартными методами: вставляют тишину на место потерянных пакетов или повторяют последний удачный «конверт». И пока потери минимальны (1-2%), это кое-как работает. Но как только ситуация ухудшается, вся эта система рушится. Наступает то, что инженеры связи называют «эффектом обрыва».

Это не значит, что связь ухудшается плавно. Нет. Это похоже на падение со скалы: вот вы еще нормально разговариваете, и вот, при потере всего 5% пакетов, речь внезапно превращается в неразборчивую кашу. Разговор фактически обрывается, хотя соединение еще есть.

И здесь мы подходим к пределу возможностей даже самых лучших стандартных технологий. Почти все мессенджеры, которыми вы пользуетесь — Telegram, WhatsApp, Discord — используют гениальный и проверенный временем аудиокодек Opus. Он стал золотым стандартом индустрии, и не зря: он гибкий, быстрый и отлично справляется со своей работой в хороших условиях.

Но его встроенный механизм борьбы с потерями пакетов — алгоритмический. Он работает по заранее прописанным правилам, пытаясь «угадать» потерянный звук. И как только потери превышают критический порог, его математические модели пасуют. Он не может создать звук заново. И именно здесь подход MAX кардинально отличается.

Так в чем секрет?

Вместо того чтобы ждать, пока все сломается, MAX работает на опережение. Сначала он страхует звук еще до отправки. А если что-то все-таки дошло в ужасном качестве — реставрирует уже на месте.

DRed: работа на опережение

Представим DRed как «упаковщика». Он берет пачку из десяти «конвертов» с вашим голосом и подкладывает к ним одиннадцатый — «шпаргалку», где нейросеть кратко описала их суть.

Если по дороге часть обычных «конвертов» потеряется, система на другой стороне по этой «шпаргалке» восстановит пропажу. И это не тупое копирование, а именно генерация данных. Штука мощная — может вернуть к жизни до 1,25 секунды полностью пропавшего звука.

NoLACE спасти то, что осталось

А если интернет совсем плох и вместо голоса долетели одни хрипы? Когда даже «шпаргалки» от DRed бессильны, на стороне твоего собеседника включается NoLACE.

Он слушает этот искаженный сигнал и, по сути, делает три вещи за раз. Сначала вычищает цифровой мусор, затем обрабатывает голос, делая его громче и разборчивее. И, наконец, убирает «металлический» оттенок звука, возвращая естественность.

В итоге DRed не дает связи провалиться в пропасть, а NoLACE вытаскивает ее, если она уже на самом краю.

Итого:

В общем, четкая связь в MAX — это в том числе заслуга нейросетей. Когда обычные способы уже не работают и связь рвется, технологии MAX стараются ее вернуть: достраивает обрывки звука и убирает помехи. Без сомнений — крутая технология.

Именно поэтому, когда основа продукта сделана на совесть, хочется, чтобы и другие функции были на уровне. Чтобы мессенджер стал действительно удобным в повседневном использовании, ему нужно всего ничего: дать всем авторам эффективные инструменты для каналов и добавить больше полезных интеграций. В конечном счете, лучшая технология — та, которую не замечаешь, потому что она просто работает, особенно когда это нужно больше всего. А звонок, который не оборвался на парковке, — это куда более важный аргумент, чем любые обещания.