В верхней части экрана любого смартфона отображается самая важная информация: уровень заряда батареи, сила сигнала сотовой вышки, а также текущая технология передачи данных и стандарт сотовой связи. Вместе с тем многие пользователи смартфонов иногда замечают символ "HD" или "HD Voice". Также его можно увидеть во время разговора в верхней части экрана. Что он означает? Устраивайтесь поудобнее: раскрою Вам изнанку передачи речи в сотовых сетях 🙂
Когда мы разговариваем лицом к лицу с другим человеком, то не замечаем никаких преград в общении. Если плохо слышно - подходим ближе или просим говорить погромче. Когда шумно - можно перейти в более тихое место. Иными словами всё в наших руках.
А вот при общении по мобильному телефону в процесс передачи голоса между собеседниками вмешивается сотовая сеть. На пути от микрофона нашего смартфона до динамика на ответной стороне речевой поток многократно преобразуется. И на то есть множество причин. Самая главная из них - это необходимость экономить ресурсы сотовой сети.
Если мы возьмём аналоговый сигнал из микрофона смартфона и посмотрим на его спектрограмму, то заметим, что большая часть гармоник (составляющих речи) лежит в пределах 3,4 кГц. Для передачи такого сигнала через цифровую систему нам потребуется канал 64 кбит/сек (специально для профессоров: это по теореме Котельникова - я в курсе 😉)
Без какого либо сжатия нам нужны соединения со скоростью 64 кбит/сек для каждого голосового звонка. Но такую скорость посчитали слишком расточительной для сотовой связи. Каждая сотовая вышка обслуживает десятки или даже сотни разговоров и потребуются широкие транспортные каналы что на заре строительства сотовых сетей было непозволительной роскошью.
Поэтому в сотовых системах 2G и 3G применяются специальные кодеки для сжатия речи. Самым распространённым является AMR - адаптивный мультискоростной кодек. В самом агрессивном режиме он позволяет сжимать речь до 4,75 кбит/сек, то есть более чем в 13 раз. Но есть и более щадящие режимы, например 7,4 или 12,2 кбит/сек. Тем не менее эффект от сжатия всё-равно грандиозный, а качество речи почти не отличается от исходного при 64 кбит/сек. Описанные выше режимы AMR ещё называют Narrow Band (AMR-NB) - то есть узкополосные кодеки.
Но любому специалисту по звукозаписи известно, что человеческое ухо способно улавливать звуки далеко за пределами 3,4 кГц - аж до 15 кГц. Когда мы при оцифровке голоса отсекаем все частоты выше 3,4 кГц смысл речи сохраняется, также как и узнаваемость собеседника. Но некоторые составляющие голосового потока такие как объёмность звука и его окраска теряются.
Так вот кодеки из серии AMR-WB (wideband - широкополосные) расширяют верхнюю частоту отсечения составляющих речи до 7 кГц - в 2 раза. Благодаря этому качество передачи речи заметно повышается и практически все абоненты отмечают улучшение разборчивости, громкости и ощущений от общение при разговоре в этом режиме.
Поэтому AMR-WB ещё называют HD Voice, то есть High Definition Voice - "голос высокого разрешения" - по аналогии с HD/Full HD. HD Voice - это коммерческое (маркетинговое - для рекламы) название кодека AMR-WB. Теперь то Вы знаете что на самом деле за ним скрывается
С развитием транспортных сетей, соединяющих сотовые вышки интерес операторов к внедрению высокоскоростных речевых кодеков заметно подрос. Это же не плохой козырь в игре за абонента.
А ряд скоростей для AMR-WB заметно шире. В 3G самый распространённый - 12.65 кбит/сек, хотя может быть расширен до 23.85 кбит/сек. А в 4G скорости передачи речи ещё выше 64 кбит/сек и даже 128 кбит/сек. Последний вариант ещё называют UltraHD - Вы уже поняли откуда такое название. Речевые кодеки с такими скоростями относятся уже не к группе AMR, а EVS. Но это уже тема для другой статьи.