Что такое HD Voice и как повысить качество разговоров?

Технология HD Voice, которую массово внедряют операторы связи в России — это маркетинговое название кодека AMR-WB (Adaptive Multi-Rate Wide-Band), он же G.722.2. Этот кодек позволяет передавать в два раза более широкий диапазон частот, отсюда происходит и его название. Hi-Tech.Mail.Ru разбирается, как развивалась связь в России, какие частоты использовались, и что нас ждет в самом ближайшем будущем.

Исторически сложилось так, что обычный телефонный разговор еще со времен аналоговых линий имеет полосу в 300-3400 Гц. Почему так? Вкратце: потому что человеческий голос в целом укладывается как раз в этот диапазон и остается узнаваемым и разборчивым, если отсечь оставшиеся частоты. На аналоговых линиях, конечно, изначально никто специально ничего не отсекал, и передаваемая полоса частот ограничивалась, скорее, амплитудно-частотными характеристиками микрофонов и динамиков.

Их, правда, ради удешевления тоже делали без претензий на Hi-Fi. Однако когда пришла пора частотного уплотнения, то использовавшиеся для него модуляторы уже четко настраивались на заветный диапазон, чтобы реальную полосу пропускания медной линии можно было четко и жестко разделить на несколько одновременных разговоров. Для понимания возможностей меди: советская система АВУ на двух абонентов использовала частоты в 28 и 64 КГц - для прямого и обратного каналов соответственно.

В системах цифровой передачи все стало еще проще: частотный диапазон 300-3400 Гц прекрасно оцифровывался кодеком G.711 (частота дискретизации 8000 Гц, разрядность 8 бит, 64 Кбит/сек). Этот кодек, придуманный еще в 1972 году, был всем хорош, кроме одного - очень большой ресурсоемкости: никакого сжатия в нем не предусматривалось. Поэтому для цифровой радиосвязи стандарта GSM он не годился никак: частотного ресурса не хватило бы для обеспечения приемлемой емкости, т.е. возможности обслуживать одновременно определенное количество абонентов. Именно ради емкости сети стали придумывать кодеки со сжатием.

В сетях GSM их изначально было сразу два: Full Rate (13 Кбит/сек) и Half Rate (6,5 Кбит/сек) — второй включали на перегруженных базовых станциях, во время массовых мероприятий

Ужимали в этот поток все ту же полосу частот — от 300 до 3400 Гц. Позднее появился кодек Enhanced Full Rate — 12,2 Кбит/сек, но с более высокой разборчивостью речи; к тому времени процессоры телефонов уже могли справляться с более сложными алгоритмами кодирования. Дальше прогресс пошел в сторону AMR-Narrowband: смысл адаптивного кодека в том, что он может динамически менять битрейт потока (4,75-12,2 Кбит/сек) в зависимости от уровня помех, загруженности сети и т.п., а также обеспечивает еще более высокое качество речи.

Но тут начали появляться сети 3G, где уже для быстрой передачи данных емкости было достаточно, а уж для нетребовательного голоса — хоть отбавляй. Поэтому, собственно, и начали внедрять широкополосный кодек AMR-WB.

Он охватывает частоты от 50 Гц до 7 КГц, и качество речи в данном случае сравнимо, например, с качеством речи диктора на FM-радиостанции

Звук воспринимается совсем по-другому, не как звучащий из телефона - создается впечатление, что собеседник находится рядом. Для понимания: это качество речи примерно такое же, как при разговоре между двумя iPhone по Facetime, когда оба абонента находятся в хорошей сети Wi-Fi.

AMR-WB может использоваться в двух режимах: с полосой 50-6400 Гц или 50-7000 Гц, в любом случае дискретизация 14-разрядная, а ее частота составляет 16 КГц. Максимальный битрейт составляет 23,85 Кбит/сек, то есть, в два раза больше обычного. Кстати, при низких битрейтах (например, 6,60, 8,85 и 12,65 Кбит/сек) кодек теоретически может использоваться и в сетях GSM, но почти нигде в мире он в таком режиме не используется: первые два битрейта являются «аварийными», а минимальный 12,65-килобитный — это максимум для GSM-сети, то есть, емкость бы серьезно страдала.

Что интересно, AMR-WB — уже не самый продвинутый кодек. AMR-WB+ поддерживает битрейты до 48 Кбит/сек со стереозвуком и близок к CD-качеству — но его мы услышим, наверное, уже в VoLTE

Пока же HD Voice могут пользоваться владельцы смартфонов преимущественно на чипсетах Qualcomm, начиная с S4 Pro, а также устройств с радиомодулями Qualcomm, например, iPhone (5 и более поздние). «Голос с эффектом присутствия» включится автоматически, если на данной территории активирован кодек AMR-WB, оба абонента находятся в сетях 3G «Билайн» и их устройства поддерживают работу кодека. Следует, правда, отметить, что работает это только для звонков внутри сети и в пределах региона. То есть, абоненту другого оператора или своему абоненту в другой регион с HD Voice позвонить нельзя.

Такая же ситуация у «МегаФона», где кодек работает во всех регионах России, а вот абоненты МТС могут звонить друг другу из региона в регион: кодек HD Voice работает у красного оператора еще с 2012 года по всей стране, в том числе и на межгороде.

«Билайн» дольше всех не внедрял HD Voice, поскольку последние годы был занят достраиванием своей 3G-сети, отставшей было от конкурентов. Зато сейчас оператор объявил о планах в ближайшие два месяца, то есть, до Нового года, активировать кодек HD voice в 43 регионах России. В настоящее время HD Voice работает в Москве и Московской области, Чите, Чукотке, Иркутске, Биробиджане, Камчатке, Хабаровске, Магадане, Приморье, на Сахалине, в Якутии, Ярославле, Новосибирске, Нижнем Новгороде, Твери, Туле, Калуге, Брянске, Калининграде, Челябинске, Перми, Нальчике, Бурятии, Калининграде, Комсомольске-на-Амуре, Ставрополе, Пятигорске и в Амурском филиале.

Скоро клиенты «Билайн» смогут насладиться новым качеством разговоров по телефону в Санкт-Петербурге, Смоленске, Владимире, Костроме, Рязани, Иванове, Кирове, Тюмени, Самаре, Ставрополе, Ханты-Мансийске, Республике Коми, Чечне, Ингушетии, Карачаево-Черкессии, Северной Осетии, Удмуртии и ЯНАО.

Зачем все это нужно? Во-первых, просто приятнее разговаривать, но есть и практическая польза. Ведь стандартные кодеки рассчитаны на внятную речь взрослого человека, а вот с пожилой старушкой с невнятным голосом, или с лепечущим трехлетним малышом вы с их помощью нормально не поговорите, придется постоянно переспрашивать — а с HD Voice этой проблемы нет.

Операторы охотно внедряют HD Voice, поскольку абоненты в этом случае больше разговаривают, по исследованиям, средняя продолжительность разговора становится больше. При этом каких-либо значительных инвестиций внедрение кодека не требует, это исключительно программное решение.

Расскажите в комментариях, о каких технических инновациях операторов связи вам было бы интересно почитать?