Мнение / ноябрь 2021Голосовая почта в России и за рубежом

«Абонент не абонент — пожалуйста, оставьте ваше сообщение после звукового сигнала!» — мы слышим этот автоматический ответ множество раз и уже привыкли вешать трубку, точно зная, что никто и никогда не проверяет «голосовую почту». Я, как и все опрошенные знакомые, без гугла даже не смогу ее проверить! Зачем операторам эта странная штука? А чтобы брать деньги за звонки, которые иначе будут бесплатными. Причем не только с обычных абонентов, но и с компаний, которые используют автоматику для звонков. Представьте себе магазин, который подтверждает заказы не колл-центром через полчаса, а роботом через десять секунд. И часть этих звонков «уходит» в голосовую почту, тратя деньги компании и ломая статистику. Под катом — детективная история про early media, big data, machine learning и TensorFlow.

Что за «бесплатные звонки»?

Телефония уже довольно старая область, со многими «исторически сложившимися» штуками и техническими решениями двадцатилетней давности. Например, монетизация: оператор «А» платит оператору «Б» за время звонка на телефонный номер, обслуживаемый оператором «Б». «Все входящие бесплатно!» — это отсюда. Операторы получают деньги за то, что их абонентам звонят. Помню, раньше были даже тарифы, где за входящие доплачивали! У такого решения есть плюсы и минусы. Если входящих и исходящих звонков примерно поровну — то «никто никому не должен». Больше входящих звонков — оператор зарабатывает деньги. Больше исходящих — тратит. Операторы хотят зарабатывать, поэтому всеми силами стараются максимизировать входящие и минимизировать исходящие. Одним из таких механизмов минимизации трат является договоренность об «Early Media».

Отдельный пункт меню для заявок/сообщений

Пример:

Клиенты звонят в коммерческий отдел сети пиццерий: Добрый день, вы позвонили в компанию ПИЦЦА-М, чтобы связаться с главным офисом в Москве — нажмите 1, в Казани — нажмите 2, в Новосибирске — нажмите 3, если вы хотите открыть пиццерию в своем городе нажмите 5. После нажатия на кнопку 5 вас встречает приветствие голосовой почты: Здравствуйте, после гудка назовите ваше имя и город, в котором вы хотите открыть пиццерию, наши специалисты свяжутся с вами. Клиенты оставляют заявку и вы сможете прочитать текст заявки и увидеть номер клиента в приложении или на почте.

Это лишь пример, вы можете принимать любые сообщения голосовой почты по отдельной кнопке голосового меню.

Как настроить:

Создайте отдельный внутренний номер, на котором включается безусловную переадресацию на голосовую почту. Загружаете или начитываете голосовое приветствие «Здравствуйте, после гудка назовите ваше имя и город, в котором вы хотите открыть пиццерию, наши специалисты свяжутся с вами» и подключаете новый акканут в приложении под данными внутреннего номера.

Early Media — когда абонент не абонент

Что происходит, когда абонент «А» со своего сотового телефона звонит абоненту «Б», у которого тоже сотовый телефон? Много всего происходит, но если максимально упростить, то оператор «А» по текстовому протоколу SIP отправляет оператору «Б» запрос на звонок, а тот начинает через вышки искать абонента «Б» (на самом деле по SS7 поверх PRI, но не будем о грустном). Чтобы у абонента «А» в это время не было тишины в трубке и можно было продавать всякие «замени гудок», операторы договорились о состоянии «Early Media»: пока оператор «Б» ищет своего абонента, он может по SIP ответить «early media» и начать передавать звук по протоколу RTP. Гудки, музыку или «извините, абонент не абонент».
Также операторы договорились, что «early media» не будет тарифицироваться как входящий звонок, оператор «А» не платит оператору «Б» за эту музыку или гудки. А чтобы никто не читерил, еще договорились в состоянии «early media» звук отдавать только в сторону звонящего и обрывать такой звонок через 60 секунд. Хотя и при таких ограничениях находятся умельцы, делающие что-нибудь полезное в early media на «бесплатных» 8-800-, но это отдельная история. А наша история о голосовой почте.

Уходящая эпоха голосовой связи


Одной из главных возможностей смартфонов всё ещё остаётся именно голосовое общение, всё-таки это устройство в первую очередь является телефоном, а уже потом — карманным компьютером. Хотя нельзя отрицать тот факт, что функция телефона всё больше начинает напоминать атавизм. Возможно, вам это заявление кажется странным, как же может мобильный телефон быть атавизмом? Для такой оценки есть несколько причин, и главная из них — психологический дискомфорт, который большинство из нас испытывают в той или иной мере во время телефонного разговора. Не спешите сразу не соглашаться – мы хотели бы обратить ваше внимание на интересную статью, опубликованную на Gizmodo. Да, когда-то всё было иначе. Голосовая телефонная связь служила конкретной цели: обеспечивала мгновенную связь. И это полностью поменяло правила игры во всём мире, начиная с 1844 года. С тех пор прошло уже более полутора веков, и на протяжении этого срока, огромного, по меркам технического прогресса, менялась лишь техническая база телефонной связи. А сам принцип оставался практически неизменным. И для этого были все предпосылки, учитывая тот факт, что сама возможность общаться голосом с человеком на другом конце страны или за границей была столь же доступной, сколь важной и полезной.
Мобильные телефоны внесли особый вклад в улучшение нашего качества жизни. Одной из главных причин, по которой люди сегодня покупают мобильники, является связь в экстренных ситуациях. Но теперь есть много других развитых способов мобильной коммуникации: SMS, электронная почта, мессенджеры. Сегодня под словосочетанием «мобильный телефон» подразумевается именно смартфон, а не его кнопочный предшественник. По сути, уже сформировалась целая «мобильная культура», для которой нехарактерно использование, казалось бы, такой простой и безобидной голосовой связи — обратите внимание, что в подавляющем большинстве случаев мы переписываемся, а не созваниваемся с другими людьми.

На то есть причины. Текст набрать легче и проще, это менее формальный способ общения, при котором чувствуешь себя раскованнее. Звонок же требует от нас определённого эмоционального напряжения, собранности. Иногда давления на собеседника. Мы живём в мире, где приходится планировать свои будущие звонки. Обычно мы звоним, когда есть какое-то срочное дело, ради которого стоит побеспокоить звонком. Причём зачастую это какое-то неприятное срочное дело. «Я не ждал звонка, что-то случилось?»

Фактически сейчас любой другой способ отправить сообщение является более предпочтительным, чем звонок. Помимо упомянутых SMS, почты и мессенджеров, есть ещё всевозможные социальные сети. Ещё никогда нам не было доступно такое разнообразие коммуникационных каналов, с их ненавязчивостью и широким выбором визуального выражения всевозможных эмоций. И это замечательно, ведь среди всего этого праздника жизни звонок является, пожалуй, худшим вариантом связи. Набрав чей-то номер, вы не знаете, занят ли сейчас абонент, а он не знает, зачем вы звоните, поэтому сам факт звонка заставляет его насторожиться, напрячься. Позвонив кому-то, мы каждый раз открываем ящик Шрёдингера, гадая, уместно ли сейчас вести беседу. Кроме того, звонки куда более эмоционально насыщены, поэтому нас так раздражают звонки в неурочное время или отрывающие от дел.

Стоит ответить на чей-то звонок, и беседа тут же лишается всех этих милых социальных нюансов, свойственных персональной переписке (хитрые подмигивания, застенчивые улыбки и т.д.), и оказывается наполненной бытовыми и бестолковыми расшаркиваниями: «Привет, как дела? Извини, плохая связь. Что говоришь? Не понял, повтори ещё раз. А, нет, это не я смеялся, это один из 193 940 людей, которые сейчас вокруг меня в этом месте. Извини, не расслышал? Да, пока». Худшая часть разговора, не несущая ничего полезного или хорошего.

Вот почему всё больше людей используют смартфоны для текстового общения, а не голосового. Swype-режим набора на экранной клавиатуре вкупе с автоматическим подбором слов делают неголосовые способы общения ещё более удобными и информативными. Какие-то из них хороши для общения с социумом, какие-то — для приватных бесед, но все они психологически комфортнее и тактичнее телефонного звонка.

Если же вам нужно услышать чей-то голос — своих родных, друзей или близких, — то вы обычно находите уединённое место для совершения звонка. И в этих случаях лучше пообщаться через видеочат, чтобы не только услышать, но и увидеть важного для вас человека.

Если же вы оказались где-то в людном месте, и вас охватило желание поделиться чем-то мимолётным, бессодержательными мыслями, просто достаньте смартфон, отправьте пару строк — и всё. Современные чат-интерфейсы позволяют нам постоянно существовать внутри потока информации от своих социальных связей.

Отсутствие необходимости внутренне мобилизоваться при неожиданном звонке делает общение более комфортным. Поэтому сегодня мы зачастую предваряем свой звонок текстовым сообщением «Тебе сейчас можно позвонить? Или когда лучше набрать?» Это стало уже не столько жестом вежливости, сколько необходимостью. Как метко подметил один человек:

«У каждого телефонного звонка есть жертва — тот, кому звонят. Вас всё время отвлекают от какого-то дела или занятия, когда звонят поболтать. Особенно невыносимы в этом плане водители, застрявшие в пробках и со скуки названивающие своим друзьям и знакомым.
…Когда я получаю текстовое предупреждение о звонке, то всегда этому радуюсь, даже ещё не прочитав сообщение. А когда мой телефон звонит неожиданно, я думаю: “Вот чёрт, кто там ещё?”»

***

Согласно исследовательскому агентству Nielsen, в 2007 году средняя продолжительность телефонных звонков достигла исторического максимума, затем быстро упала и стабилизировалась.

Мы свели время, проводимое с трубкой у уха, до минимально возможного, и теперь осталось лишь отказаться от этого совсем. Правда, в своё время то же самое пророчили книгам, газетам и электронной почте, радостно прогнозируя для них всевозможные периоды умирания. Но они всё ещё как-то умудряются выживать. Телефонные звонки также демонстрируют все признаки ухода в небытие. Может быть, пора проявить милосердие и всем дружно перестать звонить без крайней необходимости и отвечать на звонки?

Безусловно, функцию телефона в смартфоне нужно сохранить как раз на случаи разных экстренных и срочных ситуаций. Не будете же вы, убегая в ночном лесу от банды размалёванных клоунов-убийц, останавливаться, чтобы отправить друзьям паническую эсэмэску. Но, к счастью, в нашей жизни не так много ситуаций, требующих скорейшей связи с другими людьми. Так не лучше ли, оберегая друг друга от ненужных тревог и неудобств, перейти на текстовое общение?

А вы не замечали в себе пусть и небольшого, но напряжения, когда звоните кому-либо или когда вам неожиданно звонят? Часто ли вы принимаете выбираете вместо звонка SMS или сообщение в мессенджере, если дело не срочное?

Голосовая почта как «честный» способ взять деньги

Если оператор не нашел своего абонента — то он не заработал на входящем звонке денег. Телеком-операторы, как и любые коммерческие организации, деньги зарабатывать любят, поэтому была придумана гениальная «голосовая почта». Фраза «оставьте сообщение после сигнала» дает принимающему оператору возможность «принять» звонок даже когда абонент не доступен. Честно куда-нибудь записать 20 секунд тишины и, главное, взять за это деньги со звонящего оператора. Самые хитрые даже не ждут «пииип» и сразу принимают звонок — чего деньги терять?

Как подключить опции

Способы подключения представлены в таблице:

Вид голосовой почтыКоманда для отправки запросаПодключение через СМС уведомление на номер 111
Базовая*111*2919#Отправьте текст 2919
Стандартная*111*90#Текст «90» пробел и цифра «1»
Плюс*111*900#Напишите текст 90, «пробел» и «9»

Процедуру активации можно произвести в личном кабинете.

Что человеку никак — то роботу беда-печалька

Абонентам сотовой связи голосовая почта, как правило, никак. Лично для меня нет разницы, будет в трубке сказано «абонент временно недоступен» или «абонент временно недоступен, оставьте ваше сообщение после сигнала». Я, как и все мои знакомые, повешу трубку на слове «недоступен». А какие копейки при этом один оператор заплатит другому за такой звонок — мне не очень интересно.
Совсем другое дело, если я Voximplant и на базе нашей платформы делается автоматическое подтверждение заказа в интернет-магазине. Early media у нас так же бесплатны, а вот за голосовую почту деньги будут уходить со счета клиента по расценкам того оператора, на телефон которого совершался звонок. Сумма сама по себе маленькая, но умножаем на тысячи или десятки тысяч звонков в день — и уже не такая маленькая.

А ведь автоматика не ограничивается «позвонить после того, как покупатель нажал кнопку „купить“ на веб странице ритейлера и предложить нажать единичку или сказать „подтверждаю“, чтобы подтвердить заказ». Есть автоматические нотификации о, например, билете на концерт. Статистика показывает, что абоненту был звонок и он прослушал сообщение — а на самом деле сообщение «прослушала» голосовая почта. Или еще хуже: автоматика обзванивает клиентов чтобы, к примеру, обсудить условия заказанной уборки дома. Клиенту она синтезирует «привет, это робот такой-то компании, звоню по поводу заказанной уборки, соединяю с оператором», оператору синтезирует «дозвонились до такого-то клиента» и показывает карточку заказа в CRM, а дальше оператор 20 секунд разговаривает с тишиной в голосовой почте.

Что такое VoLTE

Выходом из сложившейся ситуации обещает стать новый продукт на отечественном рынке коммуникаций – Voice over LTE («голос поверх LTE»), сокращенно – VoLTE. Внедрение данного формата связи устраняет дилемму: чтобы осуществить звонок, нет нужды переходить в 2G/3G – все происходит прямо на частоте LTE. То есть, голосовая связь осуществляется через высокоскоростной интернет LTE (4G), подобно тому, как это делается в Skype или Viber. Некоторым будет понятнее аналогия с протоколом IP-телефонии SIP.

Это позволяет оставаться в сети 4G даже во время разговора, так как голосовой трафик передаётся теперь в цифровом виде наряду с остальными получаемыми-передаваемыми данными (фото, видео, web-страницы).


Первые попытки определить голосовую почту

Автоматикой телефонных и видеозвонков мы занимаемся давно, так что задачу определять голосовую почту начали решать несколько лет назад. Что общего у всех голосовых почт? У них у всех есть «пи-и-и-и-и», которое между «оставьте ваше сообщение после сигнала» и переводом звонка из «early media» в «accepted». Плохая новость — «п-и-и-и-и» у всех разное. Один гудок, несколько, на одной частоте, на двух, разной длительности и частоты. Более того — операторы любят этот «пи-и-и-и-и» время от времени менять. Интересно, зачем?..
Первая наша реализация использовала Алгоритм Гёрцеля для вычисления «несущей» частоты и эвристику, чтобы по появлению частоты в аудиопотоке распознать звуковой сигнал голосовой почты. Увы, этот метод, хотя и работал, обладал серьезными недостатками. Если оператор менял паттерн звукового сигнала — то эвристика «ломалась» и нам нужно было вручную ее обновлять под новое «пиу-пиу-пи-пи-пи». Гораздо хуже были ложные срабатывания: «хитрые» сигналы сразу на двух частотах были трудно отличимы от человеческого голоса и показывали голосовую почту там, где на самом деле отвечал живой человек. Клиенты хотели надежности.

Как прослушать голосовое сообщение на телефоне

Прослушать её можно вышеописанными путями. Если почта есть, то по номеру она автоматически включится, также назовется имя абонента, который её прислал. Через личный кабинет можно нажать на значок «Вкл», чтобы активировать прослушивание.

Также через рассылку можно нажать на ссылку, которая прикрепляется в СМС, и при помощи интернет – подключения прослушать информацию.

Deep Learning. Везде Deep Learning

Потерпев неудачу с обычной математикой, мы решили, что надо попробовать перемножать матрицы. Ведь это не просто математика, а Deep Learning и Artificial Intelligence! Был установлен TensorFlow и закипела работа: записи разговоров и голосовых почт скармливались разным моделям в надежде, что они найдут невидимые нам паттерны: характерные временные задержки, ровная интонация, определенный набор слов, всё вот это. Первая же проблема случилась с данными: даже несколько секунд голоса с «телефонной» частотой в 8 килогерц — это десятки тысяч значений. А чем сложнее данные, на которых мы обучаем нейросеть, тем больше этих данных нужно для адекватного результата. Чтобы обучить нейросеть на «сырых» данных, нам бы потребовались размеченные записи миллионов
звонков.

Поэтому данные нужно было обработать. Мы подключили к Python специфичные телеком-библиотеки, написанные на С/C++ и реализующие логику работы с голосом: шумоподавление, эхоподавление, выделение несущей и многие другие. После обработки запись превращалась в набор параметров, на которых уже обучалась нейросеть.

Результат сразу стал гораздо веселее, и следующие полгода мы играли в IT-алхимиков: подбирали модель, варианты обработки входных данных и результатов применения модели, чтобы в результате по нескольким секундам записи определять голосовую почту. Результат получился очень хорошим — теперь достаточно безэмоционально начать разговор с фразы «Абонент временно недоступен», чтобы получить нотификацию о том, что скорее всего на другой стороне трубки голосовая почта. А что дальше делать с полученной информацией каждый клиент решает сам в облачном JavaScript. Для программиста использование детектора выглядит вот так:

Варианты работы автоответчика МТС

После того как мы разобрались с тем, что означает «Вас приветствует автоответчик МТС» при звонке. Перечислим также три основные формы реализации голосовой почты у мобильного оператора МТС. Они следующие:

  • Голосовая почта (базовая) – популярная бесплатная форма. Оставленные звонящим сообщения хранятся в течение одних суток, длительность оставленного сообщения не может превышать 1 минуты. Вы можете оставить не более 15 голосовых сообщений в течение суток;

Подключение услуги выполняется с помощью команды *111*2919#; или с помощью смс 2919 на номер 111. Также вы можете подключить услугу через ваш личный кабинет на сайте МТС (раздел «Управление услугами») или соответствующее мобильное приложение (Услуги – Платные).

Отключение услуги выполняется с помощью команды *111*2919*0#, или смс 29190 на номер 111, а также с помощью личного кабинета и мобильного приложения.

  • Голосовая почта – более продвинутый платный аналог, за пользование которым ежесуточно списывается 2,3 рубля. Включает в себя возможность хранения полученных голосовых сообщений на протяжении 7 дней (не прослушанных) и 10 дней (прослушанных), максимальная длительность записи – 1,5 минуты. А максимальное количество оставленных сообщений для абонента в сутки может составлять 20 записей. Приятным бонусом здесь является замена шаблонного приветствия на ваше личное приветствие, которые вы сможете записать самостоятельно, позвонив на номер 086. Также вы получаете доступ к вашей почте с помощью веб, ММС, и электронного ящика;

Подключение услуги выполняется с помощью команды *111*90#, или смс 901 на номер 111, через личный кабинет или с помощью мобильного приложения (Услуги — Платные). При этом ваш почтовый ящик получит код доступа, позволяющий сохранять конфиденциальность записей. Прослушать полученные сообщения можно будет по упомянутому выше телефону 0860.

Описание опции «Голосовые сообщения»

Часто вызывающий абонент не может ответить на звонок на работе или за рулем. Также смартфон может разрядиться или потерять сеть. Чтобы не пропустить важные звонки, операторы предлагают своим абонентам функцию голосовых сообщений, которая работает по тому же принципу, что и старый автоответчик.
После базовой настройки все вызовы, прерванные или не принятые абонентом по независящим от него причинам, будут перенаправлены в специальную службу, которая приветствует вызывающего абонента и предлагает оставить короткое голосовое сообщение. После этого вы можете прослушать его и заранее ознакомиться с целью звонка, прежде чем сделать обратный звонок.

Виды устройств

VoIP-шлюзы могут обладать различным количеством портов, емкостью линий и отличаться конструкцией (настольные, настенные, стоечные, со встроенным или внешним блоком питания). По типу разъемов устройства можно разделить на три группы.

Аналоговые шлюзы посредством порта FXS, работают как адаптеры, к которым подключаются телефонные аппараты и преобразовывают цифровой сигнал в аналоговый. В другой порт, FXO, подключаются обычные телефонные линии из городской телефонной сети, что обеспечивает коммутацию вызовов с телефонной сети общего пользования на телефоны IP-сети. Емкость аналоговых VoIP-шлюзов от 2 до 24 линий. В случае нехватки портов используют гибридные модели, в которых аналоговая линия подключается в FXO, а порт АТС — в FXS. Данные устройства широко используются за счет своей универсальности, компактности и простоты эксплуатации.

Цифровые шлюзы предназначены для подключения одной и более цифровых линий ISDN, E1, T1 к виртуальной АТС или в разрыв между городской телефонной сетью и офисной АТС емкостью от 50 линий.

GSM SIP-шлюзы — это устройства со слотами для SIM-карт, которые позволяют подключать мобильные телефоны к АТС и IP-сети.

Рейтинг
( 1 оценка, среднее 4 из 5 )
Понравилась статья? Поделиться с друзьями:
Для любых предложений по сайту: [email protected]