Итак, что же такое разговорный ИИ сегодня? Это не только набор из синтеза и распознавания речи, а обширная система управления диалогом. Реализовать короткий диалог продажи (до 5-6 вопросов, например, предложение оформления кредитной карты) можно уже сегодня, но что-то большее, чем оформить подобного рода заявку - нет.
Сейчас по нашей статистике после 3-4 вопросов вероятность успешного завершения диалога падает с каждым новым вопросом на 10%. На то есть несколько причин:
* Если представиться роботом - вы в проигрыше. Как и для любой технологии, к её принятию большей частью людей требуется время. У большинства же населения присутствует некоторое отторжение (“вот ты тупая”, “это что, опять робот?”, “дайте мне человека, что за ноу-хау!”)
* Если представиться человеком и человек в ходе поймет, что это робот - вы ещё в большем проигрыше. Люди начинают чувствовать себя обманутыми (это сложно объяснить, это можно услышать по их тону в ходе разговора).
* Продажи это широкая по контексту сфера. Сменить диалог, рассказать шутку, где-то сыграть интонацией помягче или пожестче. Довольно много составляющих, чтобы их учесть. Даже с той же Алисой на обобщенные темы общаться тяжело - слишком часто она заходит в тупик.
* Молодость рынка и отсутствие большого опыта Voice Experience - опыта построения диалогов с учётом как людей, так и робота.
В процессе разговора ведение диалога усложняется из-за невербальных голосовых интонаций и “мусорной” со стороны вербальной составляющей (но необходимой для понимания хода диалога!) информации - будь то “аааа”, “эммммм”, “нууууу”, "да нет" и тому подобное. Однако менеджеры по продажам знают, насколько важно чувствовать невербальную составляющую по ходу диалога.
Даже машинное обучение тут не сильно поможет - в таком случае для каждого конкретного скрипта необходимое большое количество данных. А по завершению обучению такого кейса систему для новых вопросов и обработки возражений необходимо переобучать - эдакий вечный цикл.
Однако я всё же вижу возможность появления подобных решений. Какие же условия помогут им появиться? Во-первых, накопленный опыт голосовой экспертизы на рынке (правила к построению голосовых диалоговых систем), во-вторых, исчезновение барьера у пользователей к восприятию голосового ИИ. При всём этом, самый жизнеспособный подход будет гибрид робота и оператора. Именно в эту стороны и двигаются наиболее перспективные и оцененные на венчурном рынке стартапы голосового ИИ: Voca, Observe.AI - всё они анализируют ход диалога и по его ходу либо подсказывают оператору, либо подключают его к работе (за счёт технологий подстройки под голос другого человека, что к примеру делает стартап Respeecher). Над аналогичной концепцией также работаем и мы в VoxiAI, поскольку с запросами на голосового помощника для продаж компании обращаются чаще всего.
Вердикт: на горизонте 3-5 лет увидим голосовые системы, где будет размыта граница между живым оператором и голосовым помощником, что и позволит контролировать ведение даже сложной продажи и успешное её закрытие.