Привет! Я Александр Коробков, CEO и сооснователь Macroscop, вендора ПО для интеллектуального видеонаблюдения. В прошлом разработчик, и по-прежнему принимаю непосредственное участие в развитии наших продуктов. Недавно мы представили миру ЕВУ - нового Виртуального Ассистента в уже достаточно большом “отряде” существующих, но первого в сфере видеонаблюдения.
У многих (ладно, почти у всех) возникает законный вопрос: “Зачем?”, ведь, казалось бы, история для нас не вполне трендовая, мы же не банк, не Яндекс и не сервисная компания. В чём наша цель? Зачем ЕВА нашим пользователям? Каково её будущее? Поговорю на эту тему со своим Персональным, Оочень Критически настроенным Оппонентом (сокращенно ПОКО, не тролльте), виртуальным, конечно.
Поехали!
ПОКО: Так, еще один голосовой помощник. ЗАЧЕМ?!
Верю, что за Ассистентами будущее. Это субъективно конечно, но есть объективный тренд: популярность голосовых помощников растёт. PWC еще 3 года назад оценили, что в США более чем 90% людей знают о голосовых помощниках, более 60% пользуются ими и у 30% они стали частью повседневной жизни. Уже многомиллиардный рынок удваивается каждые 2-3 года. Amazon обеспечил доступом к Alexa более чем 100 млн устройств и это число ежегодно удваивается, а про ассистенты на мобильных устройствах уж и говорить нечего, там количество пользователей - миллиарды прямо сейчас.
ПОКО: Ок, но голосовые помощники - для частников, нужны чтобы включить свет в доме, завести будильник или рассказать анекдот. Вы то здесь при чём?
Это правда, персональные ассистенты Siri, Google Assistant, Cortana, Alexa, Алиса действительно в основном помогают людям не пропустить встречу, узнать когда кончится дождь, включить музыку, найти что-то в интернете, а у банков или телекомов ассистенты призваны заменить колл-центры для оптимизации персонального сервиса. Согласно исследованиям паттернов применения голосовых помощников, ¾ пользователей вообще применяют их сейчас исключительно дома.
Вместе с тем, компания Gartner предсказывает, что уже в ближайшие годы каждый четвертый сотрудник ИТ компаний или компаний использующих ИТ продукты будет пользоваться помимо VPA (Virtual Personal Assistant) и VCA (Virtual Customer Assistant) так называемыми VEA (Virtual Employee Assistant). Уже есть такой продукт как Amazon Alexa For Business, который призван повышать продуктивность на рабочем месте. И я жду не дождусь, когда я смогу с помощью ЕВЫ бронировать переговорки в собственном офисе и просить уведомить, когда Александр Петрович вернётся с обеда.
ПОКО: Голосовые сервисы для помощи бизнесу - понятная история. Но при чём здесь видеонаблюдение, контроль, безопасность? Где специалист по безопасности и где ЕВА?
Задача голосового помощника - понять запрос человека и дать релевантный ответ. Основным источником информации для него будет интернет и различные веб-сервисы. Вместе с тем внушительным источником информации являются также естественные данные, видео и аудио, воспринимаемые глазами или видеокамерами. Исторически сложилось, что подавляющее большинство установленных и устанавливаемых сейчас видеокамер применяются прежде всего для решения задач контроля и безопасности с помощью VMS (Video Management Software), неважно On-Premise или облачного базирования. Соответственно, именно VMS сейчас, как правило, входная точка в том числе и для сервисов повышения эффективности бизнеса. И для того и для другого зачастую чаще всего используются одни и те же камеры!
При этом, сфера видеонаблюдения изначально была “на передовой” в части применения ИИ для компонентов видеоаналитики и накопила необходимые компетенции для извлечения из естественных данных важной информации - контекста. И прямо сейчас, с развитием технологий, появлением сверточных нейросетей, снижением стоимости оборудования, снижением порога входа для разработчиков, глубина распознаваемого контекста стремительно повышается! С каждым годом, “камеры” всё больше и больше будут понимать ЧТО ИМЕННО происходит в их поле зрения, и всё меньше и меньше будет нужна для этого помощь человека. Камеры помогут найти свободное место на парковке, менее загруженную кассу в гипермаркете, поймут, что человеку на улице стало плохо и надо вызвать помощь, подскажут, помогут за секунду забронировать свободную переговорку (больная тема).
ПОКО: Не убедили. Ваши пользователи - профессионалы и узкие специалисты систем безопасности, им ваша ЕВА - до лампочки. Они гораздо быстрее выполнят свою задачу мышкой и клавиатурой пусть в “навороченном”, но понятном для них интерфейсе.
Мы ни в коем случае не отказываемся от своего текущего интерфейса, который, кстати, по отзывам наших пользователей в высокой степени дружелюбный, и дальше будем его развивать. Но, опять таки, тренды. Практика показывает, что простые и дружелюбные продукты с минималистичными интерфейсами постепенно повышают свою долю по сравнению со сложными. Приведу примеры. Поисковая строка Google заменила многим в том числе профессиональным пользователям сложные каталоги и индексы. iPhone с одной кнопкой (сейчас уже без кнопок) вытеснил с рынка в том числе нацеленные на профессионалов продукты типа BlackBerry. Да, есть сферы, которые в меньшей степени затронуты данным трендом, например, проектировщики самолётов и атомных станций продолжат работать в сложных “навороченных” САПР.
Моё видение, что даже самые “серьёзные” специалисты будут со временем видеть в ЕВЕ персонального ассистента, помощника, который всегда с собой, и который позволит быстро решать его задачи.
Скажу больше, рынок сильно меняется, границы размываются. Сейчас уже нельзя точно сказать где заканчивается рынок систем безопасности и начинается рынок IT. Решения из сферы безопасности активно занимают ниши на поприще повышения эффективности бизнеса, достаточно взглянуть на ритейл и применение систем видеонаблюдения для подсчета посетителей, определения пустых мест на полках, маршрутов посетителей, сигнализирования, что пора открыть новую кассу, когда очереди увеличиваются. Уже сейчас появляются системы, которые с помощью распознавания эмоций отслеживают удовлетворенность сервисом, а также определяют как быстро консультант подходит к клиенту. Происходит конвергенция рынков, портрет пользователя расширяется. Среди наших пользователей становится всё больше тех, для которых “навороченный” интерфейс неудобен, им нужна, как говорится, одна кнопка.
ПОКО: Ваша ЕВА - прикольная, но мало что может. И вообще непонятно, где её применять? Лучше бы сделали голосового помощника для управления видеостеной или помощника по настройке.
Пока мало что может, это так. На выставке Securika Moscow 2021, где мы презентовали ЕВУ, самый распространённый отклик был: “Круто! А как её применять?”. На данный момент мы реализовали самые базовые кейсы, которые как нам кажется, хорошо демонстрируют её суть: совмещение упрощения интерфейса и ориентации на кейсы. Тот же пример с переговорками (опять больная тема), узнать где Вася Пупкин, найти где он последний раз был в поле зрения камер, уведомить когда придёт или добавить нового человека в базу. При этом мы рассматриваем ЕВУ - как инструмент, ориентированный на простоту и на кейсы, как платформу для реализации конкретных решений, наборов кейсов, упрощающих жизнь или работу той или иной категории пользователей, аудитории. Создание таких узких решений - наша текущая задача.
Голосовой интерфейс для упрощения управлением видеостеной можно сделать, и не исключено, что мы это сделаем. Но мы видим в ЕВУ больше чем просто помощник по интерфейсу. ЕВА - транслятор конечной ценности системы для пользователя. Давайте же посмотрим, что это за ценность и кому она предоставлялась раньше, сейчас и в будущем.
В прошлом, до 90-х и начала нулевых, основная ценность системы видеонаблюдения - возможность наблюдать из одного места (поста охраны) за многими, а также возможность расследовать происшествие с помощью видеоархива. Аудитория - охранники, специалисты службы безопасности.
С появлением видеоаналитики VMS эволюционировали, появились интеллектуальные детекторы, генерирующие события, журнал событий, а также инструменты для ускорения поиска нужного фрагмента в архиве. Ценности остались те же самые, аудитория та же самая, но ей стало проще решать свои задачи.
Прямо сейчас начинается новый виток эволюции, VMS превращаются из поставщика видеоданных и событий в инструмент для решения задач повышения эффективности бизнеса прямо в реальном времени. Польза генерируется не в момент, когда происходит какое-то происшествие, требующего расследования, а прямо сейчас в реальном времени. Система распознала сотрудника/жильца и открыла ему дверь, система обнаружила нового посетителя в магазине и подала сигнал консультанту, система обнаружила, что в очереди уже 5 человек, а значит пора открывать новую кассу. Появилась новая “ценность” и новая аудитория. Мы видим ЕВУ как один из инструментов доставки ценности до конечного пользователя, а не просто голосовой интерфейс для функций VMS. Спросите ЕВУ сколько посетителей было в вашем магазине, попросите уведомить, если продавец будет больше положенного отсутствовать на рабочем месте, кто эффективнее всех разговаривает с покупателями, когда наконец освободится злополучная переговорка?
А теперь давайте чуть помечтаем и представим будущее на горизонте может быть 3-5-10 лет. С увеличением глубины контекста распознавания, а это происходит прямо на глазах, ЕВА будет становиться умнее и умнее и в какой-то момент превратится из забавной игрушки в полноценного ассистента, помощника, которому можно доверять, который понимает что вы от неё хотите, и решает для вас конкретные задачи. Ценность - повышение рентабельности бизнеса, аудитория - владельцы бизнеса, менеджмент, специалисты самых разных сфер.
ПОКО: Ладно. Но я не понимаю вашего энтузиазма. Не так давно вы сделали чатботов в мессенджерах, а теперь всего лишь добавили еще один интерфейс - голосовой, и здравствуй ЕВА. Что тут такого то?
Логически да, это так, ЕВА - голосовой интерфейс для системы, продолжение истории с мессенджерами, шаг на следующий уровень. Кстати, ЕВА не противопоставляется чатботам, а дополняет их, часть действий, когда удобно можно выполнять “тапами”. Но, как показывает практика, наличие возможности дать команду или задать вопрос голосом, причём вариативно, разными способами, ценно для пользователей.
Но самое важное, голосовой интерфейс с “лицом” делает продукт как бы антропоморфным, человеческим. Мы стремимся сделать ЕВУ не просто автоматическим роботом, а роботом с характером, эмоциями. Мы в каком-то смысле вкладываем таким образом в продукт самих себя, свою душу в стремлении сделать пользовательский опыт еще более приятным. В том числе она может шутить, поздравлять вас с Днём рождения, а то и спросит, чего это вы такой хмурый сегодня. Мы социальны, признаем это, а раз уж мы, волей прогресса, всё больше общаемся с девайсами и программами, пусть хотя бы они становятся более человеческими.
ПОКО: Кажется, на рынке, особенно международном, помимо Macroscop есть не менее сильные бренды. То, что они до сих пор не сделали голосовых помощников должно означать, что это не нужно вашей отрасли.
Не соглашусь. Наш лозунг - “Как вам удобно”. Мы осознали, что позитивный пользовательский опыт - то, что у нас неплохо получается и поставили это во главу своего позиционирования. А именно, предоставлять самые современные сложные технологии в простой минималистичной “обёртке”, примерно, как это делает строка Google. В этом смысле появление голосового помощника впервые именно у нас - логично и закономерно.
Термин “Видеонаблюдение” устаревает, в будущем “наблюдать” будут интеллектуальные агенты. Наша задумка - сделать из ЕВЫ именно такого агента, ассистента, секретаря, который сам посмотрит всё видео, сопоставит с другими данными и даст вам уже приготовленную информацию, а не полуфабрикаты.
Презентуя ЕВУ на Securika Moscow 2021, мы написали на своих футболках “Видеонаблюдение без наблюдения”, демонстрируя скорее не свершившийся переход, а уверенный шаг в его сторону. Шаг, безусловно, неочевидный, спорный, рискованный, но от того ещё более драйвовый, заряжающий нас энергией, и уж точно избавляющий от скуки.