Популярность голосовых интерфейсов как бы плывёт по волнам: то это прорывная технология, то пустое баловство, то снова удобная и полезная вещь. Помните, какой хайп был вокруг появления Siri? А теперь посмотрите на своих знакомых с iPhone и попробуйте найти тех, кто активно пользуется голосовыми командами.
Зато на слуху умные колонки со встроенными голосовыми ассистентами: Алиса, Маруся, Alexa и другие. Делают вроде всё то же самое, что помощники в телефоне, но при этом лучше вписываются в цифровое окружение современного горожанина. Но действительно ли они полезны? Что могут предложить сегодня, кроме ответов про погоду и быстрого поиска в сети?
🤔 Как они работают и откуда взялись
Когда вы произносите запрос, гаджет «слышит» только звуковые волны. Чтобы интерпретировать их в понятную для работы информацию, используются технологии синтеза и распознавания речи. Для начала из звукового сигнала убирается шумовой фон и помехи. Далее идёт оцифровка данных и разбиение их на отдельные фрагменты для дальнейшего разбора и сравнения с имеющейся базой. На финальной стадии система анализирует собранные вероятности и выдаёт декодированный результат с учётом языковых особенностей. При этом плохо распознанные слова восстанавливаются по смыслу с применением собранной статистики.
Если после обработки запроса голосовой помощник все равно не понимает команду, он просит перефразировать вопрос или указать дополнительные данные. Нейросети, которые помогают в этом процессе и постоянно обучают помощника, позволяют правильно распознать речь даже с акцентом с вероятностью более 90%! Но так было не всегда.
Если аппарат советского физика Льва Мясникова в 1939 году «понимал» только несколько гласных и согласных, а механизм лаборатории Bell в 1952 году мог опознать на слух числа от 1 до 9, то уже в 1962 году благодаря технологии Shoebox, представленной компанией IBM, можно было распознать 16 английских слов, 10 цифр и 6 арифметических команд. К 80-м годам голосовые системы научились определять до 1000 слов, при этом точность распознавания достигла 80–90 %.
В XXI веке в гонку создания речевых технологий вступили цифровые гиганты Microsoft, Google и Apple. Так в 2001 году компания Microsoft добавила голосовой ввод текста в офисный пакет Office XP, а в 2002 году Google запустила Voice Search — сервис для голосового поиска в интернете. В 2007 год исследовательский центр SRI International начал разработку Siri, ставшей первой голосовой помощницей. На тот момент она умела искать информацию в сети, работать как голосовое меню и вести простой диалог с пользователем. В 2010 году технология была выкуплена компанией Apple.
Следующее десятилетие ознаменовалось появлением целого ряда голосовых ассистентов. В 2011–2014 годы Google интегрировала функцию голосового поиска в свой браузер Chrome и запустила персонализированного ассистента Google Now, который мог подобрать нужную информацию, учитывая местоположение пользователя, историю его браузера и поисковых запросов. Позже именно этот сервис перерос в самый распространённый на данный момент голосовой помощник Google Assistant (Google Ассистент). В 2012 году появился S Voice от Samsung. В 2014 году Microsoft представила голосовую помощницу Cortana.
И пока пользователи смартфонов осваивали общение с Siri, Google Assistant и другими голосовыми помощниками, началась разработка голосовых помощников и для умного дома.
В 2014 году Amazon выпустила первую в мире умную колонку Amazon Echo с голосовым ассистентом Alexa (Алекса). В 2016 году Google представила своего помощника для умного дома Google Home. В 2017 году появился голосовой помощник AliGenie от Alibaba, «живущий» в смарт-колонке Tmall Genie. Также в 2017 Samsung анонсировала своего помощника Bixby, а в 2018 году на этот рынок вышла и Apple, представив Apple HomePod. Тот же год ознаменовался запуском умной колонки «Яндекс.Станция» с Алисой. Тогда же Xiaomi представила своего голосового ассистента Xiao AI, который совместим как со смартфонами фирмы, так и множеством гаджетов для умного дома. В 2019 году ряды голосовых помощников пополнились Олегом от банка «Тинькофф» и Марусей от Mail.Ru Group.
Их уже так много, что легко запутаться. Но нам интересны больше всего те, что хорошо работают с русским языком и доступны на большом количестве устройств.
📌 Google Assistant
На данный момент считается наиболее востребованным голосовым помощником. В смартфонах на Android и умных часах на Wear OS он заменил более раннюю версию голосового интерфейса Google Now. Также доступен в качестве приложения для iPhone и iPad.
Ассистент вызывается фразой «OK, Google». С его помощью вы можете открыть любой сайт, отправить сообщения в WhatsApp и другие мессенджеры, найти кафе и построить до него маршрут на карте, узнать прогноз погоды, послушать музыку, запланировать события в календаре, составить список покупок, прочитать вслух рецепты и узнать новости.
Google Ассистент также взаимодействует с устройствами умного дома многих популярных брендов, о чём на их упаковке говорит логотип «Работает с Google Assistant». После подключения к таким устройствам вы сможете управлять ими голосовыми командами включать свет, руководить работой пылесоса, термостата, кондиционера, духовки и других смарт-устройств. При этом главным минусом Google ассистента является отсутствие интеграции с соцсетями и электронной почтой. Но здесь надо понимать ориентацию технологии на североамериканский рынок. Там к ней подключено больше сервисов, и заказать билеты или пиццу на дом — не проблема.
📌 Siri
Первый настоящий виртуальный помощник, а не просто интерфейс для простых голосовых команд. Изначально программа разрабатывалась под Android и BlackBerry, но после покупки Стивом Джобсом, она работает исключительно с устройствами Apple и является неотъемлемой их частью.
Для того чтобы активировать голосового помощника, необходимо произнести фразу «Привет, Siri». Она умеет делать поисковые запросы, управлять настройками смартфона, работать с картой и навигатором, отправлять голосовые сообщения по надиктованному номеру телефона или e-mail, делать звонки. Также Siri может запускать удалённо приложения, в том числе и управляющие системами «умного дома»: включать свет, телевизор, регулировать работу приборов климат-контроля. Очевидным недостатком Siri является совместимость исключительно с iOS-устройствами.
📌 Алиса
Изначально программа разрабатывалась для гаджетов с приложениями Android и iOS. Но позже появились фирменные колонки «Яндекс.Станция» , а также детские умные часы и другая техника с Алисой.
Алису достаточно позвать по имени. В её возможности входит включение музыки и видео, установка будильника, напоминаний, чтение текста, распознавание QR-кодов, взаимодействие с другими Яндекс-сервисами. Голосовой помощник может неплохо поддержать беседу, помочь составить список покупок или даже стать вашим фитнесс-тренером. Также Алиса знает много различных игр и сказок, что делает её просто незаменимой при взаимодействии с детской аудиторией.
Алиса также умеет взаимодействовать с системами умного дома. В России, возможно, наиболее активно развивающийся голосовой ассистент. Естественно, он привязан к сервисам и подпискам «Яндекса».
Одинаковые❓
Действительно, основной набор команд у помощников похож. И это неудивительно, наиболее популярные функции разработчики копируют друг у друга. Основным фактором разграничения является совместимость и интегрированность в цифровые экосистемы. Так наиболее функциональным помощником для устройств Apple всегда будет Siri, а для развлечения детей можно установить Алису как отдельное приложение. На Android-смартфонах только Google Ассистента можно вызвать голосом, когда смартфон выключен, и это очень удобно, если заняты руки. В свою очередь, интерфейсы популярных «Яндекс.Станций» построены исключительно вокруг Алисы и фирменных сервисов, других помощников там не предполагается.
Популярная техника для умного дома, как правило, обязательно работает с Google Assistant и Siri. Для официально продаваемых в России устройств стараются добавить поддержку Алисы и Маруси.
Что дальше
Сегодня кажется, что наиболее удачное применение ассистенты нашли в домашних системах управления приборами и мультимедиа. На смартфоне по-прежнему в большинстве случаев быстрее сделать всё пальцами, да и не хочется рассказывать всем окружающим, что завтра в календаре стоит визит к психотерапевту или гинекологу. Но это сегодня.
Кто знает, возможно, лет 5 или 10 хватит для того, чтобы естественное общение с виртуальными личностями стало таким же бесшовным и захватывающим, как в фильме «Она» с Хоакином Фениксом. Кстати, посмотрите, если пропустили.
Подписывайтесь на наш канал. Рассказываем о гаджетах и технологиях.
Ещё статьи о гаджетах:
🔴 Топовые прошлогодние смартфоны, которые надо покупать сейчас
🔴 Как посмотреть фото и видео со смартфона на телевизоре? Пошаговая инструкция
🔴 Как сделать из обычной квартиры умную? Гаджеты и предметы, с которыми можно автоматизировать быт