Найти тему

Цифровые помощники в реальности

Оглавление

Ну вот дошли руки написать о цифровых помощниках. Все наверное слышали про Apple Siry, Amazon Alexa, Microsoft Cortana, Алису Яндекс и Google Now (он же Assistant). Легко заметить что в списке из гигантов цифрового будущего нет только FaceBook, но это временное явление - они уже объявили об интеграции с Alexa (ну не с прямыми же конкурентами им интегрироваться). На путь интеграции встал и китайский гигант Xiaomi. Но интегрируется он с Google. В свою умную колонку - центр управления умным домом - он встроил Google Assistant, причем синхронно с Google дополняет ее сенсорным экраном вроде планшета.

В реальности мой опыт ограничивается Алисой и Ассистентом, как реально работающими на русском языке. Пробовал конечно и на английском но в реальности работать на английском нельзя - запомнить командные слова не трудно, но помощник ничего не сможет прочитать на русском, например я говорю "my today's shedule" и в ответ получаю полную ерунду вместо "Первая встреча у вас с Александром в офисе".

Алисой я на практике тоже не пользуюсь, как уже писал у меня календари и задачи по проектам лежат в Google, Яндекс пока ни с одним приличным инструментом календарей и проектов не интегрируется, к сожалению. Да и на музыку я подписан в Google. Надеюсь Яндекс будет развиваться быстрее и я со временем мигрирую в него. Так что дальше все про Google Assistant, которого я для кратности будут называть OKG (от слов "OK Google" по которым он вызывается).

Для начала на кого похож помощник. На секретаря 19-го века. Он всегда тут, готов помочь с чем угодно от организации дня до покупки билетов в театр и на самолет, заказа пиццы и прочего. Это я понял не сразу и стеснялся поначалу с ним разговаривать. Потом внезапно почувствовал себя помещиком, приходящим домой с охоты и громка кричащем в прихожей - "Степан, водки!".

Однако к делу. Сначала просто опишу свой день.

Мой день

Утро я начинаю с зарядки. Поэтому говорю

"OKG, поставь музыку для занятия спортом" или что-то конкретнее вроде "Mango Jerry".

Не надо запоминать команды, не стесняйтесь пробовать, он хоть и дурак но понятливый и старательный

OKG включает музыку, делаю зарядку. Можно еще сказать ему "OKG, начни гимнастику" и он запустит фитнесс приложение и будет учитывать время как время гимнастики до команды "OKG, закончили гимнастику".

Потом душ и завтрак. За завтраком говорю просто "OKG мой день" и он сообщает мне погоду сейчас, время доставки тушки до работы привычным маршрутом, диктует напоминания из календаря, все по русски. Дослушав, говорю "OKG, мой график на сегодня". Он выводит на экран полное содержание календаря на сегодня, заставить его зачитывать это вслух я еще не умею. Или он не умеет )))

По пути я слушаю музыку таким же порядком, в метро говорю "OKG, включи Euronews" и смотрю новости пока еду. Ну и так далее.

Среди дня говорю "Пошли Whatsapp Паше Заедешь к нам сегодня вопросительный знак", и всякое такое прочее. Регулярно спрашиваю его типа "OKG что такое Hellowin" или "Когда родился Владимир Святой". Даже разок сказал "OKG, включи фонарик". Включил. А потом выключил.

Советы, рожденные практикой:

1) Не стесняйтесь, вспоминайте картинку со Степаном, говорите свободно, не старайтесь как у логопеда, он со временем привыкнет к вашей речи и будет разбирать с высокой скоростью и надежностью 100%. Параллельно с русским можете вставлять английские слова, названия и даже фразы - разберет.

2) Говорите не глядя на экран смартфона. Экран отстает. Короткий узнаваемый звук скажет вам что он готов принять команду. Сразу говорите как бог на душу положит, вы же не мучались бы с формулировками Степану :)

3) Не думайте что он умеет то что умеет и ничего больше. Многие команды я говорил просто случайно и он срабатывал, бывало и думал а попробую голосом - и получалось. Кроме того он постоянно учится.

4) Вообще больше пользуйтесь голосовым вводом, сейчас значок микрофона присутствует на клавиатуре почти в обязательном порядке, распознавание происходит очень точно, моментально и не связано с обращением на сервера через интернет, все локально. Поверьте, гораздо проще сказать "OKG Мой день" чем разблокировать смартфон, тыкать в иконку, листать и читать. И уж на несравненно проще сказать "OKG, напомни дома подобрать концерт в филармонии на ноябрь" чем делать все тоже самое даже на компе а не в в смартфоне.

Есть еще два абзаца - хороший и плохой. Начнем с засад, чтобы закончить на оптимистичной ноте.

Засады

Все это еще не очень совершенно, хотя критический уровень преодолен - удобства превышают трудности.

Не всегда OKG умеет выполнять вроде бы очевидные команды. Например "мое расписание" ни за что, только "мой график". Приходится методом проб и ошибок действовать.

Иногда не хочет произносить результат, а только показывает на экран. Причем не полностью а "с катом", т.е. надо еще кликать пальцем и листать и читать.

Не умеет поддерживать разговор, т.е. сказав "OKG, какая погода на сегодня" нельзя просто сказать после ответа "а на выходные?" Надо обязательно говорить "OKG, а на выходные?". Вроде бы это результат борьбы с Гуглом европейских лоббистов, в штатах он это умеет делать, а Россию видимо причисляет к Европе.

Не умеет отвечать без разблокировки при включенных наушниках. Правда я наблюдаю этот эффект на Самсунге. Возможно это проявление паранойи Самсунга, некоторые пользователи говорят что на их аппаратах это чудесно работает.

Пока что очень мало приложений с которыми OKG умеет общаться по русски. Музыка, Ютуб, Нетфликс, криво календарь и в общем все. Запустить любое приложение на телефоне может, но "дальше уж ты сам". Перейдем теперь к перспективным вкусняшкам.

Вкусняшки

-2

На английском приложений с которыми он умеет работать больше на порядок или на несколько порядков.

Когда я пробовал его английский интерфейс, сказал ему на пробу "OKG, let me talk to Todoist" и услышал в ответ что-то вроде "Hello Sergey, I'm Todoist, how can I help You?" (другим голосом!), Похоже, OKG запускает нужное приложение, передает ему через стандартный API мое имя и распознанный текст, получает от него ответный текст, синтезирует звук и говори мне выбранным этим приложением голосом. Уверен что скоро говорить можно будет с любым приложением. Последнее обновление OKG уже обрабатывает специальную команду "Поговорить с приложением дня" и вызывает разные приложения на разговор. Пока мне попадались только приложения самого Google, но это наверняка дело пары месяцев.

Из вкусняшек я еще не рассказал о том как он работает с телевизором и аудицентром, и о работе с OKG не через смартфон, а через умную колонку Google Home. И без того длинно получилось

Copiright (c) Сергей Курьянов Дивный новый цифровой мир