Найти тему
Мастерская Chipmaster.BY

Алиса, Алиса, а на Windows сможешь?

Как я создал виртуальную недоАлису с помощью Laitis. Идея к слову у меня родилась совершенно случайно, как то наткнулся на отличный музыкальный плеер под Windows со встроенным плагином Яндекс музыки. Выполнен он на теле всем известного и древнего плеера Winamp, только ребята его переработали под Яндекс музыку и назвали соответственно Yaamp.

Внешний вид музыкального плеера Yaamp
Внешний вид музыкального плеера Yaamp

Для его запуска, достаточно скачать установщик или портэбл версию себе на компьютер и запустить, я скачал портативную. При первом запуске он у меня попросил данные для входа в Яндекс музыку (я ввел свой аккаунт Яндекс). После ввода пароля, мне открылся старый добрый и внешне тот же самый Winamp, аж на слезу пробило, когда увидел его впервые после столь долгой разлуки.

Пользоваться им очень просто. Если вы владелец Яндекс станции, то по команде "Алиса, включи музыку" колонка включит подборку под ваш стиль, называется "Моя волна", в Yaamp все фишки сервиса Яндекс музыки реализованы по правому клику мыши в окне плеера.

Yaamp - меню управления Яндекс музыкой
Yaamp - меню управления Яндекс музыкой

Минусом реализации могу назвать отсутствие запрограммированых клавиш на всевозможные действия, горячие клавиши доступны только для управления плеером и перекочевали они с основного движка Winamp. Но тем не менее, загрузив плейлист в окно проигрывателя, остается лишь его включить на проигрывание.

С плеером все более менее ясно, а что же с движком распознавания речи и системой управления? Как я уже сообщил за основу взял Laitis.

Открываю установленное приложение и перехожу на вкладку "Команды", т.к. она самая интересная. Вкладка пестрит списком с наборами и радует своими возможностями.

Laitis - список команд
Laitis - список команд

Найдя там раздел "Клавиатура и мышь", я стал искать в нем команды по управлению плеером, к моему удовольствию готовые наборы голосовых команд там уже присутствуют, что очень удобно, особенно когда только пытаешся освоить софт.

Laitis - редактор команд
Laitis - редактор команд

Ах да, чтобы приложение распознавало мои слова именно как команды, так же как и в умной колонке надо настроить стоп слово (ключевое), я не стал мудрствовать лукаво и добавил слово "Алиса". Сделать это надо на вкладке "Настройки".

Laitis - основные настройки программы
Laitis - основные настройки программы

Мне не терпелось опробовать все это в деле и я стал уговаривать новоиспеченную Алису переключить мне музыку, по-скольку плеер уже звучал, то я попробовал послать команду на следующий трек.

Отправляю голосовую команду переключить трек
Отправляю голосовую команду переключить трек
Отправляю голосовую команду сделать тише
Отправляю голосовую команду сделать тише

В верхней части монитора программа транслирует все слышит (по желанию отключается в настройках), так что удобно смотреть получилось ли договориться с движком распознавания и мне это удалось :). Замечу, что Laitis умеет работать с несколькими голосовыми сервисами, я попробовал и Яндекс и Гугл, но остановился на Google, мне показалось он отрабатывает быстрее. Выбрать сервис распознавания можно на вкладке Настройки.

Laitis - вкладка Настройки
Laitis - вкладка Настройки

Что касаемо точности распознавания голоса, тут все зависит от качества микрофона, лучше подключать внешний, потому что встроенный в ноутбук слишком шумный и распознавание часто проходит с ошибками. У меня нашелся внешний микрофон в порт USB и вот с ним Алиса меня стала понимать практически безошибочно. Выбрать с каким микрофоном будет работать приложение можно все там же на вкладке "Настройки".

Теперь про недостатки данной связки. У плеера Yaamp как я уже сообщал не запрограммировано управление фишками Яндекс музыки с помощью клавиатуры, нет горячих клавиш, так что поставить Лайк или загрузить следующий список "Моя волна" пока мне не удалось с помощью голоса. Но должен заметить, что возможности программы Laitis почти безграничны, можно использовать скрипты, различные манипуляции с мышью, запуски любых приложений в любых сочетаниях и последовательности, выводить запущенные программы в фокус окна и многое многое другое, так что какую-то реализацию придумать можно мне кажется. Но наверное проще связаться с разработчиками Yaamp и уговорить их добавить горячие клавиши.

В заключении могу сказать, что такую Алису можно обучить практически полноценному управлению компьютером, включая набор и редактирование текста и тому подобное.

Как вам идея такой Алисы?