Вопреки распространенному убеждению, английский не самый распространенный язык в мире по общему числу носителей. Первое и второе место занимают – китайский (точнее северокитайский язык или мандаринский диалект) и испанский, соответственно. Третье место делят западногерманские языки (в их числе английский, немецкий, французский). За ними следуют хинди, арабский, португальский, бенгальский и русский.
Удивительно, но Google Assistant, Apple Siri, Amazon Alexa и Microsoft Cortana распознают лишь относительно небольшое количество языков. Голосовой помощник Samsung Bixby получил поддержку распространенных немецкого, французского, итальянского и испанского языков лишь осенью 2018. А майкрософтовской Кортане потребовались годы, чтобы заговорить на испанском, французском и португальском. Почему так сложно обучить голосового помощника новому языку?
Добавление языковой поддержки – это многоаспектный процесс, требующий трудоёмких исследований и разработок в области распознавания и синтеза речи.
Например, преобразование речи в визуальный текстовый формат. Сегодня большинству систем распознавания речи помогают глубокие нейронные сети – математические функции, которые со временем самосовершенствуются, и могут распознавать фонемы или близко воспринимаемые отдельные единицы звука (например, p, b и d в английских словах pad, pat и bad). Это снижает частоту ошибок.
Но базового понимания языка недостаточно. Без локализации голосовые помощники не могут понять культурные особенности или, что ещё хуже, отличие норм одной языковой культуры от другой. Для обучения голосового помощника новому языку требуется от 30 до 90 дней (в зависимости от количества навыков).
Умные колонки Apple HomePod и Amazon Echo понимают только 94% английской речи и 78% китайской (по результатам тестов проекта Vocalize.ai в сентябре 2018). На базовом уровне некоторые языки очень и очень разные.
Какие языки понимают популярные голосовые помощники
Google Assistant
С добавлением новых языков в январе Google Assistant занял первое место среди голосовых помощников по количеству поддерживаемых. Сейчас он владеет почти 30 языками в 80 странах, по сравнению с 8 языками и 14 странами в 2017. Список ниже включает в себя текущие языки и те, которые появятся до конца 2019:
- Английский (Австралия, Канада, Индия, Индонезия, Ирландия, Филиппины, Сингапур, Таиланд, Великобритания, США) Арабский (Египет, Саудовская Аравия)
- Бенгальский
- Гуджарати
- Датский
- Индонезийский
- Испанский (Аргентина, Чили, Колумбия, Перу)
- Итальянский
- Каннада
- Китайский (традиционный)
- Корейский
- Малаялам
- Маратхи
- Немецкий (Австрия, Германия)
- Нидерландский
- Норвежский
- Польский
- Португальский (Бразилия)
- Русский
- Тайский
- Тамильский
- Телугу
- Турецкий
- Урду
- Французский (Канада, Франция)
- Хинди
- Шведский
- Японский
Apple Siri
Голосовой помощник Apple Siri до января обгонявший Google Assistant с точки зрения широты языковой поддержки теперь занимает второе место. В настоящее время Siri поддерживает 21 язык в 36 странах и десятки диалектов китайского, нидерландского, английского, французского, немецкого, итальянского и испанского языков:
- Английский
- Арабский
- Датский
- Иврит
- Испанский
- Итальянский
- Китайский (мандаринский, шанхайский и кантонский)
- Корейский
- Малайский
- Немецкий
- Нидерландский
- Норвежский
- Португальский
- Русский
- Тайский
- Турецкий
- Финский
- Французский
- Шведский
- Японский
Microsoft Cortana
Дебютировавшая в апреле 2013, Cortana не поддерживает столько языков, как конкуренты выше. Но за шесть лет проделана неплохая работа:
- Английский (Австралия, Канада, Новая Зеландия, Индия, Великобритания, США)
- Испанский (Мексика, Испания)
- Итальянский
- Китайский (упрощённый)
- Немецкий
- Португальский (Бразилия)
- Французский (Канада, Франция)
- Японский
Amazon Alexa
Alexa доступна в более чем 150 продуктах в 41 стране, но понимает наименьшее количество языков среди голосовых помощников:
- Английский (Австралия, Канада, Индия, Великобритания и США)
- Испанский (Мексика, Испания)
- Немецкий
- Французский (Канада, Франция)
- Японский
Стоит отметить, что ситуация улучшается. По словам Amazon, компания расширяет поддержку языков с помощью краудсорсинга. В прошлом году Amazon выпустила игровой навык Cleo, который вознаграждает пользователей за повторение фраз на местных языках и диалектах, таких как китайский, хинди, тамильский, маратхи, каннада, бенгальский, телугу и гуджарати.
Samsung Bixby
Samsung Bixby – голосовой помощник, встроенный во флагманские смартфоны Galaxy и умную колонку Galaxy Home, доступен на 200 рынках по всему миру, но поддерживает только несколько языков в этих странах:
- Английский
- Испанский
- Итальянский
- Китайский язык
- Корейский
- Немецкий
- Французский
Очевидно, что некоторые голосовые помощники продвинулись намного дальше в языковой поддержке, чем другие. Многоязыковая поддержка сильно зависит от машинного обучения, и та компания, которая сможет успешнее остальных совершенствовать алгоритмы обработки естественного языка (NLP) будет лидировать на рынке.