Добавить в корзинуПозвонить
Найти в Дзене

Патентная заявка Baidu на ИИ по превращению звуков животных в слова

Китайский гигант в области искусственного интеллекта Baidu подал заявку на патент на технологию искусственного интеллекта (ИИ), предназначенную для перевода звуков животных на человеческий язык. Гигант интернет-поиска подал заявку на патент в декабре, но она была опубликована Национальным управлением интеллектуальной собственности Китая только во вторник. Метод перевода работает путём сбора различных типов данных о животном-объекте, включая «голос, язык тела, изменения в поведении и другие биологические признаки», согласно заявке, опубликованной на сайте агентства. Затем он определяет «эмоцию», анализируя данные, прежде чем преобразовать их в целевой язык. Технология использует несколько областей ИИ, в том числе машинное обучение, которое позволяет компьютерам обучаться на основе больших массивов данных; глубокое обучение, которое использует нейронные сети для анализа характеристик голоса и движений; а также обработку естественного языка, которая применяет вычислительные подходы для а

Китайский гигант в области искусственного интеллекта Baidu подал заявку на патент на технологию искусственного интеллекта (ИИ), предназначенную для перевода звуков животных на человеческий язык. Гигант интернет-поиска подал заявку на патент в декабре, но она была опубликована Национальным управлением интеллектуальной собственности Китая только во вторник.

Метод перевода работает путём сбора различных типов данных о животном-объекте, включая «голос, язык тела, изменения в поведении и другие биологические признаки», согласно заявке, опубликованной на сайте агентства. Затем он определяет «эмоцию», анализируя данные, прежде чем преобразовать их в целевой язык. Технология использует несколько областей ИИ, в том числе машинное обучение, которое позволяет компьютерам обучаться на основе больших массивов данных; глубокое обучение, которое использует нейронные сети для анализа характеристик голоса и движений; а также обработку естественного языка, которая применяет вычислительные подходы для анализа и синтеза естественного языка и речи.

Если голос не соответствует ни одной из исторических эмоциональных записей, команда вручную маркирует голосовые данные, обновляет выборку и корректирует параметры модели. Публикация заявки на патент не означает, что она уже одобрена. По словам Юй Юйтина, старшего партнёра юридической фирмы Shanghai Debund, процесс рассмотрения заявки в лучшем случае может занять год.

«В настоящее время мы всё ещё находимся на этапе исследований, — ответила компания на вопрос о патенте. — Как компания, занимающаяся искусственным интеллектом, мы постоянно ищем способы применения новых технологий в различных сферах».

На протяжении десятилетий учёные и компании по всему миру пытались переводить звуки, издаваемые животными. В 2001 году японская компания-производитель игрушек Takara попала в заголовки газет, выпустив Bowlingual — небольшое портативное электронное устройство, которое переводило лай собак. Журнал Time назвал этот продукт одним из «Лучших изобретений 2002 года». Позже компания выпустила Meowlingual для кошек.

В 2014 году небольшая исследовательская лаборатория из Скандинавии собрала более 22 000 долларов США на краудфандинговой платформе Indiegogo для разработки устройства под названием No More Woof. Однако три года спустя команда заявила, что «проект стал слишком дорогим для продолжения».

Согласно результатам поиска в Apple App Store и различных местных магазинах приложений для Android, в материковом Китае в настоящее время существуют десятки приложений, которые утверждают, что переводят звуки, издаваемые собаками, кошками и даже попугаями.

В своём приложении Baidu сообщила, что современные переводчики языка животных в основном используют два подхода: распознавание голосовых сигналов и изучение мимики. Оба подхода ограничены в понимании эмоций животных, поскольку «чрезмерно полагаются на один источник информации».

Во вторник компания опубликовала несколько других патентных заявок, в том числе одну на рекомендацию покупок в прямом эфире на основе активности других пользователей и другую на алгоритм автономного вождения, который резервирует и направляет электромобиль к ближайшей зарядной станции, когда заряд аккумулятора подходит к концу.