Найти в Дзене
PsyNews

Может ли ИИ расшифровать лай вашей собаки?

Наверняка каждый владелец пушистого друга хотя бы раз представлял, как интересно было бы поговорить по душам со своим питомцем. Именно эта идея вдохновила исследователей из Мичиганского университета. Авторы изучили, как искусственный интеллект (ИИ) может интерпретировать проявления собак, потенциально различая игривый лай и агрессивное рычание, определяя возраст, породу и пол животного. Результаты говорят о том, что модели ИИ, изначально разработанные для человеческой речи, могут быть адаптированы для декодирования сообщений животных. Целью работы стало желание не только улучшить отношения между собакой и человеком, но и повысить качество жизни питомцев за счет лучшего понимания их потребностей и эмоций. Материалами для исследования послужили записи лая 74 собак в Мексике. Преимущественно это чихуахуа, французские пудели и шнауцеры, средний возраст – 35 месяцев. Записи были сделаны в естественной домашней среде собак, чтобы запечатлеть аутентичные голосовые реакции. Собак подвергали
Изображение от freepik
Изображение от freepik

Наверняка каждый владелец пушистого друга хотя бы раз представлял, как интересно было бы поговорить по душам со своим питомцем. Именно эта идея вдохновила исследователей из Мичиганского университета.

Авторы изучили, как искусственный интеллект (ИИ) может интерпретировать проявления собак, потенциально различая игривый лай и агрессивное рычание, определяя возраст, породу и пол животного. Результаты говорят о том, что модели ИИ, изначально разработанные для человеческой речи, могут быть адаптированы для декодирования сообщений животных.

Целью работы стало желание не только улучшить отношения между собакой и человеком, но и повысить качество жизни питомцев за счет лучшего понимания их потребностей и эмоций.

Материалами для исследования послужили записи лая 74 собак в Мексике. Преимущественно это чихуахуа, французские пудели и шнауцеры, средний возраст – 35 месяцев. Записи были сделаны в естественной домашней среде собак, чтобы запечатлеть аутентичные голосовые реакции.

Собак подвергали воздействию различных стимулов, призванных вызывать различные типы вокализации. Эти стимулы включали: присутствие незнакомца, ласковые разговоры хозяина, игровое общение и даже имитацию нападения на владельца.

Ученые вручную классифицировали записи, выделив 14 категорий вокализации, таких как агрессивный лай на незнакомца, неагрессивный лай, лай из-зи нападения на хозяина и лай во время игры.

В основе анализа лежало использование модели ИИ, известную как Wav2Vec2, первоначально разработанную для распознавания человеческой речи. В задачи входило: идентификация собак по их лаю, определение породы, предсказание пола и сопоставление лая с контекстом ситуации.

С идентификацией животного модель справилась в 50% случаев. Чем превзошла модель, обученную с нуля – 24%. С определением породы - в 62% случаев.

Третья задача — предсказать пол собаки— оказалась более сложной. Хотя модель, обученная с нуля, работала лучше, чем базовая, предварительная тренировка человеческой речи не значительно повысила ее точность определения пола.

Наконец, ИИ преуспел в привязке лая к конкретному контексту. С высочайшей точностью нейросеть определила контекст, чем так же превзошла нулевую модель.

Таким образом, доказано преимущество модели, базирующейся на распознавании человеческой речи, что говорит о схожести человеческих голосовых акцентов и вокализации собак. Исследование выстраивает перспективное направление, которое в будущем позволит лучше понимать своих питомцев.

Авторами исследования « На пути к расшифровке лая собаки: использование обработки человеческой речи для автоматизированной классификации лая » являются Артем Абзалиев, Умберто Перес Эспиноза и Рада Михалча.