Найти тему

Искусственный интеллект - работа со звуком

Оглавление

Сегодня самыми известными разработками в сфере работы с голосом Искусственного интеллекта являются голосовые помощники такие как Алиса, Сири, Окей Гугл. Но не все знают где еще применяется ИИ при работе с голосом и со звуками.

Очень интересна разработка инженеров и разработчиков смогли сделать голос очень похожим на голоса знаменитостей, при этом хорошо осознают, что данная технология требует контроля и может быть опасна в плохих руках.

Как устроен человеческий слух

Давайте для начала разберемся немного как устроен человеческий слух. Мы как биологический вид живем на планете очень давно, и человеческий слух это не только система для восприятия звука (уши, перепонка и тд.), но и мозг, который этот сигнал обрабатывает.

Искусственный интеллект работа со звуком
Искусственный интеллект работа со звуком

Сегодня технологии ИИ позволяют так же работать со звуковыми волнами. Звук это динамический процесс (изменяется во времени). работа со звуком во многих частях отличается от работы с изображениями.

Строение органов слуха
Строение органов слуха

Есть целая наука, которая называется психоакустика, которая говорит о том, что то как мы воспринимаем сигнал и как он к нам приходит, это две большие разницы.

Это очень похоже на обман зрения, наш мозг искажает информацию.

Обман зрения, наш мозг искажает информацию
Обман зрения, наш мозг искажает информацию

Не смотря на то что все люди слышат звуки по разному, мы все понимаем речь, звуки природы и музыку.

В отличии от света, который распространяется практически мгновенно. Когда вы включаете лампочку свет сразу везде, звук в отличии от света распространяется медленнее и звук - это еще и эхо.

Скорость свети и звука
Скорость свети и звука

Когда вы создаете звук в помещении, он отражается от стен, потолка пола и возвращается к вам в виде эхо.

В чем основоная проблема работы со звуком

Звук несет с собой большой объем информации, часть которой является лишней и ее надо отделить от полезной для нас информации.

Одно из направлений работы нейронных сетей при работе со звуком- это задачи Деконволюции - удаление помех, которые создают внешние системы накрадываясь и искажая основной сигнал.

Например сигнал, который распространяется в помещении должен быть принят в нескольких точках одинаково, без искажений.

Это проблема хорошо слышна при нахождении на вокзале или больших открытых аренах. Звук который доходит до наших ушей приходит с искажениями, и часто нам просто сложно понять что готоврит диктор.

Искажение звука
Искажение звука

Разделение звука на звуковые дорожки

Разделение звукового сигнала, например песни на составляющие:

Разделение звукового сигнала, например песни на составляющие:
Разделение звукового сигнала, например песни на составляющие:
  • Голос человека
  • Инструмент №1
  • Инструмент №2
  • Инструмент №3

Где еще может применятся искусственный интеллект при работе со звуком

  1. Распознавание голоса в телефонных звонках или для умных устройств.
  2. Распознавание жанров музыки
  3. Изменение голоса человека
  4. Архитектурная акустика (Издать в помещении звук, записать его и понять размеры помещения)
  5. Транскрибация текста и создание субтитров
  6. Разделение голосов спикеров
  7. Запись голоса человека в шумном помещении

Если вам интересно применение технологий ИИ в вашем бизнесе, свяжитесь с нами мы расскажем где можно использовать ИИ у Вас.

Наука
7 млн интересуются