В Новосибирском государственном университете (НГУ) создали инструмент на основе нейросетей, который распознает голоса до 100 человек и может применяться для составления протоколов совещаний. О разработке рассказал заведующий лабораторией аналитики потоковых данных и машинного обучения НГУ Евгений Павловский.
«Мы создали бот, который распознает голос - он проверенно работает в потоке до 100 человек», - сказал Павловский.
Он отметил, что инструментом уже заинтересовались представители энергетической сферы. В настоящее время НГУ ведет переговоры с энергетической компанией по созданию сервиса для автоматизированного составления протоколов: он будет распознавать голоса, сортировать их и превращать в текст.
Платформа позволит распознавать того или иного человека из списка участников совещания, транскрибировать его речь и приписывать ему соответствующие высказывания. После совещания сервис подготовит текстовый протокол встречи.
По словам Павловского, аналога сервиса в России не существует. Сейчас ученые приступили к составлению лингвистической модели, в которой учтут специфическую лексику отрасли, сообщает ТАСС.
Ранее ученые НГУ разработали алгоритм для создания резюме видеопотока. Сервис сжимает многочасовое видео с камер наблюдения.
Прочитать материал целиком можно здесь. Мы публикуем самые интересные материалы в «Яндекс.Дзене». Чтобы читать их регулярно, станьте подписчиком нашего канала. Быть на связи с «Умной Страной» можно также в Facebook, Instаgram и в Вконтакте.