5 подписчиков
Чтобы нейронная сеть точно представляла слова в песне, ее необходимо обучить, снабдив ее правильными текстами для обучения.
Эту строчку из известной советской песни нейросеть обрабатывала очень долго. Кто отгадает, какая песня послужила ядром запроса нейросети - пишите свои версии в комментариях.
Существует три различных типа сетей, которые используются в некоторых из самых популярных программ для распознавания речи: нейронная сеть с прямой связью, рекуррентная нейронная сеть и сверточная нейронная сеть.
В общем, глубокое обучение — это тип машинного обучения, который позволяет нейронной сети изучать задачи без явного программирования. Нейронные сети представляют собой структуры слоев, которые постепенно выполняют более сложные операции по мере продвижения от входного слоя к скрытым слоям и к выходному слою.
Тексты песен хранятся в аудиоформате и преобразуются в текст, который иногда называют Lyr2Text или Lyr2Txt. Это делается либо с помощью автоматического распознавания речи (ASR), либо путем ручного ввода человеком, расшифровывающим текст песни.
Нейронной сети нужны аудиофайлы и текстовая транскрипция текста песни, чтобы генерировать любое осмысленное представление слов в песне.
Около минуты
14 августа 2022