Нейросеть от Meta узнает 4017 языков по устной речи и ответит на 1107 из них

Компания Meta* выпустила языковую модель, которая понимает устную речь.N + 1
Модели распознавания речи и преобразования текста в речь обычно предполагают обучение на нескольких тысяч часов аудиозаписей с текстовой расшифровкой и разметкой.3DNews
Проблему с отсутствием текстовой разметки у аудиозаписей удалось преодолеть за счёт wav2vec 2.0 — ещё одной ИИ-модели Meta, предназначенной для «обучения представлению речи с самоконтролем».3DNews
Модель MMS использует архитектуру wav2vec 2.0, которая преобразует аудиозаписи в векторные представления.Ferra
Эта новость в СМИ