Автоматическое распознавание речи (АРР) достигло невероятных успехов за последние несколько лет — особенно для таких распространенных языков, как английский. До 2020 года считалось, что машине не превзойти человека в этом его естественном умении — но, похоже, и тут системы искусственного интеллекта вырвались вперед. В новом исследовании, результаты которого опубликованы в JASA Express Letters, сравнивали две популярные системы АРР — wav2vec 2.0 от Meta (запрещена в РФ) и Whisper от Open AI — с носителями британского английского языка. Распознавание речи оценивали в разных условиях: при ее произнесении в маске и без, в тишине или шуме бара. Whisper large-v3 превзошла живых людей во всех тестовых условиях, кроме шумного бара, в которых показала такой же уровень. «Это было впечатляюще, поскольку тестируемые предложения были представлены вне контекста, и было трудно предсказать какое-либо слово, основываясь на предыдущих», — признается доцент Элеанор Чодрофф с кафедры компьютерной лингвист
Болтовня в баре: автоматическое распознавание речи превзошло живых людей
15 января 202515 янв 2025
1211
1 мин