Мир языков — это не только слова и грамматика, но и акценты, отражающие историю, миграцию и культурные контакты. Команда BoldVoice решила взглянуть на это глазами искусственного интеллекта — точнее, его ушами. Результатом стал проект Accent Explorer: интерактивная 3D-визуализация, показывающая, как ИИ группирует акценты английской речи без всяких текстов или лингвистических подсказок. В основе проекта лежит модель HuBERT — это аудио-фундаментальная нейросеть, обученная понимать структуру речи без транскрипций. Инженеры BoldVoice дообучили её на 25 000 часах речи от 200 носителей разных языков, не предоставляя модели ни текстов, ни расшифровок — только голос. 🎛️ Архитектура модели выглядит так: Итого: 94,6 млн параметров, неделя обучения на кластерe NVIDIA A100 и 30 млн звуковых фрагментов. Модель анализирует только звучание, а не смысл, и именно это делает результат особенно чистым — мы видим не лексику, а музыку речи. После обучения исследователи применили метод UMAP для проекции мно
🌍 Как искусственный интеллект «слышит» акценты: карта звуковой географии мира
15 октября 202515 окт 2025
3 мин