598 читали · 3 года назад
🔥 Полезные библиотеки Python. Копируем голос с Real-Time Voice Cloning.
Real-Time Voice Cloning - потрясающий проект. По сути, может «выучить» чей-то голос по 5-секундной записи речи, а затем использовать "выученный" голос, чтобы говорить что угодно. Этот репозиторий представляет собой реализацию алгоритмов машинного обучения для синтеза речи с несколькими говорящими (SV2TTS) с помощью алгоритм, работающего в режиме реального времени. SV2TTS — это среда глубокого обучения, чья работа состоит из трех этапов. На первом этапе создается цифровое представление голоса из нескольких секунд аудио. На втором и третьем этапах это представление используется в качестве эталона для генерации речи на основе произвольного текста...
166 читали · 6 лет назад
Машинное обучение для людей
Разбираемся простыми словами Машинное обучение — как секс в старших классах. Все говорят о нем по углам, единицы понимают, а занимается только препод. Статьи о машинном обучении делятся на два типа: это либо трёхтомники с формулами и теоремами, которые я ни разу не смог дочитать даже до середины, либо сказки об искусственном интеллекте, профессиях будущего и волшебных дата-саентистах. Решил сам написать пост, которого мне не хватало. Большое введение для тех, кто хочет наконец разобраться в машинном обучении — простым языком, без формул-теорем, зато с примерами реальных задач и их решений...