1779 подписчиков

Fish Speech - Нейросеть для озвучки текста вашим голосом. Портативная версия

7 января 20257 янв 2025

2 мин

🎙 Fish Speech 1.5 – Это модель преобразования текста в речь, созданная для генерации естественного и качественного голоса. Она идеально подходит для разработчиков, создателей контента и всех, кто ищет продвинутую TTS-технологию. 🔥 Ключевые особенности: - Поддержка клонирования голоса – добавь уникальность, просто загрузив референсный аудио-файл. Достаточно 10-30 секунд для копирования вашей речи. - Высокое качество генерации – реалистичная речь с интонациями. - Гибкая настройка – параметры Top-P, Temperature и Seed позволяют контролировать стиль и выразительность голоса. - Поддержка мультиязычности – используйте модель для различных языков: английский, китайский, японский, немецкий, французский, испанский, корейский, арабский, русский, нидерландский, итальянский, польский и португальский. - Простой интерфейс – минималистичный и понятный UI через Gradio. 💡 Для кого подходит? Создатели подкастов, разработчики приложений, голосовые ассистенты, генераторы контента для видео, образовател

🔥 Ключевые особенности:

- Поддержка клонирования голоса – добавь уникальность, просто загрузив референсный аудио-файл. Достаточно 10-30 секунд для копирования вашей речи.

- Высокое качество генерации – реалистичная речь с интонациями.

- Гибкая настройка – параметры Top-P, Temperature и Seed позволяют контролировать стиль и выразительность голоса.

- Поддержка мультиязычности – используйте модель для различных языков: английский, китайский, японский, немецкий, французский, испанский, корейский, арабский, русский, нидерландский, итальянский, польский и португальский.

- Простой интерфейс – минималистичный и понятный UI через Gradio.

💡 Для кого подходит?

Создатели подкастов, разработчики приложений, голосовые ассистенты, генераторы контента для видео, образовательные платформы.

---

Пошаговый гайд:

1. Ввод текста:

- В поле Input Text напишите текст на любом поддерживаемом языке.

2. Референсное аудио (опционально):

- Для клонирования голоса переключитесь на вкладку Reference Audio и загрузите образец голоса.

3. Настройка параметров:

- Используйте Advanced Config, чтобы настроить параметры синтеза под свои нужды.

Расширенные настройки:

- Iterative Prompt Length – Определяет длину итерации текста (0 отключает эту функцию).

- Top-P – Отвечает за разнообразие текста, чем выше значение, тем более свободной будет речь.

- Temperature – Регулирует степень "творчества" в синтезе речи.

- Repetition Penalty – Снижает повторяемость слов для более естественного результата.

- Seed – Задаёт случайность генерации, 0 для случайного результата, любое число – для детерминированного.

4. Генерация:

- Нажмите Generate. После генерации аудио появится в правой части интерфейса. Вы можете прослушать результат или скачать его.

5. Эксперименты:

- Изменяйте параметры, такие как Top-P и Temperature, чтобы добиться нужного стиля речи.

Программа достаточно неприхотлива к видеопамяти и использует всего несколько гигабайт видеопамяти. Я подготовил для вас портативную версию, которая позволяет запустить программу всего в пару кликов: 1) Распакйте архив 2) Запустите файл start_fish_audio_portable.bat.

Скачать портативный Fish Speech 1.5 можно:

С моего хранилища | С зеркала (Yandex Disk)

Больше различных сборок, в том числе и будущие обновления, гайдов и новостей из мира AI и нейросетей доступно в моем Телеграм канале:

Neurogen.

Пост автора neurogenerated.

Читать комментарии на Пикабу.