Добавить в корзинуПозвонить
Найти в Дзене
Age of IT

Voicebox — локальная голосовая студия: заменяет ElevenLabs и WisprFlow разом

Open-source. Джейми Пайн (создатель Spacedrive) собрал в одно приложение то, за что обычно платят двум облачным сервисам. ElevenLabs закрывает синтез и клон голоса, WisprFlow — голосовой ввод; Voicebox делает обе половины и крутит всё на твоём железе. Ни аккаунтов, ни ключей, ни байта в облако. Почти 35k звёзд на GitHub. Клон голоса берёт пару секунд референса. Внутри — 7 TTS-движков (Qwen3-TTS, Chatterbox, Kokoro и др.), 23 языка, теги эмоций [laugh]/[sigh] и многодорожечный редактор «историй». Что умеет: — Клон голоса с 2–3 секунд аудио или 50+ пресетов — Глобальная диктовка по хоткею в любое поле (на Whisper) — Голос для ИИ-агентов: Claude Code и Cursor отвечают голосом, который ты склонировал, — через MCP — Нативное на Tauri (Rust), не Electron; Win/Mac/Linux GitHub Сайт Telegram: @Age_of_it

Voicebox — локальная голосовая студия: заменяет ElevenLabs и WisprFlow разом. Open-source.

Джейми Пайн (создатель Spacedrive) собрал в одно приложение то, за что обычно платят двум облачным сервисам. ElevenLabs закрывает синтез и клон голоса, WisprFlow — голосовой ввод; Voicebox делает обе половины и крутит всё на твоём железе. Ни аккаунтов, ни ключей, ни байта в облако. Почти 35k звёзд на GitHub.

Клон голоса берёт пару секунд референса. Внутри — 7 TTS-движков (Qwen3-TTS, Chatterbox, Kokoro и др.), 23 языка, теги эмоций [laugh]/[sigh] и многодорожечный редактор «историй».

Что умеет:

— Клон голоса с 2–3 секунд аудио или 50+ пресетов

— Глобальная диктовка по хоткею в любое поле (на Whisper)

— Голос для ИИ-агентов: Claude Code и Cursor отвечают голосом, который ты склонировал, — через MCP

— Нативное на Tauri (Rust), не Electron; Win/Mac/Linux

GitHub

Сайт

Telegram: @Age_of_it