Найти в Дзене

Elevenalbs. Полный гайд по управлению паузами, произношением и эмоциями

Этот гайд объединяет самые эффективные приёмы работы с Eleven v3 — выбор голоса, использование заглавных букв и пунктуации, звуковые теги и диалоги с несколькими спикерами. Важно: Модель Eleven v3 сейчас находится в альфа-версии. Очень короткие промты могут давать нестабильные результаты. Старайтесь использовать тексты длиннее 250 символов. Выбор голоса Главный параметр v3 — это голос. Он должен быть достаточно похож на желаемую манеру подачи. Например, если исходный голос «кричащий», никакими специальными тегами вы не заставите его шептать. Настройка Stability Слайдер Stability определяет, насколько строго результат будет следовать референс-голосу. Creative — максимум эмоций и экспрессии, но выше риск «галлюцинаций». Natural — баланс, ближе всего к оригиналу. Robust — очень стабильная подача, и никакая реакция на теги эмоций. Для работы со звуковыми тегами лучше выбирать Creative или Natural; режим Robust пригоден, когда нужна неизменная дикция Звуковые теги Теги в ElevenLabs помогаю
Оглавление

Этот гайд объединяет самые эффективные приёмы работы с Eleven v3 — выбор голоса, использование заглавных букв и пунктуации, звуковые теги и диалоги с несколькими спикерами.

Важно: Модель Eleven v3 сейчас находится в альфа-версии. Очень короткие промты могут давать нестабильные результаты. Старайтесь использовать тексты длиннее 250 символов.

Выбор голоса

Главный параметр v3 — это голос. Он должен быть достаточно похож на желаемую манеру подачи. Например, если исходный голос «кричащий», никакими специальными тегами вы не заставите его шептать.

Настройка Stability

Слайдер Stability определяет, насколько строго результат будет следовать референс-голосу.

  • Creative — максимум эмоций и экспрессии, но выше риск «галлюцинаций».
  • Natural — баланс, ближе всего к оригиналу.
  • Robust — очень стабильная подача, и никакая реакция на теги эмоций.

Для работы со звуковыми тегами лучше выбирать Creative или Natural; режим Robust пригоден, когда нужна неизменная дикция

Звуковые теги

Теги в ElevenLabs помогают управлять эмоциями, интонацией, эффектами и акцентами. Они добавляются прямо в текст — в квадратных скобках перед или внутри реплики. Вот описание самых популярных тегов и то, как они работают:

Эмоции и интонация:

  • [laughs] — лёгкий смех.
  • [laughs harder] — громкий, затяжной смех.
  • [starts laughing] — начинает смеяться прямо во время фразы.
  • [wheezing] — хриплый смех на выдохе.
  • [whispers] — шёпот.
  • [sighs] — слышимый вздох.
  • [exhales] — выдох перед словами.
  • [sarcastic] — саркастичная интонация.
  • [curious] — любопытный, вопросительный тон.
  • [excited] — радостная, воодушевлённая подача.
  • [crying] — говорит со слезами в голосе.
  • [snorts] — фыркает, хмыкает.
  • [mischievously] — озорная, игривая манера.

Звуковые эффекты и окружение:

  • [gunshot] — звук выстрела.
  • [applause] — аплодисменты.
  • [clapping] — отдельные хлопки.
  • [explosion] — звук взрыва.
  • [swallows] — тихое сглатывание.
  • [gulps] — громкое, нервное сглатывание.

Экспериментальные и особые теги:

  • [strong X accent] — сильный акцент (вместо X подставьте нужный: French, German, Russian и т.д.).
  • [sings] — фраза произносится в виде песни.
  • [woo] — восторженное «ууу!».
  • [fart] — подушка-пердушка.
Важно: не все голоса поддерживают одинаково хорошо все теги. Например, если голос в библиотеке нейтральный, он может неадекватно отреагировать на тег [crying]. Всегда проверяйте заранее.

Пунктуация

Стандартная пунктуация помогает естественному ритму речи.

Добавление пауз в речи

🔹 Дефисы - или —

Это - действительно - поздно.

🔹 Множественные дефисы -- --

Подожди -- мне нужно подумать -- окей, давай дальше.

🔹 Троеточие ... (может добавлять эффект нерешительности)

Я... ну, наверное, да...

Как заставить ИИ правильно произносить слова

Неправильное произношение может быть вызвано разными причинами:

1️⃣ Опечатки и ошибки – ИИ читает слова так, как они написаны. Поэтому проверяй текст перед озвучкой.

2️⃣ Нестандартное написание – нужно изменять написание слова.
По правилу:
как слышится так и пишется.

Здравствуйте

Часто произносится с чётко выделенной "в" - "здраВствуйте"
Переписываем без этой буквы.

Здраствуйте

3️⃣ Ударения - это рутинная задача. в русском языке, особенно с омонимами или новыми/редкими словами - постоянно нужно править.

🔹 пИшешь бОльшой бУквой,
🔹 или специальными символами с ударениями: а́ е́ и́ о́ у́ ы́ э́ ю́ я́
🔹 инода по-могает де-фис,
🔹 или просто апо'строф

*чтобы добавить символы правильных ударений - просто прогоните текст через GPT, с установкой: добавь символы ударений. Он прекрасно с этим спарвляется*

Когда возникают ошибки произношения даже в правильно написанных словах?

Это зависит от:

🔹 Выбранного голоса (разные модели говорят по-разному)
🔹 Контекста текста

Редкие ошибки можно исправить, слегка изменив порядок слов или добавив альтернативное написание.

Как правильно озвучивать числа, даты, символы и аббревиатуры

ИИ может произносить их по-разному, особенно если язык допускает несколько вариантов прочтения.

Как задать точное произношение?

Писать числа прописью

100 ₽
сто рублей

Писать даты прописью

02/03/2024
второе марта две тысячи двадцать четвёртого года

Развернуть аббревиатуры

ДНК
Дэ-Эн-Ка

Советы

  • Комбинируйте теги. Сочетайте несколько эмоций для сложной подачи.
  • Структура текста. Естественные паузы, правильная пунктуация и ясный эмоциональный контекст улучшают результат.
  • Экспериментируйте, чтобы понять, что лучше подходит именно вашему голосу и сценарию.

Гайд написан Алексеем Елисеевым
Если хотите получить больше бесплатных гайдов, узнать о моих услугах, или просто отблагодарить - переходите в
мой бот или телеграм канал.