145 подписчиков

Искусственный интеллект для чайников. Урок 3. Озвучиваем диалог.

12 августа12 авг

4 мин

Добрый день, друзья!

Попробуем озвучить диалог разными голосами? Я использую для этого нейросеть Звукограм (ZVUKOGRAM). На прошлом уроке (урок здесь) мы знакомились с этой нейросетью, и озвучивали текст приятным голосом Эрмила. Давайте теперь попробуем использовать при озвучивании текста разные голоса.

В статье я подробно опишу процесс озвучки, и прикреплю видео, в котором этот процесс запечатлён наглядно. И можно будет услышать результат!

Вот такой текст я буду сегодня озвучивать:

Дорогие друзья, сегодня мы с вами озвучим короткий диалог бабушки и внука. Давайте приступим прямо сейчас!

- Бабушка! Расскажи мне сказку!

- Сегодня я расскажу тебе сказку про курочку Рябу.

- Нет! Про курочку Рябу я знаю. Расскажи другую!

- Какую другую?

- Расскажи мне сказку про бармалея!

- Ох внучек! Про бармалея я сказок не знаю.

В этом тексте есть голос рассказчика, а также диалог бабушки и внука. А значит, нам понадобятся три голоса.

Набираем в поисковой строке "zvukogram.com". Заходим, и жмём на кнопку "Озвучка текста":

В открывшееся окошко я внесла свой текст. Его можно скопировать из текстового редактора, в котором вы обычно печатаете. А можно напечатать текст прямо в окошке:

Когда мы озвучиваем тексты с диалогами, то не забываем о паузах. Напоминаю вам, что паузы мы обозначает чередующимися знаками короткий дефис и точка ( -.-.-.). Чем больше дефисов и точек, тем длиннее пауза.

Рассказчик предлагает нам приступить к озвучиванию диалога. После его слов, и перед самим диалогом, паузу я сделаю побольше (-.-.-.-.). И небольшие паузы (-.-.) я поставлю между репликами бабушки и внука. Вот как выглядит мой текст с расставленными знаками, означающими паузы:

На озвучивание такого короткого текста много токенов не понадобится. Нейросеть съест около 2х-3х токенов. Если вы уже израсходовали свои пробные бесплатные 5 токенов, то баланс нужно пополнить. Это просто. Нажмите на кнопку "Получить токены" под Балансом, и программа предложит вам пополнить баланс. Минимальное количество токенов, которые можно приобрести - 150 штук, которые стоят 150 рублей.

Теперь я выберу голос для рассказчика, который говорит: Дорогие друзья, сегодня мы с вами озвучим короткий диалог бабушки и внука. Давайте приступим прямо сейчас!

Программа автоматически мне выставила голос Савелия с отметкой pro. Но я его поменяю, и использую голос подешевле. Это будет Эрмил без отметки pro. Несмотря на то, что это не профессиональный робот, говорит он прекрасно. На прошлом уроке мы с вами в этом убедились. Жму на кнопку с именем робота, и выпадает таблица с вариантами голосов:

И мне не хочется, чтобы он говорил нейтрально. Поменяю "нейтральный" на "дружеский":

Теперь дружеский Эрмил - это основной голос нашего текста. Но мы хотим, чтобы слова внука были озвучены мальчиком, а слова бабушки - голосом пожилой женщины. Как это сделать? Всё просто!

Нам нужно добавить два голоса. Для этого нажмём дважды на синюю кнопку в окошке с изображением говорящей головы с плюсом. Вот она на иллюстрациях (добавить дикторов):

Нажмите дважды, чтобы добавить два голоса.

После того, как мы дважды нажмёте на эту кнопку, у нас автоматически добавятся две дополнительные строки с голосами.

Если случайно нажали трижды, просто удалите лишнюю строку, нажав на красную кнопку с крестиком справа. Это функция удаления лишнего диктора.

В новых строках программа продублирует нам выбранный ранее голос Эрмила. Но мы для бабушки и внука, конечно, выберем другие голоса.

Итак, для внука мы выберем голос "Мальчик Петя" со знаком pro. Такие интересные голоса стоят подороже. И поменяем нейтральный голос на энергичный:

Для бабушки я выберу голос "Баба Нина". Это тоже голос pro. Бабу Нину пока оставлю нрейтральной:

Теперь у нас выбраны все три голоса. Давайте дадим команду нейросети озвучить внука и бабушку выбранными нами голосами. Для этого мы поочередно выделяем фразы наших героев.

Первая фраза в диалоге принадлежит внуку: Бабушка! Расскажи мне сказку!

Выделите эту фразу целиком с восклицательным знаком, до обозначения паузы. И нажмите синюю кнопку "Обернуть" в строке с голосом "Мальчик Петя". Смотрите на иллюстрации:

Выделили первую фразу внука, и нажали кнопку обернуть в строке голоса "Мальчик Петя".

Появятся всякие непонятные символы с обоих сторон нашей фразы. Так мы задали программу на озвучивание участника диалога.

Затем выделяем левой кнопкой мышки вторую фразу диалога, которая принадлежит бабушке. И жмём на кнопку "Обернуть" в строке с голосом "Баба Нина"

Выделили вторую фразу в диалоге, которая принадлежит бабушке, и нажали "Обернуть".

Следующую фразу диалога вновь произносит внук. И, как вы, наверняка догадались, мы её выделим, и нажмём "Обернуть" в строке с голосом "Мальчик Петя". Так, последовательно мы "обернём" каждую фразу в нашем диалоге.

Но! В последней фразе нашего диалога (Ох внучек! Про бармалея я сказок не знаю), я предлагаю изменить интонацию голоса бабушки с нейтрального на грустный. Бабушка же расстроена, что она не знает сказку про бармалея.

Для этого, перед тем, как выделить последнюю фразу и обернуть её, сначала изменим интонацию голоса "Баба Нина":

Вот теперь выделяем последнюю бабушкину фразу, и жмём "Обернуть".

Вот мы и запрограммировали наш диалог. А те фразы, которые в нашем тексте не "обёрнуты", будут озвучены основным голосом Эрмила.

Всё готово! Жмём на большую синюю кнопку "Озвучить текст" и ждём результат:

Как только нейросеть справится с заданием, аудио будет воспроизведено, и мы услышим, что у нас получилось. Прослушивать аудиодорожку можно неоднократно, поскольку она сохранится в нашем кабинете до той поры, пока мы сами её не удалим.