2177 подписчиков

Актёр Игорь Гмыза: «Искусственный интеллект не лишит нас работы, а сделает премиальным сегментом»

25 апреля 202125 апр 2021

3 мин

Жуть закрадывается в душу, когда слушаешь аудиокнигу в исполнении Авточтеца на платформе ЛитРес. Синтезированный голос читает литературный текст, пытаясь передавать эмоции и даже улыбку. Но мой мозг бунтует, отказывается воспринимать «неживые» эмоции. Наверное, актёры-чтецы всё-таки не останутся без работы, искусственный интеллект не заменит человека при записи художественного текста. Или через несколько лет цифровые технологии усовершенствуются и вытеснят чтецов? Своими сомнениями я поделилось с актёром Игорем Гмызой, он давно занимается записью аудиокниг и внимательно наблюдает за новостями об искусственном интеллекте.

– Знаешь, как-то не по себе, когда слышишь улыбку синтезированного голоса…

- Прежде всего, надо понимать, что искусственные голоса, которые мы все чаще слышим, принадлежат не роботам, а состоят из фрагментов живых человеческих голосов, которые при помощи искусственного интеллекта превращаются в связную речь. Многочисленные компании, которые занимаются разработкой синтезаторов речи и искусственного интеллекта, активно рассылают предложения дикторам и актерам по поводу покупки их голосов, обещая вроде бы неплохие деньги. При этом не всегда понятно, может ли этот диктор в дальнейшем пользоваться своим голосом (наверное, о правах актера на проданный голос можно спросить в Союзе дикторов). Как бы то ни было, развитие искусственных интеллектов идет полным ходом и не в наших силах остановить технический прогресс и, думаю, в скором времени голоса ИИ займут заметное место в нашей жизни.

- Может быть, такие голоса будут читать в основном разного рода объявления? Сообщать о приходе поездов на вокзалах, или озвучивать автоответчики? А аудиокниги мы будем слушать в исполнении актеров?

- Надеюсь, да. Многие коллеги высказывают беспокойство, не останемся ли мы совсем без работы. По этому поводу у меня несколько соображений. Очевидна экономическая целесообразность использования искусственных голосов в прикладных целях, для объявлений и так далее. Как бы актеры не возражали, тут ситуацию не переломить, бороться против прогресса и экономической выгоды заказчика бессмысленно.

- Но, возможно, стоит бороться за качество синтезированной речи? Чтобы слова произносились правильно и речевые нормы не искажались?

- Искусственный интеллект быстро обучаем, ударения для него не проблема. Говорят, он скоро научиться воспроизводить даже вздохи. Но не будем забывать, что голос ИИ – это так называемая «реплика». Есть одежда или аксессуары известного дорогого бренда, а есть подделка под него, точно повторяющая все детали. Но покупая такую реплику, человек знает, что это подделка, «реплика», а не настоящая вещь. Так и с голосами. Настоящие актёрские голоса останутся востребованными для некоторых ситуаций, хотя они и дороже искусственных.

Кроме того, искусственный интеллект пока не может передавать голосу эмоции. И он никогда не сможет понимать подтекст книги и передавать его слушателю. Например, я недавно записывал аудиокнигу Зигмунда Фрейда и там автор рассуждает о том, что такое «я» в психологии. Фраза «Я думаю, что «я» означает в тех или иных обстоятельствах» ИИ не сможет понять и адекватно передать голосом. Разобраться в таких нюансах может только человек.

Я думаю, что мы, чтецы аудиокниг, останемся «премиальным сегментом». Люди предпочтут слушать литературу в человеческом исполнении. Искусственный интеллект может заучить даже эмоции и интонации, но это будет стандартное воспроизведение, неживое.

- Ты озвучил позицию чтеца. А я еще хочу сказать от имени слушателей. Можно слушать новости, прочитанные синтезированным голосом. Но вот стихи или хороший роман в исполнении робота слушать невозможно. Мозг сопротивляется…

- Для большинства людей это нормальная реакция. Хотя справедливости ради хочу сказать, что есть люди, которые слушают аудиокниги на удвоенной скорости, там не разобрать никаких интонаций…То есть, им все равно, кто и как читает. Значит, авточтец их вполне устроит. А учитывая, какими темпами развивается и обучается искусственный интеллект, можно предположить, что скоро мы не сможем отличить «на слух» живой голос от искусственного. Но на уровне подсознания будет понятно, кто читает, человек или синтезатор. И тут уже выбор за слушателем.