Писателям, переводчикам и актёрам озвучки стоит насторожиться
На днях я вляпался в небольшую внутреннюю дилемму. Из тех, где участвуют только ты сам, твоё сознание и твоя совесть.
Наверняка вы сталкивались с таким, если, конечно, у вас есть совесть. Короче говоря, моя мама — пусть покоится с миром — была очень умной женщиной, свободно говорила на пяти языках и работала над шестым, когда умерла в 62 года. Среди прочего, она занималась подработкой ещё до того, как это стало модным. Одна из её подработок заключалась в переводе книг с румынского на английский и обратно. И вот недавно мне понадобилась именно такая услуга.
«История в деталях» — телеграм канал для тех, кто любит видеть прошлое без прикрас, через неожиданные факты и забытые мелочи. Погружайтесь в историю так, как будто вы там были. Подписывайтесь!
Но на этот раз это касалось перевода моего собственного романа с английского на румынский, и я выбрал для этого не живого человека вроде моей мамы, а искусственный интеллект. Поэтому у меня возник внутренний конфликт между мной, собой и моей совестью, когда я нажимал кнопку generate в Copilot и Elevenlabs.
Это короткое вступление упускает много деталей, но именно эти детали, как мне кажется, помогли мне взглянуть на возможности ИИ в писательстве более трезво. Даже тем, кто скептически относится к ИИ, стоит учитывать некоторые нюансы. Всё не так однозначно, чтобы просто махнуть рукой и сказать: «Нет, я по-старинке, на печатной машинке».
Люди вообще забавные. Они хотят жить сразу и в прошлом, и в будущем. История такой роскоши не позволяет. Разве что ТАРДИС.
Мой роман я писал в 2020 году на ноутбуке, в простом редакторе IA Writer (это не опечатка, именно IA, не AI, к искусственному интеллекту он отношения не имеет). Мне просто нужен был редактор, поддерживающий формат markdown. Статьи я тоже пишу в markdown — это стиль компьютерных ботаников.
Когда черновик был готов, я нанял редактора, чтобы он его вычитал. Исправил опечатки, кривые предложения и прочее. У меня есть склонность «проглатывать слова» во время набора текста. По словам психолога Тома Стаффорда, это вполне нормально. Мозг в процессе письма сосредоточен на передаче смысла. Эта функция основана на механизме обобщения — подсознательном, автоматическом и жизненно важном процессе, который помогает нам принимать решения каждый день. У Даниэля Канемана это называется «система 1». Но это также значит, что для чего-то важного, вроде книги, нужен кто-то, кто её перепроверит.
После редактуры и корректуры книга была опубликована, и я спокойно отправился дальше по жизни. Продал пару десятков экземпляров — потому что почти не рекламировал, — и на этом всё закончилось. Пока друзья и родственники не начали жаловаться, что не могут прочесть книгу, потому что она на английском.
Я говорю на трёх языках: венгерском, румынском и английском. Пишу преимущественно на английском. Во-первых, там нет никаких акцентов и умляутов — терпеть не могу многозначные клавиатуры. Во-вторых, на английском проще выразить мысль. Я свободно говорю, читаю и пишу на всех трёх, но литературно предпочитаю английский. Да и аудитория шире.
Когда я издавал роман, у меня была мысль сделать аудиокнигу. Но не думал, что первым делом попробую её не на английском.
Но, столкнувшись с проблемой потенциальных румынских слушателей, я решил наконец осуществить свою старую идею. Только не на английском, а на румынском. И тут возникло сразу несколько сложностей:
- У меня не было времени переводить собственную книгу, да и не факт, что я был бы в этом лучшим кандидатом. Нужен был переводчик. Пять лет назад у нас был только Google Translate, и он был, мягко говоря, паршивым. Сегодня у нас есть ИИ — и он удивительно хорош.
- Текст нужно было озвучить. Это я сам умею программировать. Пара строк на JavaScript — и можно запускать в браузере. Но звучит это, конечно, как робот, совсем не на уровне аудиокниги.
- В книге немало персонажей, значит, нужны разные голоса. То есть минимум с десяток актёров озвучки.
- Даже если бы у меня был готовый румынский перевод, я был бы худшим выбором для его озвучивания. Из-за врождённой расщелины неба и губ у меня довольно гнусавый голос. Может, это и добавило бы аутентичности книге — ведь она как раз про такого персонажа, — но слушателя это скорее отвлечёт. Хотя тут можно спорить и, возможно, в итоге будут две версии. Но главное — озвучить 300-страничную книгу требует кучи времени.
Итак, как сделать аудиокнигу — или хотя бы её прототип — дёшево? Правильно, с помощью ИИ. Что я и сделал. И тут всё становится не таким простым.
Этическая сторона ИИ
Когда я пишу код с помощью ИИ, я не отбираю чью-то работу. Я просто повышаю свою эффективность, избегаю багов и принимаю более обоснованные решения. В программировании ИИ-инструменты — это здравый смысл. А вот в писательстве и смежных вещах это уже не так однозначно, и я понимал это, когда регистрировался на Elevenlabs.
Идея аудиокниги крутилась в моей голове ещё до того, как вышла бумажная версия. Но звучала она либо дорого, либо трудозатратно. Актёры озвучки стоят тысячи долларов даже в эконом-варианте. А я хотел разные голоса для разных персонажей, а их в книге немало.
Самостоятельная озвучка, конечно, дешевле. Но требовала бы сотен часов работы, а голос у меня не самый подходящий. Да и опять же — это был бы один голос на все роли. Это тоже не вариант.
Elevenlabs решает эту проблему. Там целая библиотека голосов, можно даже записать собственный сэмпл. Есть голоса на разных языках, что мне было жизненно необходимо для румынской версии.
Уже к концу первой главы я понял, что заменил пятерых актёров подпиской за $22 в месяц.
Часть меня чувствовала себя дешевкой. Другая часть — понимала, что я сам финансирую эксперимент (и помогаю двоюродной сестре мамы). Корректуру я заказывал у профессионала. Обложку делал профессионал. Издательством занимался тоже профессионал. Всем им я с радостью заплатил.
А вот с аудиокнигой я всё ещё в стадии эксперимента. И сам инструмент, за который я теперь плачу, уже показал, в каких местах всё равно нужны живые актёры.
Хотя голоса впечатляют, звучат с нормальной интонацией, не роботизированы, выбор широк, есть проблемы:
- Моего персонажа зовут Sinéad (традиционное ирландское имя), и угадайте? Он его не может выговорить. Довольно раздражает, учитывая, что это один из главных героев.
- Громкость голосов разная. Пришлось вручную настраивать, чтобы уравнять их.
- Иногда я бы сам выбрал другой темп или расставил акценты по-другому.
А ещё, до Elevenlabs, мне пришлось перевести текст — что я сделал с помощью Microsoft Copilot. Тут возникает новая этическая серая зона. Когда я читал перевод, у меня возник образ мамы, которая осталась бы без куска хлеба, потому что я отдал эту работу машине.
Будучи автором оригинала, я мог оценить качество как перевода, так и озвучки.
И знаете, что особенно выбивало из колеи? Перевод на румынский был хорошим. Не идеальным, но хорошим. И это неприятно осознавать, потому что процесс был почти идентичен тому, как работала мама: она делала черновик перевода, затем редактор с командой доводили до ума. Теперь вместо неё это делал Copilot.
Да, иногда машина выбирала не то слово. Иногда снижала выразительность фразы — как и мама. В этой истории я был редактором и исправлял ошибки за пару минут.
Когда ИИ реально делает 80% работы
Мне неприятно это признавать, но это факт. Если бы мама жила сегодня, её работа исчезла бы. То, чем она зарабатывала, теперь делают машины. И, честно, я рад, что она этого не увидела. Но многие видят. И мир слишком самонадеянно требует, чтобы люди «приняли это и пошли учиться чему-то новому». Но это не так просто.
Хуже того, речь не только о потере работы. Это потеря смысла, потеря чувства полезности в семье и обществе. Это бьёт по психике так, как мы пока до конца не понимаем. Во времена промышленной революции никто о ментальном здоровье не думал. А сегодня это, возможно, самая серьёзная перемена для всех работающих людей на планете. Мы не знаем последствий масштабного внедрения ИИ.
Это не значит, что нужно уничтожить все серверы LLM и делать вид, что ИИ никогда не было. Но надо быть осторожными.
Я не боюсь роботов. Я боюсь, что люди сдадутся.
Когда у людей выбивают почву из-под ног, далеко не все поднимаются снова. Чем больше таких «не вставших» — тем хуже всем остальным. Эффект домино неизбежен. Но в отличие от домино, падение людей можно хотя бы попытаться спрогнозировать.
Что касается моей аудиокниги, я думаю, закончу обе версии — английскую и румынскую — с помощью Elevenlabs. Предполагаю, итоговые расходы составят около $500. Это не копейки, но и не миллионы. Для эксперимента, который я смогу выложить на Soundcloud, этого достаточно.
Но если эксперимент окажется удачным, мне всё равно придётся нанять актёров озвучки и настоящего переводчика. Возможно, в этом и есть назначение генеративного ИИ — для экспериментов, проверки жизнеспособности идей, а не создания конечных продуктов. Я могу с этим жить. Наверное, даже моя мама могла бы. Наверное…
VPN KOVALENKO - Знак качества и клиентоориентированности.
24/7 служба поддержки, высокая скорость, отсутствие рекламы,призы каждому пользователю.
Переходите по ссылке: https://t.me/Kovalenkovpn_bot?start=AHelwani