Создание видео контента
Существует несколько достойных сервисов ИИ работающих с видео. Но, пожалуй, одним из самых быстроразвивающихся является нашумевший HeyGen.
HeyGen - это сервис, основанный на искусственном интеллекте, который способен переводить видео на различные языки, сохраняя при этом оригинальный голос и движения губ. Это первый подобный популярный сервис, который частично поддерживает русский язык: переозвучить на нем ничего нельзя, а вот с русского на английский, испанский, польский и другие — без проблем.
Изначально HeyGen был сервисом с виртуальными аватарами, которые озвучивают текст на разных языках. В соответствии с выбранным языком для цифрового персонажа генерируется мимика и движения губ. В сервисе есть свой видео редактор, где можно создать диалог между несколькими персонажами. На выбор даются как мультяшные герои, так и реалистичные модели людей.
В сентябре 2023 года HeyGen выпустили в бета-версию функции перевода видео. Для нее используется одновременно три технологии: перевод, дипфейк. Таким образом, получается полный дубляж с переводом на другой язык, но сохранением оригинального голоса.
С бесплатного аккаунта HeyGen можно перевести два ролика длительностью до 30 секунд или один на минуту. Поддерживаются форматы MP4, WebM и MOV. Важно, чтобы разрешение ролика находилось в диапазоне от 360×360 пикселей до 4096×4096 пикселей. Минимальная длина видео должна составлять от 30 секунд. В бесплатном режиме доступно всего две попытки, поэтому надо внимательно выбирать ролик для перевода.
Для перевода требуется пройти регистрацию на сайте сервиса. Сделать это можно с помощью аккаунта Google или электронной почты. После этого в окно браузера можно перетащить файл и нажать на кнопку Submit. Объём файла не должен превышать 500 Мб. Сейчас перевод и генерация одного короткого видео может занять несколько часов. Связано это с большим количеством желающих испытать возможности HeyGen. Ролики платных подписчиков сервиса переводятся в приоритетной очереди. Оплата возможна только картами зарубежных банков. Как открыть карту в Казахстане описали в данной статье.
Нейросеть не просто переводит речь, а старается подбирать конструкции, которые в своей речи используют носители. Благодаря этому сгенерированные ролики получаются живыми, как если бы над их адаптацией работали профессиональные переводчики.
Генерация картинок
Вы наверняка слышали или даже пользовались сервисами Midjourney, Kandinsky и прочими. Но возможно самым перспективным сервисом с широким набором как генерации, так и обработки изображений является Adobe Firefly.
Adobe Firefly - это новый набор моделей генеративного искусственного интеллекта (AI), разработанный Adobe. Этот сервис предназначен для создания высококачественных изображений, текстовых эффектов и свежих цветовых палитр с помощью генеративного AI и простых текстовых подсказок.
Firefly был впервые представлен в марте 2023 года и изначально сосредоточен на генерации изображений и текстовых эффектов. Он предназначен для работы с Adobe Creative Cloud, Document Cloud, Experience Cloud и Adobe Express, где создается и модифицируется контент. Сервис предлагает несколько моделей, каждая из которых адаптирована для работы с клиентами различного уровня навыков и технического образования, работающими в различных областях применения.
Первая модель, обученная на изображениях Adobe Stock, открыто лицензированном контенте и контенте общественного достояния, где истек срок действия авторских прав, предназначена для создания изображений высокого качества, безопасных для коммерческого использования.В октябре 2023 года Adobe выпустила следующее поколение моделей Firefly, включая Firefly Image 2 Model, Firefly Vector Model и Firefly Design Model.
Firefly Image 2 Model предназначена для создания высококачественных изображений, Firefly Vector Model объединяет графические и генеративные AI-навыки Adobe для создания следующего поколения высококачественных векторных изображений, а Firefly Design Model позволяет мгновенно создавать потрясающие шаблоны дизайна с новой функцией Text to Template в Adobe Express.
Adobe Firefly также интегрирован в Adobe Illustrator и Adobe Photoshop, предоставляя первые прорывные возможности генеративного AI в этом приложении, включая Generative Recolor, который магически ускоряет вариацию цвета. В будущем Adobe планирует развивать Firefly, добавляя возможности для работы с 3D и видео, а также создание векторов, кистей и текстур из нескольких слов или даже эскиза.
Сервис доступен в России через VPN, например VPN от Adguard.
Генерация текста
Вы уже наверняка слышали про ChatGPT, но использование его в России не очень удобно, так как требуется VPN, но и он, к сожалению, не всегда спасает от блокировки. Бесплатная версия ограничена информацией до сентября 2021 года. Сегодня расскажем об интересном сервисе Perplexity который доступен в России и использует в бесплатной версии тот же движок GPT 3.5 но с доступом в интернет.
Perplexity AI - это сервис, основанный на искусственном интеллекте, который функционирует как поисковый чат-бот. Он предоставляет ответы на запросы пользователей, указывая источники информации и предлагая похожие запросы. В отличие от классических поисковиков, Perplexity AI не предоставляет прямых ссылок на сайты, но пользователи могут просмотреть короткий или детальный ответ, а также работать с источниками - удалять их, добавлять новые и переходить по ссылкам.
Perplexity AI используется командами маркетинга и создателями контента для поиска релевантной информации по теме или создания уникальных текстов для публикации. В отличие от других AI, таких как ChatGPT, Perplexity использует информацию из современного интернета, а не образца 2021 года.
Вопросы можно задавать на любом языке, и ответ будет сгенерирован на том же языке. Ответы нейросети представляют собой скомпилированный материал из нескольких интернет-источников, выстроенный в логическую цепочку. Perplexity AI был основан в 2022 году и находится в США. Сервис предоставляется бесплатно и без регистрации, но с некоторыми ограничениями (5 бесплатных генераций каждые 4 часа). С платной подпиской в $20 эти ограничения снимаются и можно использовать новейший движок GPT 4.0 для более качественной генерации. Оплата возможно только картами зарубежных банков.
Кроме сайта, у Perplexity AI есть расширение для Google Chrome, которое позволяет, например, суммировать идеи из статей. Также стартап запустил бесплатное iOS-приложение.