После запуска ChatGPT в 2022 году нейросети взлетели в популярности. Если до этого ИИ использовался только в отдельных сферах и инструментах, то теперь OpenAI — разработчик нашумевшего чат-бота — дал всем понять, что нейросети доступны каждому. И пользоваться ими тоже может каждый. И начать на них зарабатывать — не футуристическое будущее, а то, что происходит прямо сейчас.
В этой подборке самых трендовых нейросетей нет ChatGPT и Midjourney, потому что о них и так все знают. Если вы пришли сюда за ними, то много о них рассказывают спикеры университета «Зерокодер» на live-практикумах по ChatGPT и Midjourney. Практикумы бесплатные и с подарком для каждого участника.
Переводчик DeepL
DeepL — новое слово в сфере автоматического перевода. Нейросеть не просто переводит, но и делает это естественно, имитируя человеческую речь, а еще перестраивает предложение в более естественное, если заменить в исходном тексте хотя бы одно слово. Попробовав его однажды, к привычным автоматическим переводчикам вы уже не вернетесь. Тем более, что тестированием инструмента занималась команда профессионалов, которые в рамках слепого тестирования выбирали перевод от DeepL в четыре раза чаще аналогов.
DeepL переводит в том числе и с русского, и на русский. И улучшается с каждым днем — неудивительно, что его используют больше 500 млн человек.
Распознаватель речи Whisper
OpenAI известны в первую очередь созданием чат-бота ChatGPT, но у них есть и другие инструменты. Довольно интересный — Whisper, система распознавания речи с открытым исходным кодом. Это значит, что использовать и дорабатывать ее может кто угодно, развернув на своем сервере. Whisper делает транскрипцию и переводит, неплохо ориентируясь даже в профессиональном жаргоне и акцентах.
Обучали Whisper более чем на 680 000 часов мультизадачной и многоязычной речи. Впоследствии, как надеются разработчики, на основе их инструмента можно будет создавать и более совершенные нейросети по распознаванию аудиальной информации.
Генератор изображений DALL·E 2
Не Midjourney единым! DALL·E 2 — еще одно детище компании OpenAI и один из самых известных генераторов изображений. Как и Миджорни, он создает картинки в ответ на промты — текстовые запросы. Сгенерированные изображения впоследствии можно лицензировать и продавать, использовать для мерча, создания комиксов и видеоигр.
Отличительная особенность DALL·E 2 — возможность улучшать сгенерированную картинку, добавляя в нее тени, текстуры и блики при помощи специальной кисти.
Генератор анимированных аватаров Synthesia
Synthesia генерирует видеоролики, GIF-изображения и короткие анимации. Как это работает? Например, инструмент дает возможность выбрать реального человека, который «озвучит» загруженный текст, а при желании у Synthesia можно приобрести даже эксклюзивного цифрового клона. Идеальный вариант для брендов и для тех, кто не хочет или не может проводить полноценные съемки.
Работает нейросеть более чем на 60 языках, умело имитирует 120 акцентов. Если нужно, аватар может озвучить загруженный аудиофайл, предварительно обработанный ИИ.
Генератор видео Make-A-Video
Можно ли создать при помощи нейросети видео? Конечно, отвечают разработчики Make-A-Video. По текстовому промту инструмент создаст небольшой видеоролик, который легко превращается в GIF-изображение. Он идеально подойдет для иллюстрации статей или обмена реакшнпиками в социальных сетях.
Но и для более серьезной работы Make-A-Video тоже пригодится, потому что другая его фича — добавление динамики статичным картинкам.
Генератор музыки MusicGen
Если нейросети позволяют сгенерировать текст, картинку и видео, то почему они не могут создавать музыку? Ведь они могут — и MusicGen тому пример. По запросу система сгенерирует бесплатный 15-секундный семпл, а если оформить подписку на Hugging Face, то трек будет еще длиннее. Как и другие нейросети, он работает по текстовому описанию, но может переделать, дополнить и улучшить существующую песню. Скажем, превратить классическую композицию в поп-хит.
У MusicGen открытый исходный код. Любой может взять его и доработать, встроить в свою платформу или сделать что-то подобное.
Чат-бот Bard
Об аналоге Midjourney мы сказали, пора сказать пару слов и об аналоге ChatGPT. Встречайте Bard — нейросеть от Google, обученную на языковой модели LaMDA, а также на гигабайтах диалогов реальных людей. Именно поэтому сгенерированный им текст выглядит настолько естественно. И это факт: Bard умудрился ввести в заблуждение даже инженера Google Блейка Лемойна, который тестировал чат-бота на этичность.
Для генерации естественной речи Bard использует статистику — самые популярные фразы в том порядке, который будет наиболее вероятен.
Нейросетей тысячи, найти их все и попробовать — довольно сложно. Но вы можете получить список из 600+ самых популярных в подарок при регистрации на вебинар «Нейросети для всех» от команды университета «Зерокодер». Сам вебинар тоже бесплатный.
Время осваивать самое востребованное направление в IT!