Искусственный интеллект может упростить жизнь и избавить нас от рутины. К сожалению, не все ИИ бесплатные, также меняются условия пользования. Однако, с каждым днем их становится все больше, а значит есть выбор даже среди отечественных. Давайте сравним нейросети для генерации изображений на реальных примерах и посмотрим какие из них удобнее в 2024 году.
Для этого будем генерировать простой запрос: "Жираф веселиться в зоопарке". Ну как, вы уже представили? Нужно показать жирафа на фоне зоопарка и передать эмоцию веселья. Всего три слова. Посмотрим, как смогли сгенерировать этот запрос наиболее часто рекомендуемые нейросети и оценим их работу. Начнем с российских ИИ:
1. Kandinsky 3.1 - проект, сервис и приложение компании Сбер, с помощью которого пользователи могут генерировать изображения по текстовому описанию с помощью нейросетей, первая версия выпущена в 2022 году. Новинка от разработчиков - свежая версия Kandinsky умеет бесплатно генерировать не только картинки, но и короткие видео за несколько секунд. Необходима предварительная регистрация. Посмотрим, как она справится с нашим запросом.
Жираф нарисован неплохо, но не хватает зоопарка и не видна эмоция веселья. Хотя вторая попытка удалась ощутимо лучше, можно сказать жираф улыбается.
2. GigaChat - чат от компании Сбер, впервые выпустили в 2023, который умеет писать тексты, отвечать на вопросы и создавать картинки. GigaChat основан на нейросетевом ансамбле NeONKA, в который входят модели ruGPT-3.5 с 13 млрд параметров, Kandinsky 2.1, ruCLIP и FRED-T5. Хорошо владеет русским языком, достаточно быстро выдает ответы на вопросы. Бесплатную нейросеть можно использовать как генератор простых статей, слоганов или объявлений. Требуется вести номер телефона для регистрации.
Жираф нарисован лучше. Мне он показался более детально прорисован и деревья вокруг более объемные, но опять не хватает зоопарка и не видна эмоция веселья. Также как и у Kandinsky 3.1 вторая попытка удалась ощутимо лучше, жираф тоже будто бы улыбается.
3. YandexGPT - нейросеть семейства GPT от компании Яндекс, выпущенная в 2023 году, которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем. Иногда плохо понимает контекст запроса, нужно ему еще дать время для развития. Очень просто использовать, регистрация не нужна. Посмотрим, как она справится с нашим запросом.
Сложно оценить данную работу. Жираф получился очень абстрактный, возможно, ему даже весело. Давайте, поддержим усилия команды YandexGPT. Здорово, что они развивают еще одну свою собственную модель и она проявляет гибкость в запросах. Ждем обновлений!
4. Шедеврум - также проект приложение компании Яндекс, выпущенный в 2023 году, с помощью которого пользователи могут генерировать изображения и видео по текстовому описанию с помощью нейросетей. Изображения генерируются по методу каскадной диффузии: сначала в соответствии с запросом создаётся картинка, а затем поэтапно увеличивается её разрешение и происходит насыщение деталями. Представляет собой социальную сеть, где можно поделиться удачными изображениями и вдохновиться. Доступ можно получить, войдя в свой аккаунт Яндекс. Доступно 5 генераций в день.
Жираф нарисован достаточно реалистично. Давайте, обсудим первую попытку. Она показалась мне интереснее. Ведь на заднем плане появляется долгожданный зоопарк, который неплохо прорисован. Единственное, кажется, что у жирафа на заднем плане отсутствует шея и есть лишние ноги, также бревно слева тоже немного имеет форму жирафа. В целом картинка достаточно органична. Не видна эмоция веселья, жираф выглядит грустным.
Порфирьевич - чат для генерации продолжения текста, создана еще в 2019. Говорят, что иногда получаются интересные и вполне осмысленные истории, что может быть полезно для писателей. Работает Порфирьевич без регистрации. Нарисовать он нам ничего не сможет, может быть хотя бы повеселит.
- Итак, вводим запрос: "Нарисуй: Жираф веселиться в зоопарке"
- Порфирьевич продолжает: "! Пастернак: Веселиться всегда и везде. И совсем не важно — где."
Кажется, Порфирьевич любит литературу и стихи, можно с ним на эту тему поговорить.
Итак, подведем итоги:
- "показать жирафа" - побеждает Шедеврум за самого четко прорисованного жирафа
- "показать зоопарк" - побеждает Шедеврум, единственная ИИ, которая не забыла добавить зоопарк
- "передать эмоцию веселья" - побеждает Kandinsky 3.1 за самую широкую улыбку жирафа
Дорогие читатели, как вам полученные результаты? Знаете ли вы еще бесплатные российские нейросети, которые не рассматривались в данном испытании?
Спасибо, что дочитали до этого места! Если вам понравился мой контент, и вы хотите меня поддержать, то лучший способ:
- Поставьте лайк 👍 и напишите комментарий 💬 ниже.