Я рассказывал о том, что лучше не шутить с Папой Римским — так можно отлучиться от церкви остаться без нейросетей вовсе.
Но пора уже заканчивать траур по Midjourney.
Сейчас на просторах интернета столько достойных нейросетей, что можно выходить в свободное творческое плавание.
Как вы уже поняли, речь пойдет о нейросетях, которые создают изображения по текстовому описанию.
Каждый сервис вы можете использовать прямо сейчас, перейдя по ссылкам в статье.
Сравнивать будем по следующим критериям:
- Точность отображения запроса
Насколько точно нейросеть понимает ваш запрос, и как сложно добиться желаемого результата.
- Необходимость регистрации
- Скорость генерации
- Количество бесплатных запросов
- Разрешение изображения
Для того, чтобы результаты были объективными, я дам всем нейросетям одинаковую пару запросов (промптов).
Первый запрос
Практически все нейросети принимают запросы на английском языке. Необходимо перевести следующую фразу, которую я хочу получить изображением, на английский:
"Реалистичный суп-борщ в парижском ресторане с Эйфелевой башней на фоне,".
Borscht soup in paris restaurant with eiffel tower background, photorealistic, 4k
Добавил "фотореалистичный" и "4к", это часто используется для создания подобия фотографий.
Почему именно такой запрос? Интересно узнать, как нейросеть воспроизведёт легендарный борщ, что сделает с освещением и каким выйдет вид на башню.
Второй запрос
Вторым запросом я заказал концепт-арт. Он должен быть вдохновляющим и оригинальным. Я выбрал такую идею:
"Футуристичный Советский Союз в стиле Макото Синкай и Ghibli Studio, без людей, драматическое освещение, невероятное качество".
Futuristic Soviet Union by Makoto Shinkai and Ghibli Studio, no people, dramatic lighting, incredible quality
В запросе указан стиль рисования — мотивы Макото Синкай (режиссера и аниматора аниме "Твоё имя") и работы Ghibli Studio (авторов "Унесённые призраками").
И еще кое-что — отсутствие людей. Пусть будет чистая архитектура.
Посмотрим, как различные нейросети справятся с этими задачами.
Топ 10 — Craiyon
Craiyon (бывший DALL-E Mini) предлагает безлимитное количество бесплатных генераций пожизненно. Платные версии дают высокий приоритет и приватность. Из плюсов — показ сразу 9 картинок, которые не похожи друг на друга, что дает возможность развивать идею. Но, не смотря на это, тяжело увидеть качественный результат.
Вот лучшее, что удалось получить.
Борщ и Эйфелева башня есть, но не впечатляют.
Запросы я делал несколько раз, все время получалось что-то не то. Никаких намеков на Советский Союз среди множества запросов не нашел.
Craiyon:
- Тяжело получить удовлетворительный результат
- Можно без регистрации
- Бесконечно бесплатные запросы
- Генерация сразу 9 картинок
- Ожидание около минуты
- Разрешение до 1024х1024
Топ 9 — DeepAI
Генератор изображений DeepAI не имеет настроек, кроме выбора стиля, и работает только с регистрацией.
Мне так и не удалось выяснить количество бесплатных генераций, потому как ни в ценах, ни во время создания арта это не пишут.
Чтобы получить связку супа и фона в виде Эйфелевой башни, пришлось постараться. Число генераций подходило к 30, когда я получил на выходе картину на стене вместо фона, и остановился на этом. Но она сохранилась только в маленьком разрешении, а самое страшное я узнал чуть позже.
НЕТ истории запросов, и ничего не сохраняется.
С футуризмом и аниме стилем всё оказалось лучше, чем с Эйфелевой башней.
Есть отрицательный момент — сервис привязан только к имеющимся стилям, и от них нельзя отказаться. Чтобы разблокировать все, необходимо заплатить. Также платная подписка дает возможность видеть зацензуренный контент.
DeepAI:
- Нормальные результаты получились после 30+ попыток
- Нужна регистрация
- ? картинок в день
- Генерация по одной картинке
- Ожидание 5-10 секунд
- Разрешение до 2048х2048
Топ 8 — Playground
Playground был для меня чем-то абсолютно непонятным. От ужасных промахов до впечатляющих результатов в этом сервисе может быть всего одна кнопка "Generate". Для бесплатного аккаунта на выбор есть 3 модели искусственного интеллекта: Playground, Stable Diffusion v1.5 и Stable Diffusion v2.1. Я попробовал каждую.
С борщом вышло очень неоднозначно. Сложно поверить, что это генерации одной нейросети без изменения запроса. Рассмотрите картинки и посудите сами.
Запрос с футуризмом вышел неплохо, есть намёк на несбывшийся Дворец Советов, а еще тут нет людей, с этим у большинства нейросетей есть проблемы.
Playground:
- Очень сложно составить запрос, чтобы получить стоящий результат
- Обязательна регистрация через Google почту
- 1000 картинок в день
- Генерация по одной картинке
- Ожидание 5-30 секунд (зависит от настроек)
- Разрешение до 1024х1024
Топ 7 — Dream
Dream by Wombo также доступно для скачивания на телефон. Интерфейс и возможности одинаковые с веб-версией.
Пока генерируешь картинки, видишь заблокированные три окна из четырёх — просят купить премиум. Имеется довольно широкий выбор стилей, даже в бесплатной версии.
Все нейросети я сравниваю по соотношению сторон 1:1, а в сервисе Dream невозможно сделать квадратные картинки, поэтому пришлось их обрезать.
Очень долго пришлось ждать, пока Эйфелевы башни перестанут появляться в количестве двух и более штук. Не мог решить, какой результат лучше из двух борщей, поэтому покажу оба (на фоне второй картинки есть ещё одна башня).
Стильно и по-анимешному — получил, что заказывал.
Dream
- Результаты удовлетворительные
- Обязательна регистрация через Google почту
- Безлимитная генерация
- Генерация по одной картинке
- Ожидание 5-15 секунд
- Разрешение до 960х1568
Топ 6 — StarryAI
Сервис StarryAI предоставляет два варианта генераций, которые мне нужны: художественные арты и реалистичные фотографии.
Вместо лимита на количество генераций идёт трата кредитов. Ценник за одну генерацию довольно кусачий (15-40 центов). Раз в сутки можно бесплатно забрать 5 кредитов. За данную валюту можно либо генерировать новые картинки, либо тратить их на эволюцию арта и улучшение разрешения.
Близко к фотографии, но смазанная башня портит ощущение реальности.
Результат близок к запросу. Стиль аниме и намёки на что-то советское есть.
Starryai:
- Обязательна регистрация через Google почту
- 5 бесплатных кредитов в день
- Генерация по 4 картинки
- Ожидание около 20 секунд
- Качественные картинки с промахами чередуются в непонятном порядке
- Разрешение до 8192х10240