Пока вы читаете эту статью, их может стать больше
Пора мне уже завершать начатое и выполнять обещанное: последняя (на ближайшую перспективу, хотя кто знает) подробная публикация о работе с нейросетью Dream перед вами.
Все предыдущие вы можете найти в тематической подборке, сложенные аккуратной стопочкой. Читать в хронологическом порядке, снизу вверх.
Неохваченной осталась только тема художественных стилей, они же — различные генеративные модели. Иконки этих стилей располагаются в интерфейсе Dream стройными рядами рядом с окном ввода запроса. Но перебирать их по одному и рассказывать о каждом в отдельности я не буду.
Во-первых, это заняло бы неприлично много места. Во-вторых, это бесполезное занятие: мне за ними всё равно не угнаться. Всего пару недель назад их было 84, сейчас уже на 30 больше. Они плодятся, как комары в тайге, и одно только их количество способно вызвать ступор и панику.
По этой причине я собираюсь обратить ваше внимание только на самые основные моменты, а дальше вы уж сами. Чтобы вы лучше представляли себе характерные особенности каждого стиля, все без исключения картинки в этой статье сгенерированы по одному нехитрому запросу: a beautiful sad woman, Gothic style (красивая печальная женщина в готическом стиле).
Основных моментов, как я их вижу, всего три.
1. Цветовой код
Все стили в Dream делятся на три условных группы: платные (премиальные), бесплатные и экспериментальные (или недоработанные). По цвету, в который окрашено название стиля в мобильном приложении, можно определить, к какой группе он относится. Платные — фиолетовый с дополнением в виде иконки-звёздочки (и надписи Premium до кучи), бесплатные — розовый, экспериментальные — чёрный. В веб-интерфейсе разобраться немного сложнее, потому что названия и бесплатных, и экспериментальных стилей набраны одинаковыми белыми буквами.
С недавнего времени "фиолетовые" стили нас больше не интересуют, поскольку добраться до них, не оформляя подписки, теперь уже нельзя. Но этот материал у меня готовился давно, картинки копились, поэтому здесь я покажу примеры генерации с использованием в том числе и премиальных стилей. Вот, кстати, некоторые из них: VFX v2, Vector v2, Abstract Fluid v2 и Spring v2.
2. Всё небинарно
Цветовое деление — штука довольно расплывчатая. Некоторым "розовым" стилям стоило бы перекраситься в чёрный, поскольку они явно требуют серьёзной доработки. Есть и другой, более приятный, момент: иногда "фиолетовые" стили становятся "розовыми" (обратный процесс мне пока не встречался, и вряд ли он происходит). Бывает, что новые, недавно появившиеся модели сначала представлены как премиальные, а спустя какое-то время переходят в разряд общедоступных. Это хорошая тенденция, и я надеюсь, что она продолжится.
А вот и примеры: стили Dreamland v3 и Figure v3 сразу после появления в библиотеке немного побыли премиальными, но через пару недель разработчики отдали их народу бесплатно.
3. Премиальный — не значит хороший
Как бы странно это ни звучало, деление на "простые" и премиальные практически ничего не говорит об эстетических качествах изображения, которое вы сгенерируете с использованием того или иного стиля. Кто вообще определяет, будет ли стиль премиальным, мне не очень понятно. Иногда платные стили выдают чистый ужас, а бесплатные — прекрасные, безупречно отрисованные картинки. Правда, стили "экспериментальной" группы (чёрного цвета в мобильном приложении) выдают чистый ужас стабильно и бесперебойно. С другой стороны, всё зависит от ваших целей: для генерации эмоционально заряженных сюрреалистических абстракций это самое оно.
Снова пример: неудачные генерации с премиальными стилями Flat Design, The City, Illustrative и Unrealistic...
...и весьма достойные — с бесплатными стилями Dreamland v3, Gloomy, Anime v2 и Realistic v2.1:
Некоторые стили (напомню: это те же генеративные модели — как, например, в Leonardo) натренированы на создание строго определённого вида изображений. Не требуйте от них невозможного. Например, The City и Spectral рисуют только городские пейзажи в единственной и очень специфичной манере, а люди выступают там в лучшем случае в качестве с трудом узнаваемого реквизита, потому что рисовать людей они не обучены. Стиль Diorama неплохо изображает — вы угадали — диорамы, где люди обычно присутствуют очень условно, если вообще присутствуют. Недавно появившийся стиль Festive специализируется на рождественских пейзажах и нарядных ёлках, всё остальное — не про него:
Как со всем этим управляться
Итак, для того чтобы работа с Dream была эффективной и доставляла вам удовольствие, а не раздражение, могу посоветовать вот что:
- для начала перепробуйте все стили, чтобы понять, на что они способны. Иногда то, что кажется совершенно неподходящим по названию или по превью на иконке, выдаёт неожиданно хороший результат. Например, трудно было ожидать от стиля Horror Cut чего-нибудь хорошего, но посмотрите, как он справился! От стиля Cut вообще было непонятно, чего ждать, но результат тоже вышел весьма интересным:
- используйте Dream для создания иллюстраций. В фотореализме эта нейросеть пока не слишком сильна: немногие стили, особенно если исключить премиальные, умеют создавать фотореалистичные изображения. Зато множество бесплатных моделей способны создавать великолепные иллюстрации с имитацией самых разных художественных техник.
- учитывайте специализацию моделей. Узкая специализация, с одной стороны, не позволяет модели выйти за рамки единственного стиля, с другой — работать в этом стиле она умеет исключительно хорошо. Например, модель Figure v3 прекрасно генерирует пластиковые трёхмерные фигурки, The Absurd v2 имитирует работы средневековых голландских художников, а Baroque v3, соответственно, — работы живописцев эпохи барокко.
- выбирайте пропорции картинки в соответствии с возможностями модели. Некоторые хорошо справляются с генерацией вертикальных изображений с соотношением сторон 9:16, другие же начинают рисовать двухголовых существ, как, например, Retro Sci-Fi v2, Comic, Splatter или Street Art. Если вы видите дублирование элементов по вертикали — например, две головы одну над другой, — значит, модель обучалась на квадратном или горизонтальном формате изображения и не очень понимает, что ей делать с вертикальным. Вы можете продолжать мучить модель — авось повезёт, — или просто поменяйте формат на 1:1. Кстати, этот совет применим ко всем нейросетям, а не только к Dream.
Бонусный лайфхак: если вас раздражает сиреневый шильдик Dream в углу картинки, знайте, что использование Dream в веб-интерфейсе позволяет скачивать все картинки без него, и при этом совершенно бесплатно (в мобильном приложении эта функция строго платная).
Достаточно при скачивании выбрать пункт Background image, и картинка сохранится без логотипа:
Зато за сохранение видео, которое в мобильном приложении можно скачать бесплатно, веб-версия почему-то просит заплатить. Кажется, кто-то где-то что-то напутал, но это не наши проблемы.
На этом, пожалуй, о мобильной версии Dream совсем всё. Конечно, если произойдут какие-нибудь изменения, я этого так не оставлю и обязательно о них расскажу. Ну а пока переключусь на другие модели и платформы. В мире нейросетей ещё очень много всего интересного!