Найти в Дзене

Где будем рисовать? Выбираем нейросеть под задачу.

Предыдущая публикация, где мы прошлись по флагманам нейросетей, генерирующих изображения, получилась очень объемной, поэтому краткий итоговый обзор, для каких задач лучше выбрать ту или иную нейросеть, я решила вынести отдельно. Но прежде краткие характеристики каждой нейросети, которые я по крупицам собирала из их описаний, а потом попросила дополнить недостающие у своих помощников Chat GPT и Deepseek. Получился такой список:
Midjourney — художник.
Nano Banana Pro — коммерческий фотограф.
GPT Image 1.5 — внимательный ассистент.
FLUX.1 Pro Ultra — технологичный фотореалист.
Adobe Firefly — дизайнер в Photoshop.
Qwen-Image-2.0 — мастер текста в кадре.
Seedream 4.5 / 5.0 — креативный продюсер.
Playground v3 — универсальный дизайнер.
Ideogram 2.0 — типограф.
Imagen 4 — инженер-реалист.
Stable Diffusion 3.5 — свободный экспериментатор.
А теперь, наконец, главное: Нужна фэнтези-иллюстрация или концепт-арт с атмосферой?
Берем Midjourney V7. Это золотой стандарт художественной эстетики, а
Оглавление

Предыдущая публикация, где мы прошлись по флагманам нейросетей, генерирующих изображения, получилась очень объемной, поэтому краткий итоговый обзор, для каких задач лучше выбрать ту или иную нейросеть, я решила вынести отдельно.

Но прежде краткие характеристики каждой нейросети, которые я по крупицам собирала из их описаний, а потом попросила дополнить недостающие у своих помощников Chat GPT и Deepseek. Получился такой список:

Midjourney — художник.
Nano Banana Pro — коммерческий фотограф.
GPT Image 1.5 — внимательный ассистент.
FLUX.1 Pro Ultra — технологичный фотореалист.
Adobe Firefly — дизайнер в Photoshop.
Qwen-Image-2.0 — мастер текста в кадре.
Seedream 4.5 / 5.0 — креативный продюсер.
Playground v3 — универсальный дизайнер.
Ideogram 2.0 — типограф.
Imagen 4 — инженер-реалист.
Stable Diffusion 3.5 — свободный экспериментатор.

А теперь, наконец, главное:

Куда идти с той или иной задачей?

Нужна фэнтези-иллюстрация или концепт-арт с атмосферой?
Берем Midjourney V7. Это золотой стандарт художественной эстетики, а версия Niji 7 идеальна для аниме.

Хотим реалистичный интерьер или предметную съёмку?
Выбираем Nano Banana Pro или Imagen 4 - они дают безупречный фотореализм и идеально работают со светом.

Надо сгенерировать групповой портрет (несколько человек)?
Берем Nano Banana Pro или GPT Image 1.5, они лучше других сохраняют лица при переносе в новые сцены.

Делаем постер, афишу или приглашение — нужен текст внутри картинки.
Наш выбор - Qwen-Image-2.0 (отлично пишет по‑русски и по‑китайски) или Ideogram 2.0 (для западной типографики).

Хотим комикс или раскадровку с текстовыми пузырями.
Midjourney - если важен стиль и художественность.
Qwen-Image-2.0 - если важны читаемые реплики и текстовые элементы.

Нужна реклама одежды или фото товаров для маркетплейса.
Используем Nano Banana Pro или Seedream для идеального фотореализма или FLUX.1 Pro Ultra, если нужна печатная детализация.

Делаем логотип и фирменный стиль.
Отлично подходят Ideogram 2.0 или Qwen-Image-2.0(работа со шрифтами) и Adobe Firefly 5 (если потом дорабатываем в Illustrator).

Хотим отредактировать фото - заменить фон, убрать объект, отретушировать.
Самые дружелюбные редакторы у GPT Image 1.5 и Qwen-Image-2.0 — понимают команды на обычном языке. Но для редактирования фото есть другие более мощные и специализированные нейросети, например, Evoto и Topaz, мы к ним еще приблизимся.

Готовим баннер или постер для печати - нужно очень большое разрешение.
Это задача для FLUX.1 Pro Ultra или Imagen 4. Потому что дают высокое разрешение и детализацию.

Просто хотим быстро накидать идей, мудбордов, поэкспериментировать.
Идеальный старт - Playground v3: простой интерфейс, много бесплатных генераций и доступ к разным моделям в одном окне. Для сбора идей, мудбордов, а также ассоциативных карт есть свои инструменты, я пока до них не дошла.

Нужна научная или техническая инфографика со схемами и подписями.
Берем Qwen-Image-2.0 (понимает сложные инструкции) или Seedream 5.0 (умеет искать актуальные данные в интернете).

Важно точно попасть в брендовые цвета (RGB).
У Playground v3 есть уникальная возможность управлять конкретными цветами благодаря архитектуре Deep-Fusion.

Хотим полную свободу: скачать модель, дообучить, запустить локально.
Наш выбор - Stable Diffusion 3.5 Large. Открытый код, гибкость, но потребуются навыки и мощный компьютер.

А если совсем нет денег?
Пробуем Qwen-Image-2.0 (бесплатный чат) или Playground v3 (10 изображений каждые 3 часа бесплатно) - этого хватает для большинства экспериментов. Кроме того есть бесплатные версии российских нейросетей Kandinsky и Шедеврум (к ним мы обязательно вернемся)

Куда пойти дальше? Я вижу такие направления:

  1. Пройтись по бесплатным нейросетям. Сделать список и посмотреть возможности.
  2. Пройтись по нейросетями доступным в России. Возможно этот список будет совпадать с предыдущим пунктом.
  3. Разобраться с использованием Stable Diffusion. Для меня это просто вызов, потому что open sourсe.
  4. Рассказать о персонализации в Midjorney
  5. Поискать забавные и нишевые сервисы.