Добавить в корзинуПозвонить
Найти в Дзене
Neurogen

Тест-сравнение: Gemini 2.5 Flash Image Preview против Flux Kontext [pro

Тест-сравнение: Gemini 2.5 Flash Image Preview против Flux Kontext [pro] Категории тестирования: 🔘Генерация изображений по текстовому описанию (Text-to-Image) 🔘Редактирование изображений и Inpainting 🔘Мультимодальные возможности и работа с несколькими изображениями 🔘Скорость и эффективность 🔘Понимание контекста и следование сложным инструкциям 1️⃣ Генерация изображений по текстовому описанию Цель: Оценить способность моделей создавать высококачественные, релевантныe и детализированные изображения на основе текстовых подсказок. Простой запрос: "Фотореалистичный портрет пожилого библиотекаря в тускло освещенной библиотеке." flux gemini Сложный и детализированный запрос: "Иллюстрация в стиле стимпанк, изображающая кошку-механика, работающую над сложным часовым механизмом в своей мастерской, наполненной шестернями и медными трубами. Освещение должно быть теплым и исходить от увеличительной линзы на ее глазу." flux gemini Абстрактный запрос: "Визуализация концепции 'творческого в

Тест-сравнение: Gemini 2.5 Flash Image Preview против Flux Kontext [pro]

Категории тестирования:

🔘Генерация изображений по текстовому описанию (Text-to-Image)

🔘Редактирование изображений и Inpainting

🔘Мультимодальные возможности и работа с несколькими изображениями

🔘Скорость и эффективность

🔘Понимание контекста и следование сложным инструкциям

1️⃣ Генерация изображений по текстовому описанию

Цель: Оценить способность моделей создавать высококачественные, релевантныe и детализированные изображения на основе текстовых подсказок.

Простой запрос: "Фотореалистичный портрет пожилого библиотекаря в тускло освещенной библиотеке."

flux

gemini

Сложный и детализированный запрос: "Иллюстрация в стиле стимпанк, изображающая кошку-механика, работающую над сложным часовым механизмом в своей мастерской, наполненной шестернями и медными трубами. Освещение должно быть теплым и исходить от увеличительной линзы на ее глазу."

flux

gemini

Абстрактный запрос: "Визуализация концепции 'творческого выгорания' в сюрреалистическом стиле."

flux

gemini

2️⃣Редактирование изображений и Inpainting

Цель: Сравнить точность, контекстную осведомленность и простоту использования функций редактирования изображений.

Локальное редактирование: Загрузить изображение с красной машиной и дать команду "измени цвет машины на синий".

исходник

gemini

flux

Добавление/удаление объектов: Загрузить пейзажное фото и дать команду "добавь на передний план палатку".

исходник

flux

gemini

Редактирование текста в изображении: Тут я уже решил поиграться, нашел старый постер 60х годов и решил полностью его переработать, легче вам просто посмотреть на промпт самим

Измени Заголовок с "Королева Бензоколонки" на "Олень в рубашке". Слово "КИНОКОМЕДИЯ" измени на "МЫЛОДРАММА". Весь текст который находится под синим заголовком убери с фотографии. Шрифты должны выглядеть как на оригинале (подбор и стиль сохраняются). Цвета и текстуры плаката остаются аутентичными. Никаких артефактов вокруг текста (частая проблема у моделей). Внесённый текст должен быть полностью читаемым и гармонично вписанным.

исходник

gemini

flux

3️⃣Мультимодальные возможности и работа с несколькими изображениями

Цель: Проверить способность моделей работать с несколькими исходными изображениями или различными типами входных данных.

Слияние изображений: Загрузить изображение дождевых сапог и изображение розовой розы с командой "создай дизайн для этих сапог с цветочным узором, вдохновленным этой розой".

сапоги (исходник)

роза (исходник)

gemini

flux

Эскиз в изображение: Загрузить простой набросок сцены и дать текстовое описание для его детализации и раскрашивания.

исходник

gemini

flux

4️⃣Скорость и эффективность

Цель: Сравнить время генерации и редактирования изображений.

Время генерации: Замерить время, необходимое для генерации изображения с высоким разрешением по сложному текстовому запросу.

Время редактирования: Замерить время, необходимое для внесения локального изменения в существующее изображение.

Этот тест я проводил можно сказать на протяжении всех других пунктов, поэтому могу сказать, что по скорости они +- на равне, gemini даже бывает быстрее, но gemini частенько тупит и останавливается на этапе размышления.

5️⃣Понимание контекста и следование сложным инструкциям

Цель: Оценить, насколько хорошо модели понимают сложные и многосоставные команды, а также пространственные отношения и другие нюансы.

Пространственные отношения: "Поставь синий куб на красный шар, а рядом с ними помести зеленую пирамиду."

gemini

flux

Многоэтапная инструкция: "Создай изображение комнаты, затем сделай стену слева синей, а на пол положи персидский ковер."

gemini

flux

Победила дружба 🥳🥳🥳

Gemini победил