272 подписчика

Nano Banana Pro — лучший генератор изображений на базе ИИ. И это пугает

5 декабря 20255 дек 2025

5 мин

Про генерацию изображений с помощью нейросетей сейчас не говорит только ленивый. Но модели nano banana от Google действительно заслуживают внимания. Две версии — оригинальная (Gemini 2.5 Flash Image) и новая pro (Gemini 3 Pro Image) — появились всего пару месяцев назад, но уже успели перевернуть представление о том, на что способны ИИ-генераторы картинок. Pro-версия использует модель рассуждений Gemini 3. Это значит, что генерация занимает чуть больше времени, зато результат детальнее. А ещё можно добавлять в изображения читаемый текст — впервые в индустрии. Pro-версия, пожалуй, лучший инструмент для генерации изображений из всех, что мне доводилось тестировать. Но радоваться рано. Тестирование показало, насколько легко создавать ультрареалистичные картинки и инфографику с ложной информацией. Изображения из Gemini лишены типичных косяков нейросетевых картинок — это хорошо для креаторов. Но это же означает, что отличить реальное фото от сгенерированного станет намного сложнее. Google

Pro-версия использует модель рассуждений Gemini 3. Это значит, что генерация занимает чуть больше времени, зато результат детальнее. А ещё можно добавлять в изображения читаемый текст — впервые в индустрии. Pro-версия, пожалуй, лучший инструмент для генерации изображений из всех, что мне доводилось тестировать. Но радоваться рано.

Тестирование показало, насколько легко создавать ультрареалистичные картинки и инфографику с ложной информацией. Изображения из Gemini лишены типичных косяков нейросетевых картинок — это хорошо для креаторов. Но это же означает, что отличить реальное фото от сгенерированного станет намного сложнее. Google убирает водяной знак-искру с некоторых изображений, что только усугубляет проблему. Да, во все картинки встроен невидимый водяной знак SynthID, но технология его распознавания в Gemini слишком ограничена, чтобы реально помочь. Проблемы не новые, но возможности nano banana pro делают их ещё острее.

Работать с nano banana можно через Gemini напрямую или использовать расширенные настройки в Google AI Studio или Flow. Давайте разберёмся, на что способна эта штука.

Nano banana pro отлично справляется с реализмом и мелкими деталями. Честно говоря, некоторые изображения я бы не смогла сходу отличить от настоящих — и от этой мысли становится не по себе. Модель буквально стирает грань между реальностью и ИИ. И это, на минуточку, самая худшая версия этой технологии — дальше будет только круче.

Посмотрите на детализацию кожи на сгенерированных портретах. Никакого пластикового AI-вида. Такого уровня реализма нет ни у одного конкурента.

Картинки в Gemini по умолчанию генерируются в ландшафтном формате 16:9. Для других пропорций придётся зайти в AI Studio или Flow. Gemini отлично следует промптам — что попросишь, то и получишь.

Я попросила сгенерировать изображение спортивного табло с результатом баскетбольного матча. Gemini использовал макет ESPN, добавил логотипы, точно передал фирменные цвета команд, весь текст читается идеально. И даже добавил отражение лампы на экране телевизора. Вот эти мелочи и делают nano banana pro таким впечатляющим.

Есть и ограничения. Например, Gemini без проблем создал иллюстрацию по песне Mr. Brightside группы The Killers, но отказался делать что-то подобное по песням Тейлор Свифт — мол, нет доступа к контенту. При том что в поиске Google информации о Свифт вагон и маленькая тележка. Похоже, компания просто перестраховывается от обвинений в нарушении авторских прав.

Главный прорыв — способность создавать читаемый текст. Раньше корявые надписи были верным признаком ИИ-генерации. Теперь nano banana pro справляется с текстом на ура. И это, честно говоря, пугает.

Большинство созданных мной график были практически безупречны, но ошибки всё же попадались. Некоторые настолько мелкие, что сразу не заметишь — какое-нибудь бессмысленное слово при увеличении. Такие галлюцинации раздражают, но есть проблема посерьёзнее — когда модель начинает выдумывать факты.

Я попросила создать серию инфографик про новый iPhone 17. Эксперты по мобильным устройствам сразу заметили кучу ошибок. Gemini путал характеристики базовой и pro-версий, неправильно отрисовывал внешний вид телефона. Одно изображение вообще напоминало ранние мокапы, основанные на дизайне Google Pixel — как будто Pixel покрасили в оранжевый и прилепили логотип Apple. Я попросила Gemini ограничиться информацией с конкретной страницы сравнения характеристик — и всё равно получила картинку с ложными данными.

И вот в чём загвоздка: эти изображения выглядят убедительно. Если вы не разбираетесь глубоко в теме, которую просите визуализировать, можете и не заметить, что ИИ несёт чушь. Это одна из главных проблем чат-ботов, и она никуда не денется, пока генерация изображений опирается на их базы знаний.

Главная претензия к оригинальной модели nano banana касалась редактирования изображений — работало криво. Pro-версия исправила большинство косяков.

Nano banana pro отлично справляется с заменой фона. Я загрузила семейное фото с заснеженного футбольного матча и попросила перенести нас на стадион. Результат потрясающий — стадион воспроизведён точно, надписи чёткие, снег выглядит натурально. Несколько родственников на День благодарения купились на эту картинку (кстати, для тех, кто не в курсе — День благодарения в США отмечают в конце ноября, это что-то вроде нашего семейного застолья).

Попробовала также перекрасить фон на своём портрете и добавить направленное освещение. Оригинальная модель исказила затенённую часть лица, а свет ушёл мимо. Pro-версия справилась гораздо лучше — освещение естественное, лицо подсвечено правильно.

Единственное, что доводило до белого каления — удаление отражений. Задача объективно сложная. Pro-модель справилась лучше оригинала и действительно убрала отражение, но при этом исказила мелкие детали и лица. Может, следующая версия наконец пройдёт этот тест?

Редактирование в Gemini явно лучше, чем в оригинальной модели. Диалоговый формат удобен для тех, кто любит общаться с ИИ. Но полное отсутствие ручных инструментов редактирования — минус для тех, кто хочет контролировать процесс. Даже pro-версия справляется только с крупными правками, а многократные итеративные изменения ухудшают качество. Для тонкой работы лучше идти в Photoshop или Canva.

Сравним версии. Оригинальная модель быстрее — генерация занимает до 30 секунд против 50-120 секунд у pro. Оригинал подойдёт для быстрой генерации простых изображений. Pro — для сложного редактирования и инфографики, где нужны знания модели о мире. Обе версии бесплатны с возможностью апгрейда.

Nano banana pro вызывает восхищение. Некоторые результаты просто потрясающие — они укоренены в реальности так, как конкуренты вроде Midjourney и OpenAI и близко не могут. Но это же и пугает. Модель способна создать почти всё что угодно. И самое страшное — умение генерировать читаемый текст не означает умения выдавать достоверную информацию. Тут сочетаются лучшие стороны генераторов изображений и худшие стороны чат-ботов.

Pro-модель — мощный инструмент, и я уверена, что она быстро станет стандартом для всех, кто создаёт контент с помощью ИИ. Креаторы любого уровня найдут ей применение. Но меня беспокоит, что она станет и любимым инструментом злоумышленников — быстрым и простым способом создавать вредоносный контент, который мы не сможем сразу распознать как сгенерированный.

Когда изображения выглядят настолько убедительно, мы не будем автоматически сомневаться в их происхождении. Это проблема, особенно для инфографики. Неважно, что Gemini умеет создавать читаемый текст, если информация в нём — враньё. А когда мы бездумно листаем ленту в соцсетях, мы не всегда проверяем, что там написано мелким шрифтом. Это почва для путаницы, хаоса и дезинформации.

Nano banana pro — это будущее генеративных медиа. Но это будущее может оказаться опасным, если мы не будем осторожны.