Добавить в корзинуПозвонить
Найти в Дзене
Истории на экране

Как креативщики выбирают ИИ-модели по «характеру»

У нейросетей для генерации картинок и видео появились «личности». Нет, речь не о том, что Midjourney обзавёлся чувствами или Sora научилась обижаться на плохие промпты. Просто создатели контента начали относиться к разным моделям как к инструментам с характером — у каждой свои сильные стороны, причуды и фирменный стиль. Ещё пару лет назад выбор был простой: бери то, что работает. Сейчас же рынок генеративного ИИ разросся до невероятных масштабов. Google выкатил Veo 3 и Imagen 3, OpenAI продвигает Sora 2, Adobe развивает Firefly, а стартапы вроде Runway, Pika и Luma наступают на пятки гигантам. Конкуренция бешеная — каждая компания пытается сделать картинку детальнее, видео длиннее, а галлюцинации (ошибки генерации) реже. Вот и получается: когда все модели выдают приличный результат, выбирать приходится не по принципу «хоть что-то получилось», а по тому, какая нейросеть лучше справится с конкретной задачей. Тиффани Кязе, основательница AI Flow Club (сообщества, где учат работать с ИИ-

У нейросетей для генерации картинок и видео появились «личности». Нет, речь не о том, что Midjourney обзавёлся чувствами или Sora научилась обижаться на плохие промпты. Просто создатели контента начали относиться к разным моделям как к инструментам с характером — у каждой свои сильные стороны, причуды и фирменный стиль.

Ещё пару лет назад выбор был простой: бери то, что работает. Сейчас же рынок генеративного ИИ разросся до невероятных масштабов. Google выкатил Veo 3 и Imagen 3, OpenAI продвигает Sora 2, Adobe развивает Firefly, а стартапы вроде Runway, Pika и Luma наступают на пятки гигантам. Конкуренция бешеная — каждая компания пытается сделать картинку детальнее, видео длиннее, а галлюцинации (ошибки генерации) реже.

Вот и получается: когда все модели выдают приличный результат, выбирать приходится не по принципу «хоть что-то получилось», а по тому, какая нейросеть лучше справится с конкретной задачей.

Тиффани Кязе, основательница AI Flow Club (сообщества, где учат работать с ИИ-инструментами), говорит прямо: «Креативщики очеловечивают эти штуки. Называют одну «творческой», другую «дотошной» — потому что реально выстраивают с ними отношения. Это уже не просто софт».

Дейв Кларк, режиссёр и креативный директор студии Promise AI, объясняет подход профессионалов: «Каждая модель по-своему интерпретирует мир. Одни тяготеют к кинематографичности, другие — к сюрреализму или чему-то сновидческому. Моя задача — понять, как перевести творческое видение на язык промптов, чтобы добиться нужной эстетики».

А вот Александру Костин, вице-президент по генеративному ИИ в Adobe, раскрывает кухню изнутри. По его словам, на финальных этапах обучения модели можно «показать» ей определённый стиль — и она к нему адаптируется, фактически обретая характер. Одни разработчики намеренно делают модели «с мнением», другие стремятся к нейтральности.

Данные для обучения тоже влияют на «личность». Firefly от Adobe, например, тренировали на лицензионных изображениях с Adobe Stock — отсюда и характерный «стоковый» вид результатов. (В компании, кстати, работают над тем, чтобы сделать генерации более реалистичными.)

Итак, какой же характер у популярных моделей? Вот краткий гид:

Veo 3 от Google (видео): кинематографичность, естественное движение, высокое качество.

Flux (видео): мастер реализма, особенно в изображении людей.

Runway (видео): полноценная творческая студия для тех, кому нужен контроль над каждой деталью.

Sora (видео): хороша для экспериментов и поиска идей, плюс там своя соцсеть с мемами.

Midjourney (картинки и видео): самая творческая, идеальна для художественных и стилизованных работ.

Imagen 3 от Google (картинки): лучшая для сохранения консистентности персонажей, подходит для e-commerce и соцсетей.

Adobe Firefly Image Model 5 (картинки): юридически безопасные результаты для коммерческого использования.

К слову, у чат-ботов тоже есть свои «личности». ChatGPT известен приторной дружелюбностью (иногда раздражающей), Claude считается надёжным исследователем, а Gemini удобен для пользователей Google. Но у генераторов изображений и видео стилистические различия бросаются в глаза куда сильнее.

Работать сразу с несколькими моделями — не блажь, а практичный подход. Для короткометражки My Friend, Zeph команда Кларка использовала Adobe Firefly, Veo 3.1 от Google, Ray3 от Luma, а также классические Photoshop и Premiere Pro.

«Комбинируя модели, получаешь творческий диапазон и точность — как будто работаешь с командой специалистов, — объясняет Кларк. — Можно визуализировать мир истории намного раньше, быстрее перебирать варианты и принимать сильные креативные решения ещё до выхода на площадку».

Тиффани Кязе предупреждает: привязанность к одному инструменту — не лучшая стратегия. Те, кто добивается реальных результатов, «не верны инструментам — они верны целям». Когда каждая модель делает то, в чём сильна, работа идёт и быстрее, и качественнее.

Но тут есть нюанс: «личности» моделей — штука непостоянная. С каждым обновлением нейросеть, которая раньше провалила какую-то задачу, может внезапно начать с ней справляться. Так что репутация меняется.

Да, не все креативщики в восторге от ИИ — многие принципиально отказываются его использовать. Но для тех, кто готов экспериментировать, сейчас золотое время: выбор огромный, а понимание «характеров» разных моделей помогает не тратить время и деньги на неподходящие инструменты.

Кларк напоминает главное: «Человеческое выражение художника — наша личность и творческая точка зрения — вот что по-настоящему определяет результат. Дело не в замене традиционного процесса. Дело в расширении возможностей и приближении воображения к экрану как никогда раньше».