Проект из Кремниевой долины на базе Stable Diffusion
Как бы ни были мне близки и понятны привычные и практически уже родные "Шедеврум", "Кандинский", Leonardo AI, а теперь ещё и Dream, на них одних свет клином не сошёлся. Поэтому время от времени я выхожу на просторы Интернета поохотиться на новые, неопробованные пока нейросети — чтобы найти, изучить и приручить, а попутно рассказать об этом здесь со всеми подробностями.
Важная деталь: эти нейросети должны быть доступны для всех читателей блога. Это означает в первую очередь, что они должны работать для всех пользователей без ограничений, а если это зарубежные модели — быть полностью или частично бесплатными.
В одну из таких вылазок около месяца назад мне попалась совсем ещё юная KREA. Альфа-версия, практически детёныш нейросети. Отцы-создатели, новоиспечённые калифорнийцы Диего Родригес и Виктор Перес (можете посмотреть на этих весёлых юношей вот тут), никого пока просто так к ней не подпускали, однако собирали заявки на посадочной странице проекта от всех желающих получить ранний доступ.
Особых надежд на получение разрешения у меня не было, но заявка на всякий случай улетела к разработчикам. К моему удивлению, спустя пару недель в почтовом ящике лежало приглашение присоединиться к "закрытой бета-версии KREA".
Сейчас, спустя ещё две недели, никакой закрытости уже нет, и все желающие могут пользоваться KREA совершенно свободно.
Что такое KREA?
Пока что KREA, по сути, представляет собой одну-единственную нейросетевую модель на основе движка Stable Diffusion. Поэтому прежде всего Виктор и Диего просят пользователей поактивнее создавать, то есть тренировать, свои собственные модели, чтобы, эм-м... расширить модельный ряд.
Другими словами, чтобы у KREA появились собственные уникальные стили.
По состоянию на сейчас домашняя страница проекта выглядит довольно аскетично:
Единственное, что привлекает здесь внимание, — кнопка с просьбой купить подписку. Лента сообщества уже намного веселее:
А внешний вид страницы генерации зависит полностью от вас и от того, что вы там нагенерировали:
Как видите, настройки и прочие инструменты пока в суровом дефиците. Всё, что вы можете выбрать, — это пропорции картинки (1:1, 4:3 или 3:4), а также показатель Guidance scale, который регулирует степень соответствия изображения вашему запросу (чем он выше, тем точнее нейросеть будет следовать вашему описанию). В выпадающем меню Engine (движок) пока только один пункт — Stable Diffusion, а в мире графических нейросетей это всего лишь одна из основ, базовая модель.
Именно поэтому картинки KREA пока так похожи на генерации других площадок: например, Prompt Hunt или Playground, с характерной низкой контрастностью и приглушённой палитрой цветов (вспомните заодно "Кандинского" 2.1 и TurboText). Тем не менее KREA умеет рисовать в разных стилях: векторная иллюстрация, фотография (включая ретро), цифровая живопись, акварель, рисунок тушью и много чего ещё. Вы можете уточнить нужный вам стиль в запросе, а если вы этого не сделаете, то нейросеть выберет какой-то один или несколько стилей произвольно.
Ну и, разумеется, говорит KREA только по-английски. За один заход генерируется четыре картинки, а ограничений по использованию пока нет вообще. Да, и ещё: вы не можете удалить сгенерированные картинки, такой опции просто нет. При этом скрыть их вы тоже пока не можете: все они автоматически попадают в общую галерею. Так что аккуратнее там.
Поскольку на этом рассказ об особенностях KREA практически завершён, осталось полюбоваться собственно на результаты её трудов. Не забывайте, что это всего лишь начало пути, вполне возможно — долгого и успешного.
***
Читая материалы на моём канале, пожалуйста, обращайте внимание на дату публикации и номер версии программы, если он указан. В мире нейросетей изменения происходят постоянно, и информация может устаревать очень быстро.