Найти в Дзене
Heavy Frame

Fusion Brain. Нейросети как на ладони

Оглавление
Гора Ёжиков нарисована во Fusion Brain.
Гора Ёжиков нарисована во Fusion Brain.

Приветствую Господа и Дамы. Представляю вашему вниманию проект Fusion Brain, который может быть для многих полезным. Генерация изображений без регистрации и СМС.

А подробнее?

Вот сайт с красивым дизайном и инструкцией к пользованию, всё как положено. Позволю себе процитировать «О проекте»:

FusionBrain.AI – это интерактивный портал, где команда Института AIRI планирует собирать и выкладывать креативные ИИ-модели со всего мира, чтобы каждый мог попробовать современные инструменты и освоить новые технологии. Первой стала генеративная модель Kandinsky. Мы взяли открытый исходный код модели и сделали для вас простой интерфейс.

Что за институт? Быстро попадаем на этот сайт.

Сайт AIRI.
Сайт AIRI.

AIRI - научно-исследовательский институт искусственного интеллекта. Вся информация в открытом доступе, контакты есть, адреса Московские. Рекомендую полазить по сайту.

Контакты и адреса AIRI.
Контакты и адреса AIRI.

Kandinsky — разработка Сбера. На момент создания этого материала, вышел Kandinsky 2.2. Тем, кто интересуется технической частью, вот статья с подробностями на Хабре «Kandinsky 2.2 — новый шаг в направлении фотореализма».

Теперь о погоде… то есть о самом вкусном

Напомню, заходим на сайт Fusion Brain. Жмём «Открыть редактор» в верхнем правом углу.

Главная страница сайта Fusion Brain.
Главная страница сайта Fusion Brain.

Интерфейс упростили до предела. На столько, что все инструменты с пояснениями к ним помещаются на одном скрине.

Обзор интерфейса с обозначением.
Обзор интерфейса с обозначением.

Всё что от Вас требуется: выбрать рамку, выбрать стиль, ввести запрос. Кстати, доступны 21 вариант стилей, так что рекомендую экспериментировать.

🌍 Группа "Heavy Frame" в ВК

Например, пишу: «Кот-робот сидит на крыше дома на фоне ночного города», стиль «Киберпанк», жму «Создать».

Генерация по запросу: «Кот-робот сидит на крыше дома на фоне ночного города», стиль «Киберпанк».
Генерация по запросу: «Кот-робот сидит на крыше дома на фоне ночного города», стиль «Киберпанк».

Пишу: «Audi TT на фоне леса», стиль «Детальное фото», жму «Создать». Результат впечатлил.

Генерация по запросу: «Audi TT на фоне леса», стиль «Детальное фото».
Генерация по запросу: «Audi TT на фоне леса», стиль «Детальное фото».

Как пользоваться рамкой?

Рамку можно двигать, уменьшать/увеличивать. Изображение генерируется внутри неё. Если граница пересекает уже созданное, то при дальнейшей работе будет учитываться содержимое. Никто не запрещает создавать целые конструкции генерируя картинку мелкими частями. Мы ограничены только фантазией.

Например, хочу дорисовать фон к Audi. Сдвигаю рамку и пишу запрос: «Лес, дорога, над деревьями город, небо ясное, солнце», жму кнопку«Создать». Если результат не нравится, то можно снова нажать «Создать».

Демонстрация принципа работы с рамкой.
Демонстрация принципа работы с рамкой.

Как пользоваться ластиком?

Чтобы заменить автомобиль, беру «Ластик», обвожу автомобиль и пишу новый запрос.

Выделение автомобиля "Ластиком".
Выделение автомобиля "Ластиком".
Результат замены автомобиля на Ладу Весту.
Результат замены автомобиля на Ладу Весту.

Иногда отлично работает, а иногда… Странно что Audi TT похожа на реальную, а «наша» Лада Веста рисуется мутантом.

Можно ли редактировать свои фото?

Тестируем. Я загрузил своё фото, максимально простое т. к. задний фон легко отделялся даже вручную. Пробуем заменить. Алгоритм действий: беру «Ластик», обвожу задний фон, выбираю стиль, пишу запрос.

Результат замены заднего фона на фотографии.
Результат замены заднего фона на фотографии.

Со второй попытки выдало классный результат. Справедливости ради, отмечу, что специально сделал грязную обводку чтобы посмотреть как дорисуется обратно. Особенно видно по волосам, совсем ненастоящие. Если задача создать креатив, то можно найти интересные идеи. Однако, если нужна профессиональная обработка, нет, не сейчас.

Результат генерации: «Я + Роберт Дауни-младший».
Результат генерации: «Я + Роберт Дауни-младший».

Тестовая замена лица показала, что Роберт Дауни-младший из меня так себе.

Выводы

Тест на количество пальцев пройден.
Тест на количество пальцев пройден.

Человеческая рука похожа на человеческую руку. Пальцы... научились рисовать пальцы.

На сегодняшний день, а именно 03.09.2023, Kandinsky ощущается сырым. Важное уточнение: разработка Сбера в роли догоняющего и развивается очень быстро. То что есть сейчас, работает на две головы лучше чем буквально несколько месяцев назад. Более того, предоставили возможность опробовать новые технологии, научиться пользоваться, следить за прогрессом бесплатно. Нам остаётся наблюдать. Во что это вырастет?

Делитесь в комментариях что получилось создать именно с вашей фантазией, будет интересно посмотреть. Не прощаюсь.

👉 Можно ещё почитать/посмотреть:

  • 📗 Что думает ИИ про «Рунет 2.0»?
  • 📗 Беспроводная зарядка: ответы на Ваши вопросы здесь
  • 🎥 Easy Fire Tools. Управление Smart TV со смартфона