Найти в Дзене

Новый телеграм-бот "Кандинского": что стало лучше, а что (пока) нет

Мнение, высказанное в этом материале, отражает субъективное восприятие автора блога и может не совпадать вообще ни с чем, включая намерения разработчиков "Кандинского". Несколько дней назад телеграм-бот нейросети "Кандинский" радикально обновился. Ну, по сравнению с его предыдущей версией любое обновление выглядело бы радикально, если учесть, что она имела всего одну стартовую кнопку, да и в целом выглядела очень минималистично. Но тут разработчики действительно расстарались, и в целом добавили в бота много хорошего. Правда, без неудачных решений тоже не обошлось. Посмотрим на обновлённого бота поближе. Однозначные плюсы Во-первых, главное меню получило назад весь функционал моделей 2.1, 2.2 и 3.0, включая режимы ControlNet (смешивание, перенос стиля, вариации). В предыдущей версии, чтобы воспользоваться этими инструментами, нужно было сначала переключиться на версию нейросети 2.2. Для работы с ControlNet и сейчас используется версия 2.2, но, по крайней мере, мы избавлены от лишних те
Оглавление

Мнение, высказанное в этом материале, отражает субъективное восприятие автора блога и может не совпадать вообще ни с чем, включая намерения разработчиков "Кандинского".

Несколько дней назад телеграм-бот нейросети "Кандинский" радикально обновился. Ну, по сравнению с его предыдущей версией любое обновление выглядело бы радикально, если учесть, что она имела всего одну стартовую кнопку, да и в целом выглядела очень минималистично. Но тут разработчики действительно расстарались, и в целом добавили в бота много хорошего. Правда, без неудачных решений тоже не обошлось.

Посмотрим на обновлённого бота поближе.

Однозначные плюсы

Во-первых, главное меню получило назад весь функционал моделей 2.1, 2.2 и 3.0, включая режимы ControlNet (смешивание, перенос стиля, вариации). В предыдущей версии, чтобы воспользоваться этими инструментами, нужно было сначала переключиться на версию нейросети 2.2. Для работы с ControlNet и сейчас используется версия 2.2, но, по крайней мере, мы избавлены от лишних телодвижений: при выборе одного из этих режимов переключение между моделями происходит автоматически.

Во-вторых, разработчики поняли, наконец, что некоторые люди сталкиваются с нейросетями впервые в жизни и могут растеряться, если им не выдать подробных инструкций. Поэтому новый бот под завязку набит доброжелательными советами и подсказками:

-2

Там, где это уместно, подсказки даже с картинками:

Пока вы настраиваете параметры генерации, текст вашего запроса и текущие настройки остаются у вас перед глазами, чтобы не приходилось перематывать диалог вверх:

-4

В целом налицо забота о пользователе и прогресс в UX-дизайне. Но всё же кое-где, как говорится, недожали.

Неоднозначные решения

Не знаю, как вам, а мне, как человеку, без проблем читающему слова, написанные буквами, обилие эмодзи только мешает. Одно дело — использовать пиктограммы, специально разработанные художниками-дизайнерами для быстрой визуальной передачи идеи, и совсем другое — натягивать сову на глобус, мучительно подбирая кое-как подходящие по смыслу разношёрстные смайлики, которые создавались вообще не для этой цели. Уберите текст, и по одним эмодзи вы не сможете понять, что хотели сказать разработчики. Впрочем, людям, воспитанным соцсетями, с ними комфортнее, наверное. Успокаивают.

Но это мелочи, а вот что и правда огорчило, так это сокращение количества доступных форматов картинок с пяти до трёх. Классические пропорции кадра исчезли, и теперь мы можем выбирать только между квадратом и широким (или высоким) экраном:

-5

Ещё одно сомнительное решение — попытка объяснить наглядно, как работает перенос стиля. Исходные картинки подобраны крайне неудачно: во-первых, не дают представления о том, как эту функцию можно применять с пользой, во-вторых, просто не соответствуют описанию, потому что с картинки с ягуаром на чихуахуа перенеслись не только цвета и стиль, но и ягуарова морда.

-6

И снова о хорошем

Закончить хочу на позитивной ноте, поэтому снова о положительных моментах. Во-первых, после того как вы настроили все параметры и нажали кнопку "Начать генерацию", весь ваш диалог с ботом уничтожается, и сообщение о начале генерации следует сразу за вашим оригинальным запросом:

-7

Это очень удобное и полезное свойство: чтобы добраться до предыдущих картинок, не придётся проматывать километры сообщений.

(Кстати, любопытно, что бот больше не предлагает перейти на сайт rudalle.ru.)

Во-вторых, после завершения генерации нам предлагается финальный набор кнопок, которых раньше в боте не было: например, кнопка быстрой повторной генерации по тому же запросу (раньше нужно было проходить весь процесс заново) и кнопка вызова меню параметров для изменения их на выбор. Это тоже очень удобно, и за это настройщикам бота отдельное спасибо.

-8

В общем и целом обновлённый бот стал удобнее и понятнее, чем был. Теперь дело за малым — выпустить новую версию "Кандинского", которая перестанет, наконец, уродовать руки.

Ждём с нетерпением.