Найти в Дзене
Закрытая книга

Может ли нейросеть заменить иллюстратора: вынужденный эксперимент «Закрытой книги»

Оглавление

А всё началось с того, что от меня ушла художница. До этого — был полностью убеждён, что ИИ не более, чем бесполезный хипстерский бред, которому до практического применения ковылять ещё лет так десять... Но реальность внесла свои коррективы.

Как я познакомился с ИИ

Раньше, все те два года, что я вёл канал — мне помогала художница Аня. Её работы в крайне узнаваемом стиле вы могли наблюдать во многих старых статьях... Но потом наступило 24 февраля, и мир сорвался с нарезки. А она из Таллина, со всеми вытекающими последствиями.

Вот одна из её зарисовок, как пример
Вот одна из её зарисовок, как пример

С блокировкой же Нельзяграма и Pixabay, откуда можно было брать фотографии — я оказался перед фактом: с таким трудом возрождённый канал снова оказался на грани. На сей раз — из-за дефицита иллюстраций.

Но тут-то на помощь и пришли нейросети

Я вынужденно начал изучать тему, и пришел к выбору из двух стульев: Midjorney от каких-то буржуев и Kandinsky от родного-доброго «Сбера». Оба условно-бесплатные, но со своими «граблями».

Как это работает. Сравнивая две нейросети

Общий принцип тут предельно прост: «курицы — входят, пироги — выходят». В смысле, текст — входит, а на выходе мы получаем от четырех до девяти вариантов уникальных изображений, каждое из которых можно увеличить и доработать.

«сырой» результат работы нейросети
«сырой» результат работы нейросети

Kandinsky: удобный, но медленный отечественный вариант

Изделие отечественных программистов всем хорошо. Рисует, пожалуй, наиболее детально, выдает результат в высоком разрешении, и даже умеет работать с русским языком... Полностью бесплатно без каких-либо ограничений, наконец.

Единственная не текущий момент нейросеть, способная корректно работать в плакатном стиле
Источник: rudalle.ru/check_image/48e7786e-0918-4ebc-a610-b3e76ef22dcd
Источник: rudalle.ru/check_image/48e7786e-0918-4ebc-a610-b3e76ef22dcd

Но есть и минусы, не позволяющие мне однозначно рекомендовать именно этот вариант:

  • Артефакты. Они есть и крайне заметны, результирующее изображение порой приходится крайне существенно «дорисовывать» и править в фотошопе.
  • Жесткая привязка к мобильному приложению «Салют». Которое просто невыносимо тормозит, вне зависимости от того, запущено ли на эмуляторе либо «реальном» железе.
  • Не менее невыносимая скорость (точнее, медленность) работы. На генерацию одной «сетки» из девяти картинок уходит до двадцати минут, на увеличение — ещё пять-десять.
  • Необходимость указывать ссылку на то, что это работа нейросети

Но есть ведь и альтернатива, верно? Midjorney, недавняя новинка от «западных партнёров». О ней тоже есть что сказать.

Midjorney: подарок от западных партнеров с ароматом нарушенией лицензионного соглашения

Однозначное преимущество Midjorney — красота изображений, ей генерируемых
Однозначное преимущество Midjorney — красота изображений, ей генерируемых

У этой «нейронки» есть несколько ярко выраженных плюсов:

Во-первых, практически полное отсутствие артефактов взамен на размытость картинки, помноженная на вариативное соотношение сторон. В некоторых случаях это позволяет буквально взять результат и закинуть в статью.

Во-вторых — наличие «ленты», где можно выцеплять удачные генерации таких же бедолаг, как и ты.

И, в третьих, непревзойдённая скорость работы. От вводной строки до результата — меньше минуты.

Но и «грабли» тут свои, не менее существенные:

  • Вопрос не бесплатный. «На халяву» можно сгенерировать примерно 20 картинок, затем — приходится покупать новый аккаунт Discord (на платформе которого, к слову, оно и работает). Цена вопроса десять рублей: вполне демократично, но на фоне бесплатного «Кандинского» напрягает.
  • На бумаге, созданное тобой тебе не принадлежит, и прочая юридическая белибердень. К счастью, «что нам мешает — то нам помогает»(С), так что после известных событий этого года вопрос, в общем-то, больше не стоит.
  • В выходной строке — не девять, а всего четыре варианта. Чтобы попытки заканчивались быстрее.
  • Нет поддержки русского языка, плюс сложный синтаксис вводной строки. Первое — решает автопереводчик, второе — сервис автогенерации запросов, но жить, как ни крути, мешает.

И что же лучше? Стоит вообще этим пользоваться?

Даже «сетки» предварительного отбора — и низкого качества — смотрятся неплохо
Даже «сетки» предварительного отбора — и низкого качества — смотрятся неплохо

Оба лучше — и да, стоит. Как и написано в заголовке, «я перестал бояться и полюбил нейросети».

Да, технология ещё несовершенна. Да, есть графические артефакты и спорные моменты. Да, юридическое поле ещё не «утряслось». Но — это уже приемлемо, и уже пригодно для практического использования (например, в моём блоге).

Какую нейросеть выбрать? Я использую обе сразу. Midjorney — когда нужно сгенерировать «сочную», цветастую иллюстрацию, для заголовка или скучноватого фрагмента статьи. Kandinsky — когда иллюстрация должна быть детальной и оригинальной, возможно — в плакатном стиле. А факторами времени и указания ссылки — можно пренебречь.

Как бы то ни было — а на этом всё. Хотелось бы узнать: помогают ли вам какие-то средства ИИ в вашей работе уже сегодня? Что, в целом, думаете о перспективах таких технологий?
Лайк, подписка, комментарий на тему — всё, что нужно для поддержки канала. Это несложно:-)