Понадобилась аватарка. Свою фотомордочку я показывать не хотел. Поэтому решил воспользоваться помощью нейросетей. В статье показаны результаты от нейронок Recraft, Kling, Stable Diffusion, SeaArt, Leonardo.
Почти не буду здесь комментировать полученное. Оставлю на суд читателей. Скажу лишь, что хотя речь и идёт об аватарках, приведено только то, что сгенерировали сами нейронные сети, без удаления заднего плана и окончательной доводки до картинки в кружке.
Стартуем с текстового описания (промпта)
Качественный промпт — отличная картинка, подумалось мне. На данный момент нейросеть Claude 3.5 Sonnet (Клод) видится самым первым кандидатом в тех сферах, где от нейронки требуется хорошее понимание текста и того, что хочет клиент.
Поэтому я начал с того, что попросил Клода придумать варианты описаний композиции аватарки. Из полученного выбрал несколько и дал задание составить промпты для генеративных нейросетей.
Claude постарался на славу. Предоставил сам промпт — где и что должно находиться на картинке, стилистические параметры (вплоть до указания цветов и градиентов), технические спецификации (формат картинки, разрешение, центрирование, наличие «воздуха» и т.п.) и профессиональные требования (светлый или тёмный режим, наличие текстов, знаков копирайта и т.п.).
Из всего этого я скомпоновал окончательное описание.
Испытание решил начать с моей любимой нейронной сети для генерации изображений Recraft.
Аватары от нейросети Recraft
Тестирование детальнейшего промпта в Recraft оставило глубокое разочарование — тонкие переходы одних элементов картинки в другие выродились в какие-то непонятные линии, градиентами и указанными цветами и не пахло, вместо художника-дизайнера был какой-то работяга в кепке и т.д. Даже не буду показывать, как это всё выглядело.
Ладно, надо быть проще и люди к тебе...
Постепенное упрощение промпта помогало мало. Всё было не то. В конце концов, я оставил простейший промпт:
Дизайнер аватар
Recraft позволяет создавать картинки в разных форматах и стилях. Поэтому к указанному описанию в начале я добавлял название стиля. Первыми попробовал растровые изображения, фотореализм и иллюстрации.
Получалось не то, что хотелось. Отказался от растра. Только вектор. Смотрите, что получилось.
Всё дальнейшее сгенерировано в мультяшном стиле.
Добавил в промпт указание на кисти и лэптоп.
Пол у дизайнера не указывал. И мне показалась интересной картинка, где появилась девушка 👇
Нейросеть Recraft позволяет редактировать готовое изображение «на лету»: изменять цветовую палитру, насыщенность цвета, контраст и т.п. В результате экспериментов я перегенерировал, не скопировав, самую понравившуюся мне картинку. Которую, увы, повторить не удалось.
Далее пришла очередь признанных «тяжеловесов» среди нейросетей: Stable Diffusion и Midjourney. Как никак, именно последнюю нейросеть чаще используют для получения качественных картинок.
Аватары от нейросети Stable Diffusion
Как Stable Diffusion, так и Midjourney для получения хороших результатов требуют особого умения составлять текстовые описания для них.
Поэтому вначале я решил использовать детальный промпт от Клода. Ничего интересного не получилось.
Тогда, учитывая миниатюрность аватарок, для которых требования к качеству промптов не являются решающими, решил сильно не заморачиваться с описанием и взял простейшее.
Кисти видны, а вот лэптоп — под большим вопросом.
Для нейросети Midjourney я также взял самое простое описание. Но в той бесплатной версии, который я использовал, оказался в очереди на месте за 4000 и не дождался результата. О чём не жалею, учитывая, как плохо Midjourney понимает то, чего от него хотят, но компенсирует это своей буйной фантазией.
Ладно, думаю, раз получается не совсем то, чего хочется, поищу картинки в интернете и использую их как образец для перегенерации в нейросети.
Аватары дизайнеров из Яндекс картинок
Всё, что мне удалось найти в интернете, это — некачественные фотки каких-то личностей, что-то абстрактное или то, что даже в подмётки не годится картинкам, показанным выше.
За единственным, с огромной натяжкой, исключением 👇
Вспомнил про недавно испытанную нейросеть Kling
Аватары от нейросети Kling
Не впечатлили мужские образы дизайнеров, поэтому далее я уже указывал пол в промпте
cartoon girl-designer avatar with paint brushes behind and a laptop in hands
Аватары от нейросети Leonardo AI
Вначале никакие настройки не менял, даже не смотрел, что выставлено. Ввёл только промпт.
Получил вот это:
Совсем не то, что хотелось. Посмотрел настройки. Не понравилось, что стояло — Улучшение промпта с помощью нейросети. Сам промпт разросся раз в 10. С упором на мягкий натуральный свет, тёплую мягкую улыбку, минималистический стиль...
Отключил улучшение, оставив чисто промпт. Результаты:
Далее пошли пробы со стилями.
И, наконец, я вспомнил про мало где упоминающуюся, но неплохую нейросеть, с созданием коротких видео и множеством моделей, в том числе от Stable Diffuion и Flux.
Аватары от нейросети SeaArt AI
Заключение
Интересно было бы услышать, какие картинки понравились больше — они пронумерованы. Представьте себе, что картинка с удалённым задним фоном находится в кружке и сравните. Если не трудно — выскажите своё мнение в комментах. Позже появится возможность проголосовать на другом ресурсе.
PS.
Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать ещё что-то интересное для себя. А для просмотра будущих статей и поддержки автора — лучше вообще подписаться. Имеется также постоянно обновляемый гид-путеводитель по статьям канала.
#нейросеть #нейронныесети #ИИ #AI #Клод #Claude #Midjourney #StabelDuffusion #Sonnet #СозданиеАватаров #Kling #Recraft #SeaArt #Leonardo