Народ, всем привет. Нейросети все больше приобретают популярность, сам ими пользуюсь периодически, для поиска идей и генерации картинок. Полностью ей свою работу отдавать точно не буду, все-таки это машинный интеллект. И кто бы что не говорил, но нейросети никогда не заменят человека, однако могут сделать его работу проще или даже расширить ее. Но это тема совершенно другой статьи, а сегодня я хочу рассказать немного тезисно в двух словах, как при помощи нейросетей генерить изображения. Я знаю, что у многих возникают проблемы с этим (сам первое время мучался), и нейронки генерят иногда полную белиберду. Поэтому очень важно прописывать то, что ты хочешь, правильно.
Использовать будем самые популярнее, это Кандинский и Шедеврум, просто потому, что они умет работать с русским языком. Вообще принцип у них у всех один и тот же – сама по себе нейросеть учиться по другим изображениям и рисует вам картинку по описанию из других точно таких же загруженных в сеть и обладающих точно таким же описанием (или если сеть в нем распознала сама этот объект).
Простыми словами, если вы загрузите в нейронку 1000 изображений холодников, то она вам по вашему запросу нарисует любой холодильник, красный, синий, с ручкой, без, ноу-фрост и т.д., просто объединив его свойства в одном. Как она это делает я рассказывать не буду, пока, это слишком долгая тема, и основана она на шифровании и дешифровании файлов и их сжатии. Но опять же, в подробности не вдаёмся.
Основные принципы построения композиции
Основным принципом построения правильного запроса идет более-менее подробное описание, где вы выделяете главное. Для начала вы описываете самый главный объект на картинке, например, собаку. Можно, конечно, просто написать «собака», но результат будет непредсказуемый. Поэтому нужно обязательно добавить характеристики: «пушистая, белая, с пятном на носу, вислоухая, хвост крючком».
Важно, что тут есть два «негласных» правила:
- вначале название самого объекта, потом перечисление характеристик
- характеристики и свойства лучше всего перечислять через запятые
Негласные эти правила потому, что сейчас нейросети становятся все умнее, и они уже спокойно проглатывают разное описание, через запятую, просто с перечислением через союзы, главный объект вначале, вконце. В общем, скормить ему можно все, но, нейросети бывают разные. Да и так ей будет проще. Помните, что хоть и новое поколение нейросетей умеют многое, но все же чем проще и лаконичнее задача, тем быстрее и качественнее она с ней справится.
Объектов при этом может быть несколько, да и сами объекты могут находиться в разных позах или даже в движении. Все это точно также описывается как характеристики через запятую друг за другом.
Далее нам нужно описать фон, где находится объект. При этом сам фон можно и не описывать, можно лишь указать какие-то ключевые объекты, например, лампа, или просто описать освещение – светит солнце, идет снег. Нейросеть достроит и «додумает» все остальное за вас. Если фон не указать, она приделает его сама, рандомно, или вообще сделает его однотонным. Но при этом помните, что если вы хотите что-то конкретное, то и описывать это нужно конкретно. И после собаки можно описать, например, будку, жёлтую, деревянную, и дерево, и даже забор на заднем плане. Но чем больше объектов и чем больше характеристик вы укажете, тем больше изображение будет похожим на то, чт0 вы задумали, но при этом сама система будет думать дольше и ей будет гораздо сложнее.
Кстати, Вам может быть это интересно:
Нюансы работы с нейросетями
А теперь поговорим про нюансы, они существуют всегда и призваны либо помогать, либо не давать вам совершить ошибку. Например, вы всегда можете указать стиль рисунка, ведь нейросеть не знает, что конкретно вы хотите. Иногда для стиля выводят отдельное поле, иногда можно указать имя автора иди художника и сетка нарисует в похожем стиле, проанализировав работы автора.
Теперь поговорим про важных нюансы и специфике русского языка:
- избегайте причастий и деепричастий. «Собака, бегущая за палкой» не походит, лучше будет «собака, бег, палка, скорость» ну или хотя бы «собака, бежит за палкой, скорость»
- не используете отрицаний, двойных отрицаний и всего такого прочее. Избегайте таких слов, как «не, без, кроме, исключая, вместо».
- ну и не злоупотребляйте количеством описаний и выражений, нейросеть все же не тот инструмент, который за вас двигает кистью. Нейронка должна немного «работать сама», додумывать, и чаще всего описание огромного количества объектов не приведет вас к желаемому результату. Лучше всего будет начать с более обширного описания, а дальше сузить круг там, где это необходимо.