Название довольно необычное, и может показаться кликбейтом, и мы это понимаем, но статья действительно об этом. В сегодняшней статье мы решили попробовать сгенерировать автомобили Лада при помощи одной из самых мощных графических нейросетей на данный момент - Stable Diffusion.
Вот так, без лишних слов, начинаем наш эксперимент. Но всё же, если вам понравится статья, поддержите нас активностью и подпиской, нам будет очень приятно!
Итак, начнем мы генерацию через DDIM, выставили Sampling Steps на 40, а CFG Scale оставили на 7, чтобы изначально не получать "космические" результаты :D И да, картинка выше - как раз по этим настройкам. Для генерации мы использовали следующие промты:
"Lada car in the style of the future"
Начали с минимального, дальше будем добавлять промты по результатам.
Итак, по первой генерации у нас получились следующие результаты:
Мда... Если первые несколько картинок еще имели хоть какой-то "вес", то последние, откровенно говоря, никуда не годятся. Сразу делаем вывод, что нам нужна именно ЦЕЛАЯ машина, и чтобы полностью помещалась на изображении. Из-за этого меняем промты на эти:
"A whole Lada Car in the style of the future, completely in the frame"
И вот что у нас из этого вышло:
Сразу же замечаем, что из-за генерации картинки в соотношении 16:9 рисуются несколько машин на одном фото, поэтому ставим "Highres. fix", чтобы избежать такие моменты. Также видим, что некоторые машины ничего общего с Ладой не имеют, и надо поточнее задать промпты:
"A whole Russian Lada car in the style of the future, completely in the frame, Volga Automobile Plant"
Единственное, что смущает, что в расшифровке присутствует слово Volga, и нейросеть может генерировать автомобили, похожие именно на Волгу, но сейчас проверим. И всё-таки DDIM нам не очень зашел, и мы решили переключиться на любимый LMS ♥
И вот что из этого вышло:
Итак, мы наконец-то пришли к более-менее хорошему результату, но мы то хотели сгенерировать автомобили БУДУЩЕГО, а не прошлого, поэтому придется подкрутить CFG Scale до 13, чтобы дать волю фантазии нейросети чуть больше. Ну как, чуть больше, почти в 2 раза :D
И вот что мы имеем после увеличения CFG Scale:
Дальше даже нет смысла генерировать. Мы поняли, что дело не в CFG Scale, а в наших промптах. Мы не точно задали запрос, и нейросеть не совсем понимает, что мы от нее хотим. Поэтому мы снова опустили CFG Scale до 7-ми, а вот промпты немного доработали:
"Russian Lada car in Cyberpunk style, fully in the frame, Volga Automobile Plant in cyberpunk style, realistic, high quality, high detail"
Да, мы использовали небольшую хитрость, и добавили в промпты "Киберпанк". А всё потому, что киберпанк является сочетанием низменности и высоких технологий, и будет давать нам хороший результат.
Но уже на этом этапе мы поняли, что мы слишком недооцениваем АвтоВАЗ, и к Киберпанку его лучше не относить, иначе выглядит, как машина из настоящего, или даже из прошлого :D Поэтому решили заменить киберпанк на Хай-тек, чтобы получить желаемый результат:
"Russian Lada car in high-tech style, fully in the frame, Volga Automobile Plant in high-tech style, realistic, high quality, high detail"
(И метод обработки мы поменяли на Euler a)
Вот. Наконец-то получилось куда лучше. Выглядит как типичный рендер "предстоящих моделей" автомобилестроения. Но мы решили добавить заключительный штрих, и сделать эти автомобили с промптами "реалистичных фото на природе или выставке":
"Russian Lada car in high-tech style of the future, fully in the frame, Volga Automobile Plant in high-tech style of the future, realistic, high quality, high detail, a real photo at the exhibition"
Хотели бы себе такую Ладу? Пишите в комментариях! На самом деле, выглядят достаточно стильно, и было бы здорово, если бы что-то похожее было реализовано в ближайшее время, но это всего лишь мечты... Где-то инженеры АвтоВАЗа нервно курят в сторонке...
Хотите, чтобы мы сгенерировали вашу идею? Обязательно пишите в комментариях и поддержите нас подпиской и активностью ниже ♥ Всем прекрасного настроения, и до скорой встречи в следующей статье!