Что ж, затравка сделана, теперь немного о том, как все организовано. Берем текст песни, которая цепляет, прогоняем через переводчик и отдаем на растерзание нейросетям. Используются в основном три стандартных размера - квадрат 1024 на1024, альбом 1216 на 832 и портрет 832 на 1216. Разные тексты могут сильно отличаться по композиции в альбоме и портрете, тем интереснее. Моделей, на которых можно было бы генерировать картинки - стопицот штук и маленькая тележка, я остановился пока на трех - AlbedoBase XL, ZavyChromaXL и AmalgamationXL. Это не реклама =), так-то вкусовщина, но пока мне их генерации нравятся. Вот что получилось на этот раз: [Куплет 1]
Я сам себе и небо, и луна
Голая, довольная луна
Долгая дорога, да и то не моя
За мною зажигали города
Глупые, чужие города
Там меня любили, только это не я
[Припев]
О, зона!
Ожидает напряжённо
Родниковая
Я сам себе и небо и луна
Голая, довольная луна
Долгая дорога бескайфовая
[Куплет 2]
Меня держала за ноги земля
Голая тяжелая земля
Медленн