На этой неделе Open AI выпустили обновление ChatGPT, благодаря которому появилась возможность собирать на этой платформе собственных ассистентов. В качестве демонстрации разработчики подготовили ряд ассистентов, доступных всем пользователям. Пока моя жена Юля разучивала на укулеле песню "Черная луна" группы Агата Кристи, я решил попробовать ассистента DALL-E и сделать иллюстрацию к песне.
Я скопировал в чат текст одиного куплета и припева и попросил создать картину. Что получилось – на картине 1.
Мне показался результат не очень. Мало драматизма. К тому же некоторые метафоры не были полностью поняты моделью: луна ухмыляется, но нет и тени мыслей о черных делах. Хотя некоторые другие идеи передать удалось, понравилось сердце с травой и камнями на правом изображении. Поэтому я попросил учесть сложность метафор и сделать картину фотореалистичной для большей выразительности. Результат – картина 2.
Результат явно улучшился, но не за счет точности передачи метафор, а за счет фотореалистичности, детальности и прекрасной композиции. Тогда я решил заняться микроменеджментом и попросил убрать диск луны, добавив сердцу текстуру лунной поверхности. Заодно перешел на английский, на всякий случай.
Итог (картина 3) разочаровал. Оказывается поправить какую-то одну деталь она не может. Да и исходный запрос она как будто почти забыла. Поэтому я откатился на шаг назад, и вместо модификации картинки попросил ее описать ее подробно в тексте. Идея была в том, чтобы взять потом этот текст и уже в нем удалить упоминание ненужной детали, а затем попросить создать новую картину по тексту.
Оказалось, что она не смогла описать именно вторую картинку. У нее скорее получилось очень детальное и образное описание исходной задачи на основе первоначального текста, смешанное с образами с уже созданной картины. Поэтому я не смог поменять детали того, что хотел. Но текст мне понравился, и я просто попросил сделать новое изображение по нему. Получилась картина 4.
И вот тут надо сказать она меня приятно удивила. Образы стали более четкими, яркими, цепляющими взгляд. И хотя тут и нет точной передачи образов, но если бы я делал обложку для альбома с этой композицией, я бы точно рассмотрел такой вариант. Тем более, что на его создание ушло всего около 5 минут.
Классный инструмент для творческих задач! Вскоре творческие индустрии глубоко изменятся. Да это уже и происходит.