Попробовал протестировать способности DALL·E 3 в создании картинок по моим запросам.
Задачу немного усложнил, добавив в запросы двух главных персонажей. Почему выбрал именно эти персонажи ? Всё банально просто - да потому, что у меня есть есть парочка очень похожих на них домашних питомцев.
Использовал создатель изображений Bing от Майкрософт, который любезно предоставил пользователям бесплатные генерации.
Конкретно в моем случае ошеломительной скорости генерации не получилось. Скорость от провайдера 900 мБит/с, но есть большие ограничения в связи с большой удаленностью от VPN-сервера. Проживаю на Урале.
Но в целом скорость генерации с получением четырех картинок при предоставляемых ежедневно 15-ти ускорениях получилась приемлемой. В течении минуты результаты выводились на экран. При этом DALL·E 3 не ограничивал доступ к дальнейшим генерациям, которые после использования всех ускорений затягивались до пяти минут. Но после двух-трёх генераций по одному и тому же запросу DALL·E 3 начинал сильно "чудить", выкидывая на изображение совершенно лишних и нелепых персонажей, ломая и разбрасывая предметы.
Если в запросе не указан стиль изображения, DALL·E 3 генерирует четыре расширенных промта и выводит картинки в разных стилях, начиная с фотореалистичного, и заканчивая стилем аниме. Поэтому, чтобы не растратить впустую ускорения, в запросе лучше сразу указать стиль.
Вот примеры картинок, которые DALL·E 3 сгенерировал по моим запросам. Выбирал лучшее из того, что он мне выдал. В некоторых случаях приходилось выбирать только одну из десятка, т.к. результаты совершенно не совпадали с запросами.
При написании в запросе "цыпленок", ИИ видит скорее всего цыпленка гастрономического размера.
Если же напишем "маленький желтый цыпленок", то ИИ применит "маленький" ко всем персонажам. Поэтому приходится описывать всех по отдельности.
Функцию "рыбий глаз" ИИ демонстрирует просто бесподобно.
Цветы, небо... ошеломительно.
На запрос "персонажи смотрят на...." ИИ в большинстве случаев уведет взгляд одного из персонажей в сторону.
И опять... Просто собаке мышь не интересна.
Вот так ИИ видит фразу "плывут по реке"
Наблюдение за рыбками впечатляет.
Шмель хорош, но глаза у собаки немного не на нем.
И опять у собаки глаза не в фокусе. Чего не скажешь о коте.
Ничего не раздобыли... бежим дальше.
И... наконец что-то "наковыряли". Сцены с воровством "жрачки" очень интересны.
При указании в запросе "динамика в движении" траву может смазать.
Дачи и бассейны на заднем плане ИИ отрисовывает очень даже "не плохо". То есть "хорошо". Только для исключения чего-то на изображении добавление "не" не работает. ИИ сделает акцент на слове, перед которым оно стоит. Поэтому сразу исключаем отрицание из текста запросов.
Кожаные гоночные костюмы и советский мотоцикл "Урал" ИИ видит приблизительно так.
Или вот так.
На спринтерской дистанции из трех затребованных персонажей ИИ убрал собаку, но добавил футболистов, что сработало в плюс картинке.
Вот здесь ИИ добавил второго поросенка, хотя в запросе его не было. На некоторых картинках ИИ высыпает целую кучу поросят. И тогда вместо спринтерского забега трех персонажей на картинке получается какой-то побег из свинарника. Всё было бы вполне забавно, если бы ИИ не отрисовывал большую часть поросят какими-то мутантами. Во избежание негатива такие картинки не выкладываю.
Здесь уже более согласованно с запросом. Только вот с размером поросенка как-то не зашло.
Футбол в динамике впечатляет, но в большинстве случаев ИИ забывает один из предметов гардероба, несмотря на правильный запрос.
И опять кот где-то ботинок потерял.
И вновь ИИ кота не полностью "прикрыл".
С хоккеистами на заднем плане уже поинтереснее, только что делает вратарь справа ? Или это не вратарь ?
И даже в любимом американцами бейсболе кота опять без костюма и кроссовка оставили.
Пусть лучше в сторонке посидит. Только кого ИИ ещё на площадку подсадил ?
Фотореалистичность парашюта не очень вдохновила. Хотя сам кадр вполне хорош.
А в общем : ИИ в прыжках с парашютом показал себя не плохо.
Сама тележка не очень понятна, но тоже прикольно. А взгляд у собаки радует. Для этого можно добавить в запросе "удивленные глаза".
Для комфортного приземления.
Двигатель самолета получился "супер-компакт". В целом картинка понравилась.
Но вот эта выше всяких похвал.
С гоночными катерами получается просто шикарно.
Посетим автосалон. Забьем в запросе "футуристичный". Всё хорошо, только с костюмами как-то не очень.
Попробуем нарядить в "шикарные костюмы". Опять кот без штанишек. И костюмы невпопад.
Укажем "красивые кожаные костюмы" и вуаля ! Ох уж эта толерантность...
Выбрали, наконец, авто. ИИ хорошо адаптирует размер под пассажиров. Но при уменьшении размера начинает имитировать "игрушечность".
Вот здесь "игрушечность" авто не так заметна.
Для получения такой картинки можно прописать в запросе "общий план" и "вид снизу"
В кабине космолета почти всегда "домашние" кресла.
По мотивам "Звездных войн"
Ну других планетах желательно указывать на наличие атмосферы.
ИИ по умолчанию насыпает много планет. Нужно указывать количество.
Ну вот и всё тестирование.
Если кого заинтересовало - пишите.
Пока собираю с помощью "Дали 3" картинки на другие темы.
Возможен выпуск следующей статьи.
Всем удачи в освоении ИИ !