Если вы достаточно давно наблюдаете за развитием графических нейросетей, то не могли не заметить, что самый популярный жанр искусственного искусства - фэнтези. Человеки любят убегать от суровой реальности в прекрасную страну Фантазию - эту привычку в нас методично воспитывают с детства, рассказывая бесконечные сказки со счастливым концом.
Предположу, что предложение ориентируется на спрос, и создатели нейросетей натаскивают их в значительной степени на фантастических и сказочных иллюстрациях. Неудивительно, что именно такие изображения потом удаются искусственному интеллекту лучше всего.
Хотя, возможно, я ошибаюсь, и реальная причина, по которой ИИ лучше всего рисует сказочки, заключается в том, что на таких картинках меньше заметны многочисленные ошибки в построении, чем, скажем, на псевдофото.
Как бы там ни было, сегодня я заставлю нейросети поднапрячься и нарисовать то, что существует на самом деле.
(Ладно, может, и не существует, но вполне могло бы существовать.)
Проверим, насколько крепка у них связь с реальностью.
Запрос: скворечник на дереве, крупным планом, красная крыша
...а внизу справа, я так понимаю, собачья будка на цепи.
Конечно, сюрреализм имеет полное право на жизнь. Но в данном случае мне нужен был просто скворечник. Обычный птичий домик. Прости, "Кандинский".
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: прозрачная чашка с чаем на вершине горы крупным планом, рассвет, f/2.8
Пейзаж в чашке сначала сражает наповал. Потом встаёшь, отряхиваешься, присматриваешься и понимаешь, что а) вообще-то в силу преломления он должен был быть перевёрнут вверх ногами, и б) желательно, чтобы он ещё и совпадал с тем пейзажем, который виден за чашкой. Эти моменты "Кандинский" не учёл, но я, кажется, многого от него хочу. Зато картинка очень атмосферная.
"Шедеврум" лепил свою чайную пару детскими ручками бета-версии, получилось самую малость кривовато, но трогательно, как все ребячьи поделки.
Так или иначе, задание выполнили оба. А ещё чай у "Шедеврума" чёрный, а у "Кандинского" зелёный. Не то чтобы это влияло на оценку - просто наблюдение.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: домик из цветных карандашей
Сложности, возникшие у нейросетей по этому запросу, меня удивили. Казалось бы: возьми ты обычный сруб и замени брёвна карандашами, делов-то. Но, похоже, цифровой мозг до такой степени сообразительности пока не развился.
"Кандинский", во всяком случае, додумался, что нужно как-то скрестить дом и карандаши, но не понял, как. "Шедеврум" не понял вообще ничего. Для верности обе сети получили от меня второй, уточнённый запрос "домик, построенный из цветных карандашей", но на результаты это никак не повлияло - можете убедиться в галерее.
И хотя "Кандинский" был близок к цели, засчитать результат я ему не могу.
Результат: "Шедеврум" - 0, "Кандинский" - 0.
Запрос: water drops on a spiderweb, sunlight, extreme close-up, f/2.8, 4k, realistic, high resolution
"Кандинский" очень приблизительно знает, как выглядят пауки, а паутину представляет себе ещё более приблизительно. Может быть, рассмотреть всё поближе ему мешает арахнофобия, и ему следовало бы посочувствовать, но - увы. Мы тут люди жестокосердные, и вместо сочувствия отберём у него один балл.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: занавес из пайеток, радужные переливы, неоновое освещение, зелёный, синий
Пайетки "Кандинский" вполне по-мужски не представляет себе совсем. Ну то есть сами-то их он, может, и представляет, но не знает, как эти штуки называются: в его базе данных нет такого слова. Проверено дополнительными запросами: на просьбу изобразить пайетки нейросеть поочерёдно выдавала набор цветных мешков из-под цемента, трёх юных девиц в шляпках и непонятную бурую тряпку, больше всего похожую на домотканый придверный коврик. Поэтому здесь победа у "Шедеврума" чистая.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: символы карточных мастей, огранённые, вырезанные из рубина, в 3d
А ещё "Кандинский" не жалует карты. Не знаю даже, хорошо это или плохо, потому что он снова не справился с заданием.
Тут вы можете заметить, что червы-то - вот они; но, во-первых, надо было изобразить несколько мастей (желательно все четыре), а, во-вторых, это не рубин. Это пластмассовое оригами.
К слову, "Шедеврум" тоже не опытный игрок: из всех мастей знает одни только пики, их и рисовал, но они хотя бы явно вырезаны из чего-то твёрдого, блестящего и красного.
Впрочем, ему это не поможет. Задание считаю проваленным.
Результат: "Шедеврум" - 0, "Кандинский" - 0.
Запрос: жидкий 3D объект неправильной формы, металлический блеск, парит в воздухе, размытое неоновое голубое и зелёное освещение, тёмный фон
Наверное, примерно так будет выглядеть ртуть в невесомости, если её слегка подтолкнуть. "Шедевруму" по причине постоянно ведущихся Яндексом работ по улучшению часто не хватает ресурсов для завершения рендера, поэтому его "ртути" немного не хватает блеска, но это мелочи. Объективно условия выполнены, требуемый объект летает, переливается и перетекает сам в себя. Мо-лод-цы.
Результат: "Шедеврум" - 1, Кандинский" - 1.
Запрос: пиньята, висящая на ветке дерева
"Шедеврум" отработал прямо как отличник на экзамене: классическая пиньята в форме лошади, ноги из втулок от рулонов туалетной бумаги - всё по канону.
"Кандинский" изобразил нечто трогательное и жуткое одновременно. По бумажной бахроме и характерной расцветке можно предположить, что и это вуду - тоже вроде как пиньята. А что до уровня исполнения - ну кто как умеет, они старались.
Хотя я всё же подозреваю вуду.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: сундук сокровищ в тёмной пещере, драгоценные камни
Каким бы ладно скроенным ни был сундук "Шедеврума", но отдать ему балл я не могу из-за полного отсутствия в сцене драгоценных камней. Наверное, при очень большом желании можно разглядеть несколько бриллиантов в золотой мешанине слева внизу, но на этот раз подсуживать я не буду.
Между прочим, "Шедеврум" снова прокололся на камушках. Помните гнома?
Результат: "Шедеврум" - 0, "Кандинский" - 1.
Запрос: высокий резной сверкающий кубок изо льда стоит на камне, покрытом снегом, в кубке горит огонь, сильная метель
Добиться от "Шедеврума" генерации этой картинки было делом мучительно долгим. Он упорно пытался подсунуть мне горящие стаканы для виски, водочные стопки, бутылки и прочую алкопосуду, но каменный цветок ледяной кубок никак не выходил. Наконец, простым перебором сосудов для питья добравшись до хрустальных кубков, он смог всё-таки выдать вполне приемлемый результат.
"Кандинскому", наоборот, форма кубка знакома, а вот вытесать его изо льда, да ещё добавить туда пламя оказалось непосильной задачей. Трижды он пытался это сделать, и трижды выдавал практически идентичные каменные стаканы с ледяными пиками вместо огня. Дальше мучить бедную нейросеть просто не было смысла.
Даже несмотря на отсутствие метели у "Шедеврума", балл определённо достаётся ему.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Общий результат: "Шедеврум" - 7, "Кандинский" - 4.
Результат по итогам 12 раундов: "Шедеврум" - 98, "Кандинский" - 86.
Конкурсанты подбираются к первой сотне набранных баллов и, кажется, перевалили за 150 сгенерированных картинок каждый - или вплотную подобрались к этой цифре, считать мне лень :) Думаю, сейчас уже можно сделать какие-то более или менее общие выводы об обеих нейросетях, поискать сходства и различия в их работе, потыкать палочкой в слабые места. Пожалуй, в одной из ближайших публикаций я именно этим и займусь.