NeuroReShot NrS

Нейросети для генерации изображений Yandex ART 2.5 и Open AI Sora I’m sorry перерисовывают настоящие фотографии, после чего проводится оценка качества их работы.

подборка · 17 материалов

AivanElectric

8 месяцев назад

NeuroReShot – сомнительное жидкое мыло и сход с рельс. В общественных туалетах удавалось встречать вот такие сомнительные жидкости для мытья рук, когда штатная мыльница отсутствует. Можно ли нейросетями создать такую серьёзную тему? Photorealism. Two sinks in a school bathroom in close-up. Beige tiles. A broken soap dish on the wall, and instead, a one almost full transparent ordinary bottle for water with bright yellow liquid, a green dispenser, and a paper label with the big word "АНТИСЕ" written in Russian letters. Shot with a flash, the bottle reflects in the sink and the faucet. ---- Photorealism. The sink in the school bathroom is in close-up, and parts of other sinks on the sides. Turquoise tiles. There is a broken soap dish, on the wall with dark seams. Instead of a soap dish, there is a one almost full plastic crushed transparent ordinary bottle for water with a bright green liquid, a dispenser, and a permanent marker with the Russian letters "ЫО для РУК" written on it. Shot with a flash, reflections in the sink and faucet. Open AI Sora. Изображения очень фотореалистичные (на локальную Topaz Photo AI Generative Fill не обращаем внимания), кажется, снято в темноте. Признаки сгенерированности нужно искать под лупой. А вот обе бутылки имеют эффект прифотошопленности. Yandex Art. Весьма неплохо, особенно расположение и преломление света в бутылках. Справа 2.5 – вода дозированно. Капельки, сколы на плитке, но и артефакты есть. Текст не совсем тот, но близок к заданному. Sber Kandinsky отказался такое генерить, хотя самая строгая цензура считается у Яндекса. Решил добавить сход поезда с рельс, но и тут именно Сбер отказался опять. У обоих проблемы с рельсами, в Яндексе лес лучше. Ненормальное положение поезда удалось получить только в более точной 2.7, в 2.5 и 2.5 Pro схода с рельс не наблюдалось. В новом видеогенераторе Yandex Frame Pack Pro удалось получить интересную проводку (панораму) около раковины, только жидкость в бутылке зачем-то колыхалась. Фотореализм. Железнодорожная развязка, перекрёсток, стрелки, станция. Грузовой локомотив без вагонов на огромной скорости вылетает с перекрёстка в лес с возвышенностью. Снято с высоты 10-20 метров, камера видеонаблюдения.

AivanElectric

8 месяцев назад

Микро-огурец. С таким нейросети должны хорошо справляться, в Шедевруме полно похожих картинок. Фотореализм. Микро-растение огурец с двумя крошечными огурцами; высота 10 сантиметров. Снизу земля. Боке, макро. Сзади металлоконструкции и сетчатый поликарбонат теплицы, палки и удерживающая подвязка верёвка-бечёвка справа, немного сена. Yandex Art. Лучше всего получилось в 2.5 Pro и Exp. Только в 2.7 правильная геометрия металлоконструкций, однако огурцы слишком пластиковые. В 2.5 огурцы слишком большие, а стебель превратился в верёвку. Новые 2.7 и Exp выдают более дачный вариант, в то время как 2.5 и 2.5 Pro явно промышленный. Open AI Sora хорошо, но есть ощущение прифотошопленности огурца. Sber Kandinsky 3.0: непонятные серые штуки у стеблей и земли; нет огурцов (или он огромный ~метр сзади?); не в теплице. В итоге все прилично, но платные модели Яндекса и Open AI Sora лучше Kandinsky 3.0 и Yandex Art 2.5. В августе Яндекс также пробовал модель 2.5 Ultra, которая в 6 раза медленнее 2.5 Pro и в 18 раз медленнее 2.5, но дальнейшее увеличение количества итераций почти не улучшало результат, при этом значительно нагружало сервера – 2.5 Pro остаётся лучшей фотореалистичной моделью Яндекса. Зато представили два новых видеогенератора! v3 1 МП (HD), 4 с 16 к/с и Frame Pack Pro 0,4 МП (SD) 4 с 30 к/с, причём v3 бесплатный. По сравнению с v2 Beta виден значительный прирост качества и динамики. Конечно, генерация качественного видео – это очень ресурсоёмкий процесс, так что даже с Шедеврум Pro ждать генерацию можно несколько часов. Когда сделают Pro Max для создателей за 500-1000 вместо 100 Руб/мес? Sber Kandinsky Video новой модели так и не появился (старой тоже нет), хотя обещали 1 МП (HD) 10 с 30 к/с и ещё более качественные движения. А ещё эти банкиры не обновили бесплатные 20 кредитов, хотя обещали, что эти 20 дают каждый месяц, а не раз и на всегда. Так что пока российские модели генерации видео лишь в Яндексе. v3 и Frame Pack Pro, так же, как и v2 Beta сначала генерируют картинку (скорее всего с помощью 2.5), а потом анимируют – I2V. Надеюсь, в будущем можно будет загружать свои картинки и фотографии, а также отдельно прописывать запрос для анимации – какие именно действия и движения.

AivanElectric

9 месяцев назад

Мышка в мини-гостинице и жёсткий диск с макаронами. Совсем недавно нейросети для генерации изображений выдавали исключительно абстрактный кошмар. Но смогут ли они сегодня выполнить подобное, но точно по запросу? Photorealism. A compact niche bed with a striped red and white mattress inside a white stone plastered wall. A blue ladder is attached to the bed on the right, along which a mouse climbs. There is a road sign on the wall above the bed indicating the hotel. From below, a part of the wooden floor and on the left an arch in the wall, inside which is written in Russian letters «Цой жив!». Just to the left is another part of the same niche bed. The bed and the mouse are approximately the same small size. Фотореализм. Крупный план: лапа кота (не кот полностью в розовом) держит наклонённый в сторону кабелей жёсткий диск 3,5’’ этикеткой вверх с подключённым кабелем питания, но без информационного SATA кабеля. С противоположной стороны справа к жёсткому диску «подключена» макаронина. На фоне зелёной травы с цветами. Слева наверху видно часть большой плоской отвёртки. Результат вполне приличный, но точно выполнила только Sora. «Отель». Open AI Sora – прикольно, текст отличный. Бесплатный Sber Kandinsky 3.0: граффити на стене; металлическая подушка (ужас); «дрои!! У дооос, AMIНИЕ!» (аниме?); 3 лапки у мыши, а ещё одна свалилась и разложилась – абстракции намного больше. Yandex – достаточно уютно и не чересчур интересно. 2.5: первая ступенька сломалась; мышь прикольно висит; «ГТОИ IBEL». 2.5 Pro: композиция хорошая; достаточно качественная табличка с отелем, но вторая «СГJЬОIИ JНИ!»; мышь и лестница снова интересные. 2.7: мышь отделилась; лестница неравномерная; знаки «HuI» и «XV»; красивые текстуры кирпича и цемента. Exp: неплохая табличка отеля, он в другой стороне; мышь на полу; Цой стал «ЛИ ЛУ VIЙ». Теперь жёсткий диск. Open AI Sora: диск очень качественный, но провода питания всё-таки не совсем такие как надо; плоская отвёртка отличная; макаронина так себе; хороший коллаж. Sber Kandinsky 3.0: кот полностью розовый; проблемы с усами и что-то типа розового провода сзади; жёсткий диск не очень похож на жёсткий диск; даже цветы попортились. Yandex Art. 2.5: очень понравилось, выглядит красиво; макароны логично подключены; нет отвёртки. 2.5 Pro: получилась рука, а не лапа; шпионское устройство с антенной-макарониной и охлаждением; надпись слегка напоминает Samsung. 2.7: больше похоже на коллаж; отвёртка странная; жёсткий диск розовый. Exp: странно, но очень-очень красиво; отвёртка действительно огромная и напоминает гаечный ключ. В итоге, современные нейросети могут сделать адекватное изображение даже по очень странному запросу, но в точности его может повторить только Open AI Sora.

AivanElectric

9 месяцев назад

В телефонах в электричке. Типичное времяпрепровождение у современных людей во время поездки – попробуем воссоздать это нейросетями. Мужчина и мальчик в электричке. Оранжевые деревянные сиденья; не очень чистая стена и часть окна; motion blur зелень за окном. Мальчик в джинсах и джинсовой куртке; чёрная кепка с жёлтым патчем; светлые агрессивные кроссовки; в телефоне с оранжевым чехлом; рядом с ним небольшой рюкзак с синим низом и оранжевым верхом. Мужчина в джинсах и фиолетовой рубашке; немного седых волос, очки с толстой душкой; в телефоне с чёрным чехлом; рядом с ним тёмная сумка. Спереди часть картинки и ноги мужчины перегораживает синий пакет-сумка; справа видно чёрный капюшон человека из другого купе; маленькая прозрачная табличка с QR кодом на стекле. Зря я добавил «чёрный капюшон человека», он получился очень большой. А ещё прошло некоторое время и во всех сервисах случились обновления – обсудим. Open AI Sora в этот раз однозначно лучше всех. Синяя сумка-пакет именно та; одеты максимально правильно. Сиденья узковаты, но электричка сделана как надо. «Скрытный» мужчина как-то не помещается. QR код есть, но снизу он не на стекле. Всё хорошо. Изначально в Sora можно было генерировать 1 вариант, потом 4, а сейчас 2 за один запрос. И 3 запроса в день. Yandex Art. Расположение сидений скорее как в метро, хотя окна вроде из электрички. В обычной 2.5 неплохо, даже качественный QR код на стекле, но: проблемы с большими пальцами мальчика; рюкзак не рядом; нет сумки. В 2.5 Pro пальцы лучше, но не идеально; однако, вместо фиолетовой рубашки джинсовая куртка как у мальчика. Слева QR код есть, но он в самом краю; мальчик маленький и полностью забрался на сиденье; у мужчины есть кольцо; справа QR код не качественный, но зато хорошо видно различие молодой гладкой и старой морщинистой кожи. Интересные motion blur и отражения. Нововведения Яндекса: теперь генерация изображений в чате с Алисой на модели 2.5 безлимитная (отлично); в Шедевруме появилась новая и тоже бесплатная модель 2.7. Погенерил с ней, и вот что могу сказать: фотореализма чуть меньше, картинка не такая звенящая (но это может и хорошо иногда), преимуществом является то, что лучше понимает запрос. И это видно на этом примере: чётко с одеждой, именно фиолетовая рубашка; именно тот рюкзак. Но не всё добавила: нет QR кода (есть качественная табличка с текстом), сумок (вместо них рюкзак) и «скрытного» человека, а также всё ещё странное расположение сидений. Пальцы более-менее. Довольно интересная, но не прорывная модель. Кстати, пожилой человек в 2.5 немного похож на Валерия Истишева с Droider (не в обиду). Sber Kandinsky. Греф разочаровывает. Если Яндекс наоборот делает свои продукты бесплатными (почти все функции Yandex GPT теперь тоже бесплатно-безлимитны!), то Kandinsky получил жёсткие ограничения – только 20 изображений в месяц на ещё более худшей модели 3.0. Появилась и новая 3.2, но доступ к ней за 500 Руб./мес, и ограничения тоже будут – 200 картинок в месяц, что не особо много. Обещали новую и прорывную модель генерации видео также, но в итоге убрали имеющуюся, сейчас вообще за любые деньги нельзя генерировать видео там. Расстраивает. Если появится хороший видеогенератор, то я подпишусь на 500 Руб./мес, но пока Kandinsky деградировал, превратившись из мусора в экстра-мусор или как это вообще называть – просто посмотрите на изображения 3.0.

AivanElectric

10 месяцев назад

Недавно Яндекс запустил новую функцию для тех, у кого куплено место в облаке – умный редактор фото. Содержит автонастройку цвета, удаление фона и ластик – удаление объектов с прорисовыванием того, что за ними. Ластик работает, не всегда идеально, но работает. Причём скорее всего это Topaz Photo AI Remove. На фото из концертного зала видно, что удаление объекта в Topazе и Яндексе выглядит почти одинаково. И это странно, так как Topaz Labs платные и не Open Source. Модель Topazа весит ~1,7 ГБ. Но в Topaz можно выбрать приоритет скорости или качества. Удаление фона работает хорошо, причём учитываются размытые края (боке, не попало в ГРИП). Есть подозрение, что это новый инструмент удаления фона из Photoshop. Запросы обрабатываются секунд 30.

AivanElectric

10 месяцев назад

Недавно Яндекс запустил новый раздел в Шедевруме для тех, у кого есть подписка, а именно «Студия». Пока находится даже не в бета, а в альфа, так что особого качества не ждём. Что там можно делать: генерировать изображения без публикации; зафиксировать сид; автоулучшение промпта; апскейлер, но Topaz Photo AI намного лучше; удаление фона (вроде достаточно качественно); редактор портрета. Самое интересное – последняя функция. Причём можно загрузить свою, не сгенерированную фотографию, и изменить выражения лица, добавить аксессуары и головной убор… Возможностей больше, чем в Photoshop Neural Filters. Лицо вроде сильно не меняется, и разрез глаз не сужается (в Photoshop замечал такую проблему при изменении эмоций). Жаль, что пока нет генеративного расширения и добавления предметов не к портрету как в Firefly. Да и с лицом не всегда хорошо.