Найти в Дзене
Nvidia показала DLSS 5
И выглядит это словно Хуанг познал дзен и прикрутил под капот лоры на реализм и апскейлеры. С резиком мало фрагментов с DLSS 5, чтобы оценить стабильность и качество фреймгена (хотя тут скорее нейрорендер). По остальным примерам ощущение, что всё какое-то пересвеченное, и в целом арт-дирекшн разработчиков теряется. Как буд-то DLSS 5 подталкивает игру перешагнуть зловещую долину, а она к этому не готова и ей лучше остаться такой с какими текстурами, освещением и прочим её задумывали...
2 дня назад
Добрался посмотреть первый выпуск Wild TV от братана @pavelzhigar и это пушка! Столько деталей и отсылок! Очень качественная работа с четко
выдержанным стилем MTV той эпохи. Сразу перед глазами TOP-чарт, чудаки, бесконечный просмотр клипов, экстрим, музновости и интервью, лайвы с концертов, звёздные бои насмерть, рестлинг, итд. Приколол Дюк Нюкем наоборот и другая безумная реклама и шоу. Понравилась тема с заменой виджеев на животных. Снимает часть барьеров с восприятия и выглядит свежо в знакомом антураже. Плюс они все разные, каждый в одежде со своим стилем, яркие, и ты даже по нескольким секундам чувствуешь, что они настоящие и у них есть характер. Они живут даже, когда видео закончилось. Моя любимая часть экстрим спорт Wild Zone и следующий за этим скейтборд клип Primal Animal...
5 дней назад
Black Forest Labs: выпустили Flux Klein 9B KV, обновлённую версию своего генератора картинок вышедшего в январе
Отличие от предшественника в наличии KV-кэша для ускорения мульти-референс редактирования. Он кэширует данные из рефов во время первого этапа денойза, и хранит их у себя вместо того, чтобы получать их каждый раз заново, тем самым устраняя избыточные вычисления в последующих шагах, что даёт ускорение в ~2,5 раза. При этом KV модель заточена генерить в 4 шага. На 4090 выдаёт картинку 832х1248 за 1 сек (3,28 ит/сек), хотя на первый запуск будет больше времени ибо идёт кэширование...
6 дней назад
Работа подписчика @Andreusha
Дальше слово автору: Контестная работа NOAGI о мире ближайшего будущего. Автор 13 дней работы в одного от идеи со сценарием до сведения звука и покраски. Основные модели Seedance2.0, Kling 3.0/ Wan2.2 для креативного апскейла Vid2Vid/ Magnific upscaler. Suno 5, Elevenlabs звук. Около 300$ на генерации. При старте проекта не ожидал ничего, поскольку сперва хотел протестировать возможности сиденса. Спустя пару дней и готовых 30 секунд, все мои друзья(многие из продакшена и графики) увидев демку, единогласно сказали "визуал огонь". Я решил не оставлять как было, 2 дня уделив чисто написанию истории...
6 дней назад
А вот это уже интересно
Preview — тоже платформа для генерации картинок и видео как Krea, Freepik, и Flora, с бесконечным холстом, тегами для консистентных персонажей, нано бананой, и прочим. Но есть пара отличительных фич: * Можно из картинки сгенерить 3D сцену как в World Labs (может даже это они под капотом), чтобы вертеть камеру как хочешь и делать шоты с нужных ракурсов. * Camera Bag: можно задать конкретную камеру, линзу, диафрагму и...
6 дней назад
Ну и к слову про ограничения и сторителлинг
В Grok Imagine теперь можно генерить арты и видео, которые допускаются в фильмах с рейтингом R (нагота, матерщина, алкоголь, итд). Seedance давай, что можно Гроку — можно и тебе. Твит
1 неделю назад
Гарри Поттер: Balenciaga
2023 »»»»»» 2026 От анимированных фото к полноценным видео с консистентными персонажами и голосами. Только липсинк отстаёт и в сильной динамике местами съедаются делали, но это решаемо, если не сегодня профильными моделями для липсинка (Sync) и апскейла (Topaz), то завтра. Важнее другое: народ набил руку на генерации визуала, и теперь начинает качать нарратив...
1 неделю назад
Nvidia: выпустила студийный драйвер 595
79. Заявляется: * Оптимизация NVFP4 моделей в Comfy. * Буст NeuroStream в топазе. * Ускорение LTXV на 50% при использовании FP8 весов и на 30% между потребление VRAM. * Двойное ускорение Flux 2 Klein 9B KV при использовании нескольких рефов, и буст на 40% при использовании FP8 весов со снижением на 30% потребления VRAM. * Инференс VoiceMod в WindowsML через GPU, а не CPU. NVFP4 веса дают буст только на 50-й серии видекарт, так что на своей 4090 я буду щупать оптимизации в FP8 и выше...
1 неделю назад
Topaz: в коллабе с Nvidia завезли в Topaz Photo динамическую загрузку VRAM под названием NeuroStream
По их заверениям для работы теперь требуется ~3 ГБ VRAM вместо 56 ГБ (то есть, на 95% меньше). Пишут на маках М-серии тоже должно работать. Опробовать можно на новой локальной модели Wonder 2, которая на черрипиках расшакаливает джепеги четко придерживаясь оригинала и не креативя отсебятину...
1 неделю назад
Comfy: обновили API ноды Хуньяня для работы с 3D
Что нового: * Умный ретоп для более детальных мешей (211 кредитов) * UV развертка для подготовки к текстурированию (42 кредита) * Декомпозиция меша на части (127 кредитов) Также в последней обнове появились ворфлоу для генерации вариаций и апскейла через Grok Imagine, виртуальная примерочная через Seedream 4.5 (почему-то не 5), анимация раскадровки на связке Google и Kling, а также упрощенный интерфес (App Mode) как на Comfy Cloud. Локально можно попробовать на ворке для релайта с помощью лоры на Qwen 2509 или в генерации видео с LTXV 2...
1 неделю назад