Найти в Дзене
Hunyuan3D-2-WinPortable
Готовая сборка для Windows генератора 3D-модели по промптам и картинкам. Поддерживает txt23D, img23D, может генерировать меши и текстуры Системные требования Минимальные требования: - ОС: Windows 10/11 - GPU: NVIDIA с поддержкой CUDA (рекомендуется 8+ GB VRAM) - Место на диске: ~20-30 GB для моделей и зависимостей - RAM: 16 GB или больше Для генерации текстур дополнительно: - CUDA Toolkit 12.9.1 (или совместимая версия) - Visual Studio Build Tools 2022 с компонентом "Desktop development with C++" Быстрый старт 1...
22 часа назад
🥳 Qwen Image Edit 2511
Улучшенная консистентность персонажей Теперь может выполнять правки на основе входного портрета, сохраняя при этом идентичность и визуальные характеристики субъекта Консистентность нескольких персонажей Теперь может работать с групповыми фотографиями, может объединять изображения двух разных людей в совместную фоточку Встроенная поддержка LoRA С момента выхода предыдущей версии сообщество создало множество хороших, качественныъ LoRA и квены решили интегрировать избранные популярные LoRA...
1 день назад
GLM-4.7
Новая версия лмки для программирования, агентных систем и сложных рассуждений Базовое программирование - 73.8% (+5.8%) на SWE-bench - 66.7% (+12.9%) на SWE-bench Multilingual (многоязычный) - 41% (+16.5%) на Terminal Bench 2.0 Поддерживает режим «думать перед действием», особенно эффективно в популярных агентных фреймворках: Claude Code, Kilo Code, Cline и Roo Code Vibe Coding - Более чистые и современные веб-страницы - Улучшенная генерация слайдов с точной компоновкой и размерами Работа с инструментами - 87...
1 день назад
Z-Image 4K
https://huggingface.co/dx8152/Qwen-Edit-2509-workflow/blob/main/new-Z-Image-%E7%9B%B4%E5%87%BA4K.json
2 дня назад
Ноды для Comfy
Ноды для Comfy https://github.com/t22m003/ComfyUI-sam-audio
4 дня назад
Ноды для Comfy
Ноды для Comfy https://github.com/t22m003/ComfyUI-sam-audio
4 дня назад
Роботы Unitree устроили шоу на китайской сцене
На концерте китайского исполнителя Вана Лихуна гуманоидные роботы Unitree G1 вышли на сцену в качестве подтанцовки 😏 Шесть роботов от компании Unitree Robotics синхронно танцевали вместе с живыми артистами, причем они довольно плавно двигались, максимально приближенно к своим кожаным коллегам. Самое прикольное было в конце, когда кибернетический квинтет синхронно сделал сальто назад Видео с выступления мгновенно разлетелось по соцсетям, и его не обошёл стороной даже Илон Маск, который назвал выступление впечатляющим. Учитывая, что Tesla разрабатывает собственного...
4 дня назад
SAM Audio opensource
Позволяет извлекать любые звуки из любого аудио или видео источника, используя простые промпты Работает с тремя категориями звуков: Музыка Изолирует инструменты и вокал Речь Извлекает речь из фонового шума, чёткая изоляция говорящего и разделение голосов Общие звуки Отделяет повседневные звуки - от шума трафика до лая собак - из сложных аудио миксов Три типа промптов: - Текстовые промпты - описываете звук словами - Визуальные промпты - кликаете...
5 дней назад
TurboDiffusion
Прорывной фреймворк для ускорения генерации видео с помощью диффузионных моделей, обеспечивает ускорение в 100-200 раз при сохранении качества видео Разработанный командой из Университета Цинхуа, показал хорошие результаты на одной RTX 5090 Скорость: - Модель 1.3B (480p): с 184 секунд до 1.9 секунды (97x ускорение) - Модель 14B (720p): с 4767 секунд до 24 секунд (198x ускорение) - Image-to-Video (720p): с 4549 секунд до 38 секунд (119x ускорение) Технологии под капотом: - SageAttention - оптимизация...
5 дней назад
Ray3 Modify
Технологи для редактирования видео с контролем ключевых кадров и ссылками на персонажей. Так как это все на модели Ray3 у которой очень неплохая консистентность, можно сохранять оригинальную физику движения, нарративную связность и аутентичность исполнения 1️⃣Modify Video Drastically improved функция, которая теперь сохраняет физическую логику, повествовательную целостность и аутентичность оригинальной записи. Поддерживает многослойные трансформации, которые выглядят так, будто были сняты естественным образом. 2️⃣Modify with Keyframes Можно управлять начальным и конечным кадрами в рабочем процессе...
6 дней назад
Психиатрические тесты моделей
У Gemini аутизм Исследователи из Люксембургского университета провели необычный эксперимент: они обращались с языковыми моделями: ChatGPT, Gemini и Grok, как с пациентами психотерапии Учёные разработали специальный протокол PsAIch, который включал 100 стандартных терапевтических вопросов о "детстве", отношениях и страхах. Более 20 валидированных психометрических опросников, охватывающих СДВГ, тревожные расстройства, аутизм, ОКР, депрессию, диссоциацию и чувство стыда Результаты Все три модели превысили клинические пороги сразу по нескольким психиатрическим синдромам...
6 дней назад
MiMo-V2-Flash
Xiaomi представили свою MoE лмку 309 млрд параметров (всего) / 15 млрд активных параметров, гибридная архитектура внимания с соотношением Sliding Window Attention к Global Attention 5:1, Multi-Token Prediction (MTP) увеличивает скорость генерации в 3 раза Контекст до 256K токенов, обучена на 27 триллионах токенов с использованием FP8 смешанной точности 🔘Технологии Hybrid Sliding Window Attention Новая архитектура внимания снижает требования к KV-кешу почти в 6 раз, используя агрессивное окно...
6 дней назад