426 подписчиков

HunyuanImage-3.0

28 сентября 202528 сен 2025

~1 мин

HunyuanImage-3.0 Tencent представили и открыли исходный код HunyuanImage-3.0, самой мощной опенсорс txt2img модели на сегодняшний день 80B параметров, 13 миллиардов активных параметров на токен, 64 эксперта в MoE. Самая большая MoE-модель для генерации изображений с открытым кодом HunyuanImage-3.0 использует единую мультимодальную архитектуру на основе авторегрессивного фреймворка, что сильно отличается от традиционных DiT-архитектур. На новой архитектуре улучшилось понимание контекста, качество изображения и следование промпту. Рекомендованные требования: ОС: Linux GPU: NVIDIA GPU с поддержкой CUDA Место на диске: 170GB GPU Memory: ≥3×80GB (для лучшей производительности рекомендуется 4×80 ГБ) Оптимизации производительности Для ускорения до 3x можно установить: - FlashAttention — оптимизированные вычисления внимания - FlashInfer — ускоренный вывод для MoE-моделей GitHub Hugging Face Официальный сайт - тут можно попробовать модель

HunyuanImage-3.0

Tencent представили и открыли исходный код HunyuanImage-3.0, самой мощной опенсорс txt2img модели на сегодняшний день

80B параметров, 13 миллиардов активных параметров на токен, 64 эксперта в MoE. Самая большая MoE-модель для генерации изображений с открытым кодом

HunyuanImage-3.0 использует единую мультимодальную архитектуру на основе авторегрессивного фреймворка, что сильно отличается от традиционных DiT-архитектур.

На новой архитектуре улучшилось понимание контекста, качество изображения и следование промпту.

Рекомендованные требования:

ОС: Linux

GPU: NVIDIA GPU с поддержкой CUDA

Место на диске: 170GB

GPU Memory: ≥3×80GB (для лучшей производительности рекомендуется 4×80 ГБ)

Оптимизации производительности

Для ускорения до 3x можно установить:

- FlashAttention — оптимизированные вычисления внимания

- FlashInfer — ускоренный вывод для MoE-моделей

GitHub

Hugging Face