HunyuanImage-3.0 Tencent представили и открыли исходный код HunyuanImage-3.0, самой мощной опенсорс txt2img модели на сегодняшний день 80B параметров, 13 миллиардов активных параметров на токен, 64 эксперта в MoE. Самая большая MoE-модель для генерации изображений с открытым кодом HunyuanImage-3.0 использует единую мультимодальную архитектуру на основе авторегрессивного фреймворка, что сильно отличается от традиционных DiT-архитектур. На новой архитектуре улучшилось понимание контекста, качество изображения и следование промпту. Рекомендованные требования: ОС: Linux GPU: NVIDIA GPU с поддержкой CUDA Место на диске: 170GB GPU Memory: ≥3×80GB (для лучшей производительности рекомендуется 4×80 ГБ) Оптимизации производительности Для ускорения до 3x можно установить: - FlashAttention — оптимизированные вычисления внимания - FlashInfer — ускоренный вывод для MoE-моделей GitHub Hugging Face Официальный сайт - тут можно попробовать модель