Tencent представила HunyuanVision — новую мультимодальную модель, объединяющую текст и изображения в ИИ-фреймворке. ИИ теперь не просто 'видит', а понимает сцены, рассуждает и ведёт диалог, анализируя мельчайшие детали. 🧠 Поддерживает мультиязычное взаимодействие (включая русский) и выполняет сложные задачи: описание изображений, логические рассуждения и объяснение визуальных явлений. Ключевые функции: Visual Reasoning, Visual Dialogue, Thinking-on-Image — буквально 'думает глазами'. Обновлённая HunyuanVision-1.5 демонстрирует прогресс в скорости и качестве. Доступна через Tencent Cloud API и LMArena. Технический отчёт и веса для исследователей будут опубликованы в октябре. 🚀 https://cloud.tencent.com/document/product/1729/104753 Подпишись на канал
Tencent представила HunyuanVision — новую мультимодальную модель, объединяющую текст и изображения в ИИ-фреймворке
27 октября 202527 окт 2025
~1 мин