1064 подписчика

Tencent представила HunyuanVision — новую мультимодальную модель, объединяющую текст и изображения в ИИ-фреймворке

27 октября 202527 окт 2025

~1 мин

Tencent представила HunyuanVision — новую мультимодальную модель, объединяющую текст и изображения в ИИ-фреймворке. ИИ теперь не просто 'видит', а понимает сцены, рассуждает и ведёт диалог, анализируя мельчайшие детали. 🧠 Поддерживает мультиязычное взаимодействие (включая русский) и выполняет сложные задачи: описание изображений, логические рассуждения и объяснение визуальных явлений. Ключевые функции: Visual Reasoning, Visual Dialogue, Thinking-on-Image — буквально 'думает глазами'. Обновлённая HunyuanVision-1.5 демонстрирует прогресс в скорости и качестве. Доступна через Tencent Cloud API и LMArena. Технический отчёт и веса для исследователей будут опубликованы в октябре. 🚀 https://cloud.tencent.com/document/product/1729/104753 Подпишись на канал

Поддерживает мультиязычное взаимодействие (включая русский) и выполняет сложные задачи: описание изображений, логические рассуждения и объяснение визуальных явлений. Ключевые функции: Visual Reasoning, Visual Dialogue, Thinking-on-Image — буквально 'думает глазами'.

Обновлённая HunyuanVision-1.5 демонстрирует прогресс в скорости и качестве. Доступна через Tencent Cloud API и LMArena. Технический отчёт и веса для исследователей будут опубликованы в октябре. 🚀

https://cloud.tencent.com/document/product/1729/104753

Подпишись на канал

Гаджеты и электроника

5,73 млн интересуются