Команда разработчиков больших языковых моделей Hunyuan от Tencent, в сотрудничестве с Сямэньским университетом, представила JarvisEvo – интеллектуального агента для редактирования изображений, созданного для того, чтобы редактировать изображения подобно дизайнерам, то есть видеть и корректировать одновременно. JarvisEvo работает на основе механизма интерактивной мультимодальной цепи рассуждений (iMCoT): сначала он генерирует план редактирования, затем вызывает профессиональные инструменты (интегрируя более 200 инструментов, включая Adobe Lightroom), наблюдает визуальные результаты и решает, следует ли продолжить, пересмотреть или исправить свой подход. Этот рабочий процесс решает основную проблему цепей рассуждений, основанных только на тексте, которые часто приводят к “слепому редактированию” и галлюцинациям инструкций. Чтобы обеспечить самосовершенствование, исследовательская группа представила структуру оптимизации политики синергетического редактирования и оценки (SEPO). Модель и
Tencent Hunyuan и Сямэньский университет представили JarvisEvo, агента на основе искусственного интеллекта для редактирования изображений
26 декабря 202526 дек 2025
1 мин