Команда Tencent Hunyuan открыла исходный код WorldCompass — фреймворка постобучения с подкреплением для моделей мира, который повышает точность выполнения сложных действий на 35 процентных пунктов. — pandaily.com 10 марта команда 3D, работающая над моделью Hunyuan от Tencent, объявила об открытом выпуске WorldCompass — фреймворка постобучения с подкреплением, разработанного для моделей мира (world models). WorldCompass служит официальным расширением с подкреплением для Hunyuan World Model 1.5, призванным повысить точность выполнения задач и визуальную согласованность в долгосрочных интерактивных задачах. Фреймворк специально разработан для интерактивных моделей мира с длинными последовательностями. Посредством постобучения на основе обучения с подкреплением система направляет модели для лучшей интерпретации инструкций пользователя и исследования виртуальных сред. Tencent сравнивает этот фреймворк с «компасом» для моделей мира, обеспечивающим направляющее руководство во время инференса
Tencent открыла исходный код фреймворка обучения с подкреплением WorldCompass на основе “World Model”
10 марта10 мар
1 мин