Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

Tencent открыла исходный код фреймворка обучения с подкреплением WorldCompass на основе “World Model”

Команда Tencent Hunyuan открыла исходный код WorldCompass — фреймворка постобучения с подкреплением для моделей мира, который повышает точность выполнения сложных действий на 35 процентных пунктов. — pandaily.com 10 марта команда 3D, работающая над моделью Hunyuan от Tencent, объявила об открытом выпуске WorldCompass — фреймворка постобучения с подкреплением, разработанного для моделей мира (world models). WorldCompass служит официальным расширением с подкреплением для Hunyuan World Model 1.5, призванным повысить точность выполнения задач и визуальную согласованность в долгосрочных интерактивных задачах. Фреймворк специально разработан для интерактивных моделей мира с длинными последовательностями. Посредством постобучения на основе обучения с подкреплением система направляет модели для лучшей интерпретации инструкций пользователя и исследования виртуальных сред. Tencent сравнивает этот фреймворк с «компасом» для моделей мира, обеспечивающим направляющее руководство во время инференса

Команда Tencent Hunyuan открыла исходный код WorldCompass — фреймворка постобучения с подкреплением для моделей мира, который повышает точность выполнения сложных действий на 35 процентных пунктов. — pandaily.com

10 марта команда 3D, работающая над моделью Hunyuan от Tencent, объявила об открытом выпуске WorldCompass — фреймворка постобучения с подкреплением, разработанного для моделей мира (world models).

WorldCompass служит официальным расширением с подкреплением для Hunyuan World Model 1.5, призванным повысить точность выполнения задач и визуальную согласованность в долгосрочных интерактивных задачах.

Фреймворк специально разработан для интерактивных моделей мира с длинными последовательностями. Посредством постобучения на основе обучения с подкреплением система направляет модели для лучшей интерпретации инструкций пользователя и исследования виртуальных сред. Tencent сравнивает этот фреймворк с «компасом» для моделей мира, обеспечивающим направляющее руководство во время инференса модели.

-2

В ходе экспериментальных испытаний исследователи применили WorldCompass к открытой модели мира WorldPlay. Результаты показали, что при выполнении сложных составных действий — таких как одновременное движение и вращение — базовая модель достигала точности действий около 20%, в то время как модели, обученные с помощью WorldCompass, улучшили этот показатель до примерно 55%, что является приростом более чем на 35 процентных пунктов. В более простых сценариях действий точность возросла примерно на 10 процентных пунктов.

Кроме того, на WorldScore, эталоне оценки моделей мира, предложенном Стэнфордским университетом, модели, обученные с WorldCompass, также показали более высокие результаты. Tencent заявила, что кодовая база и детали модели полностью открыты для поддержки дальнейших исследований в области моделей мира и физического ИИ.

Источник: IT Home

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи