Подразделение Alibaba сообщила о выпуске Qwen-VLA - модели, которая способна управлять роботами разных типов без отдельной настройки под каждую платформу. VLA-модели получают на вход изображение с камеры и текстовую команду, а на выходе выдают конкретные действия для робота. Новинка построена на VL-основе Qwen3.5-4B и дополнена декодером действий на 1,15 млрд параметров. Модель объединяет 3 типа задач: манипуляции (захват и перемещение предметов), навигацию и прогнозирование траекторий, а переключение между разными роботами требует лишь изменения текстовой инструкции. Qwen-VLA не уступает специализированным системам, обученным под каждую отдельную задачу - GR00T (разработка NVIDIA) и π0.5 (Physical Intelligence). На наборе тестов LIBERO Qwen-VLA показала 97,9%, на RoboTwin-Hard - 87,2%, а в экспериментах с двуруким роботом ALOHA средний процент успешных выполнений в знакомых условиях составил 83,6% и 76,9% в незнакомых. Пока опубликован технический отчет и создан репозиторий прое
✔️ Qwen анонсировала модель для управления роботами разных конструкций
ВчераВчера
16
1 мин