Подразделение Xiaomi Robotics выпустило vla-модель xiaomi-robotics-0, которая преобразует изображения и текст в команды для аппаратного обеспечения. Инженеры решили проблему срывов траектории и рывков из-за задержек вычислений: манипулятор продолжает выполнять текущую задачу, пока нейросеть рассчитывает следующий шаг. Это обеспечивает плавность работы. Вместо ускорения инференса реализована оптимизация очередей исполнения. Робот дорабатывает загруженный скрипт, маскируя задержку в 80 мс на потребительской RTX 4090. «Это архитектурное решение напоминает попытку скрыть загрузку уровня в игре за длинным коридором, но для реальной робототехники такой подход оказался спасительным кругом». https://dzen.ru/id/5c0e38ff46ef5c00aaa80527
Xiaomi Robotics представила VLA-модель для управления роботами
СегодняСегодня
~1 мин