VLA-модели для роботов
«Возьми яблоко со стола и положи его в корзину, которая стоит на полу рядом с диваном». Для человека эта задача тривиальна. Для традиционного запрограммированного робота — головоломка, требующая миллионов строк кода: распознать яблоко среди других объектов, найти стол, рассчитать траекторию захвата, избежав столкновений, идентифицировать корзину и диван, аккуратно положить яблоко, не раздавив его. Но что, если робот сможет понять эту команду на естественном языке так же, как и мы? Именно это обещают...