Один из главных барьеров на пути к универсальным роботам — не сила сервоприводов и не качество камер, а умение работать в длинных, непредсказуемых сценариях. На кухне, в лаборатории или на складе нельзя просто реагировать на картинку «здесь и сейчас»: нужно помнить, что уже сделано, понимать, что изменится через секунду, и выбирать действия так, чтобы не загнать себя в тупик. Именно в эту сторону смотрит LingBot-VA — открытый проект команды Ant Lingbo, который описывают как каузальную видео‑действие (video-action) мир‑модель для управления универсальными роботами. Ключевой сдвиг: робот перестаёт быть «рефлекторным». От “observe–react” к “imagine–act” Классические VLA-подходы (vision‑language‑action) часто действуют по принципу «увидел → сразу двинулся». LingBot-VA вставляет между наблюдением и действием промежуточный, но решающий этап — прогноз будущего: Идея простая, но последствия большие: решение становится не реакцией, а попыткой привести мир к желаемому состоянию, основанной на пр
LingBot-VA: когда робот сначала «представляет», а потом действует
2 февраля2 фев
3 мин