Физика внутри ИИ: как «мировые модели» учат роботов действовать Что общего между Veo 3, Kling и физикой для роботов? Современные видеогенераторы учатся предсказывать, что будет в следующем кадре. Это по сути мини-симулятор мира: модель впитывает «здравый смысл» о движении, столкновениях, освещении — то есть простую физику. У OpenAI это прямо описывают как «мировую симуляцию»; Google подчёркивает «реализм и физику» в Veo 3; Kuaishou у Kling заявляет правдоподобные физические сцены. Видеомодель → учится динамике мира → умеет предсказывать последствия действий. Отсюда два пути: через зепу для людей — красивый ролик (Veo, Kling и др.); для машин — внутренний «мозг мира» для планирования и обучения роботов. И тут появился NVIDIA Cosmos это набор «мировых моделей», которые учат машины видеть сцену, понимать, что в ней произойдёт дальше, и планировать действия. ➡️При чем тут роботы? Cosmos Reason — «глаза+мозг»: модель, которая смотрит на видео/камеру, отвечает на вопросы и предлагает
Физика внутри ИИ: как «мировые модели» учат роботов действовать
12 августа 202512 авг 2025
1 мин