Компания Google DeepMind представила новую разработку — самообучающуюся модель искусственного интеллекта для роботов. Она называется Gemini Robotics. Эта технология объединяет сразу три важных умения: видеть окружающий мир, понимать команды и выполнять действия. Теперь роботы смогут лучше разбираться в том, что видят, и точнее реагировать на указания. Gemini Robotics — это система, построенная на архитектуре Vision-Language-Action, или просто VLA. Она помогает роботу анализировать картинку, слушать команды и двигаться так, как нужно. Например, робот может взять чашку кофе, не пролив ни капли. А улучшенная версия — Gemini Robotics-ER — ещё лучше ориентируется в пространстве. Она умеет распознавать предметы и находить самый удобный способ их взять. По крайней мере это показали на тесте с кофейной кружкой: робот выбрал безопасный путь и аккуратно её поднял. Модель легко приспосабливается к разным роботам. Основное обучение проходило на платформе ALOHA-2 с двумя механическими руками. Но уж
Google DeepMind создал самообучающийся ИИ, который будут использовать исключительно роботы
15 марта 202515 мар 2025
1
1 мин