228 подписчиков

🤖 Gemini Robotics: ИИ выходит в реальный мир

13 марта 202513 мар 2025

3 мин

В последние годы искусственный интеллект сделал огромный скачок вперед, но его возможности по-прежнему были ограничены цифровым пространством. Теперь команда Google DeepMind решила перевернуть представление о том, на что способен ИИ, представив Gemini Robotics и Gemini Robotics-ER — два революционных решения, которые приближают роботов к по-настоящему «живому» взаимодействию с миром вокруг нас. 🌍 От виртуального к реальному Если раньше модели, построенные на Gemini 2.0, блестяще работали с текстами, изображениями, видео и аудио, то теперь Gemini Robotics переходит на следующий уровень: этот ИИ учится действовать в физическом пространстве, превращая команды в реальные движения роботов. Благодаря новому подходу Vision-Language-Action (VLA), робот способен не просто «видеть» и «понимать», но и полноценно выполнять физические действия — от складывания сложных фигур оригами до аккуратной упаковки продуктов в пакеты. 🧠 Три кита Gemini Robotics 🔹 Гибкость Gemini Robotics прекрасно адаптиру

🌍 От виртуального к реальному

Если раньше модели, построенные на Gemini 2.0, блестяще работали с текстами, изображениями, видео и аудио, то теперь Gemini Robotics переходит на следующий уровень: этот ИИ учится действовать в физическом пространстве, превращая команды в реальные движения роботов. Благодаря новому подходу Vision-Language-Action (VLA), робот способен не просто «видеть» и «понимать», но и полноценно выполнять физические действия — от складывания сложных фигур оригами до аккуратной упаковки продуктов в пакеты.

🧠 Три кита Gemini Robotics

🔹 Гибкость Gemini Robotics прекрасно адаптируется к новым условиям и задачам, которые никогда не встречал ранее. Например, во время тестов он успешно справлялся с совершенно незнакомыми предметами и нестандартными заданиями, более чем вдвое превысив результаты других лучших моделей на общем бенчмарке.

🗣 Интерактивность Построенная на базе Gemini 2.0, модель понимает обычный человеческий язык и способна легко адаптироваться к динамическим изменениям окружения. Робот следит за ситуацией вокруг и быстро реагирует, даже если кто-то внезапно изменил условия задачи или переместил объект.

✋🏼 Ловкость Одним из самых удивительных достижений Gemini Robotics является его способность к тонким манипуляциям. Сегодня робот способен выполнять действия, которые раньше казались слишком сложными — например, аккуратно складывать бумагу или осторожно перемещать хрупкие предметы, не теряя их по дороге.

⚙️ Множество воплощений

Инженеры Google DeepMind разработали модель таким образом, чтобы она легко могла адаптироваться под разные типы роботов. Gemini Robotics успешно работает как с двухруким роботом ALOHA 2, так и с популярными манипуляторами Franka, используемыми в научных лабораториях. Более того, уже сейчас идет активная работа с компанией Apptronik над применением этой модели в гуманоидных роботах Apollo нового поколения, которые смогут помогать человеку в самых разнообразных повседневных задачах.

📌 Embodied Reasoning — ключ к разумным роботам

Вторая представленная модель, Gemini Robotics-ER, сосредоточена на пространственном мышлении — одном из важнейших аспектов работы роботов в физическом мире. Это расширение позволяет робототехникам интегрировать Gemini Robotics-ER с существующими программами, обеспечивая:

🔸 Точное распознавание объектов в 3D-пространстве
🔸 Планирование безопасной траектории движения
🔸 Генерацию кода управления для робота в реальном времени

Например, при демонстрации кружки с ручкой Gemini Robotics-ER самостоятельно подбирает оптимальный способ захвата и безопасную траекторию движения. Это открывает огромные перспективы для создания полностью автономных решений, готовых к работе сразу «из коробки».

🛡️ Безопасность прежде всего

Внедряя ИИ в физический мир, команда DeepMind уделила особое внимание вопросам безопасности и этики. Для этого была разработана новая методика оценки действий роботов — на основе так называемой «Робоконституции», вдохновленной знаменитым произведением Айзека Азимова. Теперь модели ИИ самостоятельно выбирают только безопасные сценарии поведения, что значительно снижает риск ошибок или несчастных случаев.

Для дальнейшего изучения и совершенствования модели выпущен специальный набор данных, позволяющий разработчикам проверять роботов на соблюдение этических и безопасных норм поведения в реальной жизни.

🚀 Что дальше?

Сегодня Google DeepMind уже сотрудничает с ведущими компаниями и приглашает избранных партнеров, которые помогут развивать Gemini Robotics и Gemini Robotics-ER дальше. Уже ведется работа с Apptronik над созданием нового поколения человекоподобных роботов, которые совсем скоро могут стать неотъемлемой частью нашей повседневной жизни.

Возможно, скоро мы увидим, как роботы на базе Gemini помогают не только в лабораториях и на заводах, но и становятся нашими домашними помощниками, способными понимать нас буквально с полуслова.

🌐 Источник новости: Gemini Robotics — Google DeepMind