1854 подписчика

От сборки коробок до ремонта пылесосов: робототехническая модель GEN-1 достигла надежности 99%

7 апреля7 апр

4 мин

Новая модель GEN-1 от Generalist достигает производственного успеха в физических задачах. Новая модель может реагировать на сбои и придумывать ходы, которым ее не обучали. — arstechnica.com Компания Generalist, занимающаяся разработкой роботизированного машинного обучения, анонсировала GEN-1 — новую физическую систему искусственного интеллекта, которая, по утверждению компании, «достигает производственного уровня успеха» в «широком спектре физических навыков», ранее требовавших ловкости и мышечной памяти человеческих рук. Generalist также подчеркивает способность новой модели реагировать на сбои, импровизируя новые движения и «соединяя идеи из разных областей для решения новых задач». GEN-1 основана на предыдущей модели Generalist — GEN-0, которую компания представила в ноябре как доказательство применимости законов масштабирования в обучении робототехники, демонстрируя, как увеличение объема предварительного обучения и вычислительного времени улучшает производительность после обучения

Компания Generalist, занимающаяся разработкой роботизированного машинного обучения, анонсировала GEN-1 — новую физическую систему искусственного интеллекта, которая, по утверждению компании, «достигает производственного уровня успеха» в «широком спектре физических навыков», ранее требовавших ловкости и мышечной памяти человеческих рук. Generalist также подчеркивает способность новой модели реагировать на сбои, импровизируя новые движения и «соединяя идеи из разных областей для решения новых задач».

GEN-1 основана на предыдущей модели Generalist — GEN-0, которую компания представила в ноябре как доказательство применимости законов масштабирования в обучении робототехники, демонстрируя, как увеличение объема предварительного обучения и вычислительного времени улучшает производительность после обучения. Однако, в то время как большие языковые модели смогли эффективно обработать триллионы слов, коллективно написанных в Интернете в рамках своего обучения, у роботизированных моделей нет аналогичного, легкодоступного источника качественных данных о том, как люди манипулируют объектами.

Чтобы помочь решить эту проблему, Generalist полагалась на «дата-руки» (data hands) — набор носимых клешней, которые фиксируют микродвижения и визуальную информацию, когда люди выполняют ручные задачи. Generalist заявляет, что собрала более полумиллиона часов и «петабайты данных о физическом взаимодействии» для обучения своей физической модели.

Результатом стала автономная система, достаточно точная, чтобы положить деньги в кошелек и достаточно адаптивная, чтобы сложить белье или рассортировать автозапчасти. По данным Generalist, модель теперь достигает 99-процентной точности в повторяющихся, но деликатных механических задачах, таких как складывание коробок, упаковка телефонов и обслуживание роботов-пылесосов, причем примерно в три раза быстрее, чем предыдущая модель GEN-0. По словам компании, GEN-1 достигает этих показателей всего после часа адаптации предварительного обучения к «роботизированным данным», применимым к ее конкретному роботизированному воплощению.

Восстановление после ошибок

В прошлом сложные роботизированные системы обычно полагались на тщательно запрограммированные движения или обучались выполнять исключительно одну задачу с минимальными вариациями. Generalist утверждает, что отличие GEN-1 заключается в способности одной модели импровизировать на основе предыдущего опыта и естественно реагировать на сбои, даже если они «находятся далеко за пределами обучающего распределения».

Например, в интервью Forbes инженеры Generalist описывают, как модель слегка встряхнула пластиковый пакет, чтобы плюшевая игрушка сместилась внутрь, хотя такое движение не было явно запрограммировано в обучающих данных. В видео, опубликованном Generalist, также показано, как роботизированные руки разумно корректируются, когда гибкие объекты вылетают из ожидаемых положений, или как они перекладывают рубашку, которая сместилась во время складывания. Generalist также описывает, как модель корректирует и перехватывает маленькие шайбы, когда их сдвигают с места, используя обе руки для установки их в нужное положение.

«Никто не программировал робота на совершение ошибок, следовательно, никто не программировал робота на восстановление после ошибок», — говорит инженер Generalist Феликс Ван в этом видео. «И это происходит само по себе».

Generalist — не единственная компания, работающая над внедрением методов машинного обучения в физическую сферу. В прошлом году Google продемонстрировала возможности «визуального обучения действиям» своих моделей Gemini Robotics, которые могут понимать общие команды действий от людей и реагировать на них. А компания Physical Intelligence произвела фурор парой роботизированных рук на колесной платформе, обученных в специально разработанных симулированных бытовых условиях для выполнения задач от уборки пролитого до застилания кроватей.

Затем есть Tesla, которая впервые представила своих человекоподобных роботов Optimus в конце 2024 года со постановочными демонстрациями, которые на самом деле управлялись удаленными операторами-людьми. В январе генеральный директор Tesla Илон Маск признал, что нынешние роботы Optimus все еще не выполняют «полезной работы» в Tesla, несмотря на предыдущие заявления об обратном.

Однако с GEN-1 Generalist заявляет, что ее физические модели достигли переломного момента, подобного GPT-3, когда некоторые задачи начинают «превышать уровень производительности, необходимый для развертывания в экономически полезных условиях», и когда «мы можем ожидать, что каждое новое поколение модели будет приводить к освоению нового набора все более сложных задач». Выразим надежду, что это означает, что мы наконец-то на пути к созданию доступного робота для складывания белья в домашних условиях в ближайшем будущем.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Kyle Orland

Оригинал статьи

Робот пылесос

423,4 тыс интересуются