Для поколения ученых, выросших на «Звездных войнах», наблюдается разочаровывающее отсутствие дроидов, похожих на C-3PO, бродящих по нашим городам и домам. Где гуманоидные роботы, наделенные здравым смыслом и способные помочь по дому и на работе?
Быстрый прогресс в области искусственного интеллекта (ИИ) может заполнить эту дыру. «Я не удивлюсь, если мы окажемся последним поколением, для которого эти научно-фантастические сцены не являются реальностью», — говорит Александр Хазацкий, исследователь машинного обучения и робототехники из Стэнфордского университета в Калифорнии.
От OpenAI до Google DeepMind, почти каждая крупная технологическая фирма, имеющая опыт в области искусственного интеллекта, сейчас работает над внедрением универсальных алгоритмов обучения, которые используются в чат-ботах, известных как базовые модели, в робототехнике. Идея состоит в том, чтобы наделить роботов здравым смыслом, что позволит им решать широкий спектр задач. Многие исследователи считают, что роботы могут стать действительно хорошими и очень быстрыми. «Мы считаем, что находимся на пороге кардинального изменения в робототехнике», — говорит Джерард Эндрюс, менеджер по маркетингу, специализирующийся на робототехнике, в технологической компании Nvidia в Санта-Кларе, Калифорния, которая в марте запустила модель искусственного интеллекта общего назначения, предназначенную для роботов-гуманоидов. .
В то же время роботы могут помочь улучшить ИИ. Многие исследователи надеются, что использование воплощенного опыта в обучении ИИ может приблизить их к мечте об «искусственном общем интеллекте» — ИИ, который обладает когнитивными способностями, подобными человеческим, для решения любых задач. «Последним шагом к настоящему интеллекту должен стать физический интеллект», — говорит Акшара Рай, исследователь искусственного интеллекта из Meta в Менло-Парке, Калифорния.
Но хотя многие исследователи воодушевлены последним внедрением искусственного интеллекта в робототехнику, они также предупреждают, что некоторые из наиболее впечатляющих демонстраций — это всего лишь демонстрации, часто проводимые компаниями, которые стремятся вызвать ажиотаж. «От демонстрации до внедрения может быть долгий путь», — говорит Родни Брукс, робототехник из Массачусетского технологического института в Кембридже, чья компания iRobot изобрела автономный пылесос Roomba.
На этом пути существует множество препятствий, включая сбор достаточного количества нужных данных, чтобы роботы могли учиться на них, работу с капризным оборудованием и решение проблем безопасности. «Необходимо изучить базовые модели робототехники», — говорит Гарольд Со, специалист по взаимодействию человека и робота в Национальном университете Сингапура. Но он скептически относится, по его словам, к тому, что эта стратегия приведет к революции в робототехнике, которую предсказывают некоторые исследователи.
Термин «робот» охватывает широкий спектр автоматизированных устройств: от роботизированных манипуляторов, широко используемых в производстве, до беспилотных автомобилей и дронов, используемых в военных и спасательных операциях. Большинство из них включают в себя своего рода искусственный интеллект — например, для распознавания объектов. Но они также запрограммированы на выполнение определенных задач, работу в определенных условиях или на определенный уровень человеческого контроля, говорит Джойс Сидопулос, соучредитель MassRobotics, инновационного центра робототехнических компаний в Бостоне, штат Массачусетс. Даже Atlas — робот, созданный Boston Dynamics, робототехнической компанией из Уолтема, штат Массачусетс, которая знаменито продемонстрировала свои навыки паркура в 2018 году — работает, тщательно картируя окружающую среду и выбирая лучшие действия для выполнения из библиотеки встроенных шаблонов.
Для большинства исследователей искусственного интеллекта, занимающихся робототехникой, цель состоит в том, чтобы создать что-то гораздо более автономное и адаптируемое к более широкому кругу обстоятельств. Это может начаться с роботов-манипуляторов, которые могут «подбирать и размещать» любой фабричный продукт, а затем превратиться в роботов-гуманоидов, которые, например, обеспечивают компанию и поддержку пожилым людям. «Существует так много применений», — говорит Сидопулос.
Человеческая форма сложна и не всегда оптимизирована для конкретных физических задач, но у нее есть огромное преимущество: она идеально подходит к миру, который построили люди. Робот в форме человека сможет физически взаимодействовать с миром почти так же, как это делает человек.
Однако управлять любым роботом, не говоря уже о человекоподобном, невероятно сложно. Казалось бы, простые задачи, такие как открытие двери, на самом деле чрезвычайно сложны и требуют от робота понимания того, как работают различные дверные механизмы, какое усилие прикладывать к ручке и как при этом сохранять равновесие. Реальный мир чрезвычайно разнообразен и постоянно меняется.
Подход, который сейчас набирает обороты, заключается в управлении роботом с использованием тех же базовых моделей искусственного интеллекта, которые используются в генераторах изображений и чат-ботах, таких как ChatGPT. Эти модели используют нейронные сети, вдохновленные мозгом, для обучения на огромных объемах общих данных. Они выстраивают ассоциации между элементами своих обучающих данных и, когда их просят предоставить выходные данные, используют эти связи для генерации подходящих слов или изображений, часто с невероятно хорошими результатами.
Аналогично, модель робота обучается на тексте и изображениях из Интернета, предоставляя ей информацию о природе различных объектов и их контекстах. Он также учится на примерах роботизированных операций. Его можно обучать, например, на видеороликах о роботах методом проб и ошибок или видеороликах о роботах, которыми дистанционно управляют люди, а также на инструкциях, которые сочетаются с этими действиями. Обученная модель робота затем может наблюдать сценарий и использовать изученные ассоциации, чтобы предсказать, какое действие приведет к наилучшему результату.
Другими словами, знания, полученные в результате интернет-траления, переносятся в действия робота. «Многие интернет-концепции просто передаются», — говорит Киртана Гопалакришнан, исследователь искусственного интеллекта и робототехники в Google DeepMind в Сан-Франциско - это радикально сокращает объем физических данных, которые робот должен усвоить, чтобы справиться с различными ситуациями.
Но чтобы полностью понять основы движений и их последствия, роботам все равно необходимо учиться на большом количестве физических данных. И в этом проблема.
Объединение данных — один из способов обойти эту проблему. Хазацкий и его коллеги создали DROID2, набор данных с открытым исходным кодом, который объединяет около 350 часов видеоданных от одного типа робота-манипулятора (робота-манипулятора Franka Panda 7DoF, созданного компанией Franka Robotics в Мюнхене, Германия), который удаленно управляется людьми в 18 лабораториях по всему миру. Камера-робот-глаз записывает визуальные данные в сотнях помещений, включая ванные комнаты, прачечные, спальни и кухни. Такое разнообразие помогает роботам хорошо справляться с задачами с ранее не встречавшимися элементами, говорит Хазацкий.
Еще один способ получить доступ к большим базам данных о движении — сосредоточиться на гуманоидной форме робота, чтобы ИИ мог учиться, просматривая видео людей, которых в Интернете миллиарды.
По словам исследователей, последний и многообещающий способ найти безграничные запасы физических данных — это моделирование. Многие робототехники работают над созданием трехмерных сред виртуальной реальности, физика которых имитирует реальный мир, а затем подключают их к роботизированному мозгу для обучения. Симуляторы могут обрабатывать огромные объемы данных и позволять людям и роботам виртуально взаимодействовать без риска в редких или опасных ситуациях, не изнашивая при этом механику.
ПОЛНАЯ СТАТЬЯ В ОРИГИНАЛЕ (англ.)
https://www.nature.com/articles/d41586-024-01442-5
Революция искусственного интеллекта приходит к роботам: как она их изменит? Объединение искусственного интеллекта и робототехники.
5 июня 20245 июн 2024
2
6 мин