Мы уже привыкли к тому, что навигаторы в телефонах предсказывают время прибытия, камеры распознают людей при входе, а чат-боты помогают оформить заказ в магазине. Всё это создаёт ощущение, будто ИИ всегда был рядом, хотя на самом деле массовое проникновение этих технологий произошло всего за последние пять‑семь лет. Сегодня практически все технически подкованные люди пользуются для работы или в повседневной жизни большими языковыми моделями (LLM), а разработчики предлагают всё новые и новые сервисы основанные на своих предыдущих продуктах. Да, у всего есть свои достоинства и недостатки, но преимущества предлагаемые передовыми нейросетевыми технологиями трудно переоценить. Однако у LLM есть существенный недостаток. Они неспособны делать что-то самостоятельно. Им нужен человек для взаимодействия с окружающим миром, кто-то с руками, глазами и телом, которое пойдёт и выполнит написанную искусственным интеллектом инструкцию. И этот пробел не долго оставался незаполненным. На сцену выходят н