Найти в Дзене
Цифровая Переплавка

🦾 Почему современные гуманоиды так и не научатся ловкости

Роботы-гуманоиды снова на пике хайпа. Tesla обещает «триллионные рынки», Figure строит планы интеграции роботов в рабочую силу, а инвесторы заливают миллиарды в компании, которые клятвенно заверяют: вот-вот машины будут двигаться и работать так же, как мы. Но Родни Брукс, один из ветеранов робототехники (создатель Roomba и Baxter), смотрит на это куда трезвее: без тактильной обратной связи и понимания биомеханики человекоподобные роботы никогда не достигнут человеческой ловкости. Современные подходы к обучению гуманоидов строятся вокруг визуальных данных. Камеры, видео с людей, датчики положения суставов — и на этом всё. Но человеческая ловкость держится не на зрении, а на ощущениях прикосновения и силе. ✋ В нашей руке около 17 000 механорецепторов, из них по тысяче на каждом пальце. Эти сенсоры позволяют:
— 👌 различать текстуры на уровне рёбер отпечатков,
— ⚖️ мгновенно корректировать силу захвата,
— 🔄 планировать движения, исходя из веса и формы предмета. Попробуйте достать спичку
Оглавление
Лабораторная сцена: инженер наблюдает, как гуманоидная рука пытается взять куриное яйцо. На мониторе — видеопоток и графики без стабильной тактильной обратной связи. Образ подчёркивает тезис Брукса: обучение «по картинке» даёт недостаточную ловкость для тонких манипуляций.
Лабораторная сцена: инженер наблюдает, как гуманоидная рука пытается взять куриное яйцо. На мониторе — видеопоток и графики без стабильной тактильной обратной связи. Образ подчёркивает тезис Брукса: обучение «по картинке» даёт недостаточную ловкость для тонких манипуляций.

Роботы-гуманоиды снова на пике хайпа. Tesla обещает «триллионные рынки», Figure строит планы интеграции роботов в рабочую силу, а инвесторы заливают миллиарды в компании, которые клятвенно заверяют: вот-вот машины будут двигаться и работать так же, как мы. Но Родни Брукс, один из ветеранов робототехники (создатель Roomba и Baxter), смотрит на это куда трезвее: без тактильной обратной связи и понимания биомеханики человекоподобные роботы никогда не достигнут человеческой ловкости.

🤲 В чём главная проблема?

Современные подходы к обучению гуманоидов строятся вокруг визуальных данных. Камеры, видео с людей, датчики положения суставов — и на этом всё. Но человеческая ловкость держится не на зрении, а на ощущениях прикосновения и силе.

✋ В нашей руке около 17 000 механорецепторов, из них по тысяче на каждом пальце. Эти сенсоры позволяют:
— 👌 различать текстуры на уровне рёбер отпечатков,
— ⚖️ мгновенно корректировать силу захвата,
— 🔄 планировать движения, исходя из веса и формы предмета.

Попробуйте достать спичку с онемевшими пальцами — и вы поймёте, насколько зрение беспомощно без тактильного слоя. Видео из лаборатории Роланда Юханссона наглядно демонстрируют: без осязания даже простейшие действия превращаются в хаос.

📜 Немного истории

— 🏭 1960-е — первые промышленные манипуляторы с простыми «клешнями»;
— 🤖
2000-е — Honda ASIMO, Sony QRIO, французский Pepper — красивые, но ограниченные;
— 🦿
2010-е — Boston Dynamics Atlas: впечатляющие шоу-видео, но не универсальная dexterity;
— 🚀
2020-е — стартапы Figure и Optimus от Tesla обещают «универсальных рабочих».

И всё же реальность упорно остаётся такой: на заводах доминируют захваты с параллельными губками и вакуумные присоски. Удобно, надёжно, просто. Но не похоже на наши руки.

🧠 Ошибка индустрии

Компании делают ставку на «обучение с демонстрацией»: показываем роботу видео, и он повторяет. Это сработало в speech-to-text и LLM. Но здесь другая физика.

⚡ Разница:

  • 🎙️ в распознавании речи были десятилетия инженерных наработок (сжатие сигналов для телефонии, фильтры);
  • 📸 в компьютерном зрении — модели, вдохновлённые физиологией кошачьей и человеческой сетчатки;
  • 📝 в языковых моделях — токенизация и эмбеддинги, основанные на письменной культуре.

А у тактильных данных нет такого «человеческого наследия». Мы не умеем их полноценно записывать, хранить и воспроизводить. И значит, у нейросетей попросту нет корректного «сырья» для обучения.

🛠 Что нужно для прорыва?

💡 Брукс предлагает смотреть в сторону новых сенсоров и интерфейсов. В MIT уже тестируют «робо-перчатки», где движения человеческой руки связаны с датчиками давления на роборуке, а оператор получает обратные стимулы на пальцы. Это первый шаг к имитации естественной сенсомоторной петли.

⚙️ Настоящая ловкость требует трёх компонентов:
— 🤲
богатого тактильного ввода (силы, вибрации, температура, трение),
— 🧩
планирования движений (сценарии, а не отдельные действия),
— 🦾
безопасной механики (роботы должны быть упругими, а не жёсткими конструкциями с огромной кинетической энергией).

🌍 Моё видение

Сегодняшние инвестиции в «гуманоидов общего назначения» похожи на гонку за вечным двигателем. Да, мы получаем красивые ролики, но за пределами шоу-зала роботы не выдерживают сравнения с человеком.

Я убеждён:

  • ближайшие 15 лет мы увидим скорее полугуманоидов на колёсах, чем «вторых нас»;
  • индустрия будет всё больше вкладываться в гибридные формы — где руки похожи на человеческие, а ноги заменены на более безопасные механизмы;
  • а прорыв в dexterity произойдёт только тогда, когда робототехника научится чувствовать мир руками так же глубоко, как мы.

До тех пор любые обещания «универсальных рабочих-роботов» — это больше маркетинг, чем инженерия.