Вы когда-нибудь замечали эту громадную пропасть? С одной стороны, мы уже привыкли, что ИИ пишет за нас текст, генерирует изображения по описанию или отвечает на вопросы в техподдержке голосом, который не отличить от человеческого. А с другой стороны... ну, посмотрите вокруг. Роботы, которые сейчас разрабатываются, всё ещё какие-то... беспомощные, что ли. По сути ИИ на сегодняшний момент гениален в цифровом мире, но в реальном он пока как ребёнок, который только учится ходить.
Само собой разумеется эту проблему давно заметили люди, которые понимают в технологиях гораздо больше меня. И они придумали термин - физический искусственный интеллект. Звучит как что-то из фантастики про роботов-андроидов, но уже целые годы идет процесс по конструированию таких роботов. И, похоже, именно это изменит нашу жизнь в ближайшие годы куда сильнее, чем все чат-боты и генеративный ИИ вместе взятые.
Что такое физический ИИ простыми словами?
Представьте себе обычного робота на заводе. Он делает одно и то же движение тысячи раз, жёстко запрограммированные человеком. Если деталь легла чуть криво, робот либо сломает деталь, либо встанет и будет моргать красной лампочкой. А теперь представьте другого робота. Он смотрит на деталь “глазами” ну то есть камерами, понимает, что она лежит не идеально ровно, и аккуратно подправляет её, чтобы продолжить работу. Он чувствует усилие, оценивает вес, слышит команду голосом и понимает контекст: “возьми вон ту красную коробку и поставь на верхнюю полку”.
Вот что по сути физический ИИ - искусственный интеллект, который не просто обрабатывает информацию, а взаимодействует с реальным миром. Он встроен в какое-то тело и умеет воспринимать физическую реальность через сенсоры, камеры и датчики. А главное - он понимает законы физики. Что тяжёлое нельзя поднять одной левой, что стекло хрупкое, а горячее - обжигает.
Глава NVIDIA Дженсен Хуанг, который сегодня считается одним из главных провидцев в мире технологий, называет физический ИИ следующей большой волной после генеративного ИИ. И судя по тому, сколько денег крупнейшие корпорации вкладывают в это направление, он не шутит.
Где мы сейчас и куда идём
Хуанг очень наглядно разделил развитие ИИ в данном направлении на три этапа.
Первая волна - генеративный ИИ. Это то, с чем мы уже прекрасно знакомы. ChatGPT, Midjourney, генерация видео и музыки. ИИ научился создавать контент. Он стал художником, писателем, композитором. Но всё это происходит внутри. Цифровой мир - его естественная среда обитания.
Вторая волна - корпоративный ИИ. Это интеллектуальные помощники для бизнеса. Они анализируют документы, общаются с клиентами, помогают сотрудникам. Тоже пока в цифре, но уже хорошо справляются с реальными задачами.
Третья волна - физический ИИ. И вот здесь начинается самое захватывающее. ИИ получает тело. Он больше не заперт в серверах и не ограничен экраном монитора. Он становится беспилотным автомобилем, промышленным роботом, хирургическим помощником, умным экскаватором. Он выходит в наш мир.
Что уже умеет физический ИИ сегодня?
Яндекс, например, активно развивает это направление. Беспилотники Яндекса уже возят пассажиров в некоторых районах Москвы и других городов. Секрет их плавной и предсказуемой езды, именно в физическом ИИ. Нейросети обучались на данных о поведении водителей с многолетним стажем. В результате машина не просто видит препятствия, она понимает контекст. Что пешеход может внезапно ускориться, что автомобиль справа, скорее всего, собирается перестраиваться, что на перекрёстке лучше притормозить заранее. Это не алгоритмы, прописанные программистами, а опыт, извлечённый из тысяч часов реальных поездок.
В той же компании создали VLA-модель - это такой “мозг” для роботов, который соединяет зрение, понимание языка и действия. Рассмотрим такой пример, вы говорите роботу: “Принеси мне синюю кружку”. Робот смотрит по сторонам, оценивает расстояние, понимает, что нужно открыть дверь, чтобы выйти из комнаты, идет на кухню, берёт кружку аккуратно, чтобы не расплескать, и возвращается к вам. И всё это без жёсткой программы, без заранее прописанной последовательности действий. Он сам решает, как выполнить задачу, исходя из конкретной ситуации.
Современные электромобили уже оснащаются системами постоянного мониторинга на базе физического ИИ. Датчики отслеживают температуру батареи, вибрации двигателя, тепловые паттерны, шумы. Система не просто сигнализирует о поломке она будто предсказывает её. Может скорректировать режим работы, чтобы продлить срок службы или порекомендовать водителю посетить сервис до того, как проблема станет критической. Рынок такого “предиктивного обслуживания” уже оценивается в десятки миллиардов долларов.
Крупнейшие компании - Siemens, Bosch, Газпром, Сбер - активно внедряют физически информированные нейросети для сложных инженерных расчётов. Например, для моделирования потоков нефти и газа в пластах. Или для анализа потоков воздуха в системах вентиляции и кондиционирования. Или для расчёта отвода тепла от мощных видеокарт и двигателей. Там, где раньше требовались долгие вычисления, теперь нейросеть выдаёт результат за минуты.
Где этому учат? Россия в тройке лидеров
Здесь есть повод для гордости. Россия входит в тройку стран (вместе с США и Китаем), где активно развиваются физически информированные нейросети. Главные центры - Сколтех и Московский авиационный институт.
В МАИ, например, такие нейросети применяют для предсказания разрушения твёрдых тел при экстремальных нагрузках. Это критически важно для авиации и космоса. Представьте, что можно заранее рассчитать, как поведёт себя крыло самолёта при перегрузках, не строя десятки прототипов и не проводя долгих испытаний.
А в Сколтехе разработали систему анализа воздуха в кондиционерах с помощью лазерного луча и нейросети. Она определяет состав загрязнений без сложных фильтров и химических анализов, мгновенно и прямо в процессе работы.
И что интересно, российская школа в этой области отличается прагматичностью. Как говорят сами разработчики, мы отбрасываем красивые, но бесполезные на практике решения и ориентируемся на реальный результат.
Почему об этом заговорили именно сейчас?
На последней выставке CES в Лас-Вегасе (это главная мировая выставка потребительской электроники) роботы были буквально повсюду. Но важнее другое, британский холдинг Arm, чьи процессоры стоят в большинстве смартфонов мира, объявил о создании отдельного подразделения физического ИИ. Они объединили там разработки для автомобилей и робототехники. Почему? Потому что требования к энергопотреблению, безопасности и надёжности у этих устройств почти одинаковые.
NVIDIA тоже делает на это направление огромную ставку. Они представили целый стек технологий для физического ИИ, включая проект GR00T - фундаментальную модель для человекоподобных роботов. Эти роботы должны понимать естественный язык и повторять движения людей, обучаясь просто наблюдая за нами.
Даже Boston Dynamics, знаменитая своими танцующими роботами, уже давно использует методы глубокого обучения с подкреплением, чтобы их машины учились ходить, бегать и преодолевать препятствия, а не просто выполнять запрограммированные движения.
До сих пор цифровая революция касалась в основном информации. Мы научились мгновенно передавать данные, обрабатывать их, создавать контент. Но физический труд - то, чем человечество занималось тысячелетиями, - оставался почти не затронут. Конечно, были станки и конвейеры, но они требовали жёсткой программы и человеческого контроля. Физический ИИ меняет это.
По прогнозам, рынок превысит 100 миллиардов долларов к 2032 году. А роботы, которые понимают задачи с голоса и адаптируются к ситуации, способны изменить рынок труда так же фундаментально, как когда-то паровой двигатель или электричество.
Пока же физический ИИ находится примерно там же, где был генеративный ИИ года три-четыре назад. Мы уже видим впечатляющие прототипы, но массовое применение ещё впереди. Технологии становятся дешевле, модели - умнее, датчики - точнее.
Скорее всего, через несколько лет мы перестанем удивляться роботам, которые понимают, что делают. Они станут такими же привычными, как сегодня голосовые помощники в телефонах. И когда в следующий раз вы увидите, как беспилотный автомобиль аккуратно объезжает яму на дороге или робот-курьер доставляет заказ, знайте - это работает тот самый физический ИИ.