От слов к миру: куда движется искусственный интеллект
Профессор Стэнфордского университета Ли Фэй‑фэй, одна из ключевых фигур современной науки об ИИ, в своей новой программной статье на 10 000 слов описала, каким будет следующее десятилетие искусственного интеллекта.
Если первое десятилетие XXI века стало эпохой визуального распознавания (ImageNet), а 2020‑е — расцветом языковых моделей, то 2030‑е, по мнению учёной, будут посвящены пространственному интеллекту — способности машин понимать, моделировать и предсказывать физический мир.
Что такое пространственный интеллект
Пространственный интеллект (spatial intelligence) — это шаг от понимания к действию, от описания мира к его воплощению и преобразованию.
Он объединяет три традиционно разрозненные способности искусственных систем:
- Восприятие — видеть и понимать трёхмерное пространство;
- Мышление — анализировать закономерности, предсказывать последствия действий;
- Действие — взаимодействовать с окружающей средой, изменяя её.
По словам Ли Фэй‑фэй, это «технология, которая превращает воображение в создание, восприятие — в действие, а знание — в результат».
Именно пространственный интеллект позволит ИИ научиться не просто говорить и рисовать, а жить в мире, понимать законы физики, динамику взаимодействий и причинно‑следственные связи.
Почему языковые модели застряли в тексте
Даже самые мощные LLM вроде GPT‑5 обладают огромным знанием, но не имеют опыта.
Они мастерски имитируют мышление, но не могут оценить расстояние, распознать направление или спланировать движение — то, что человек делает интуитивно.
Без этого невозможны по‑настоящему автономные роботы, умные лаборатории, обучающие симуляции или системы, способные самостоятельно открывать новое.
Фраза Людвига Витгенштейна «Пределы моего языка означают пределы моего мира» стала для Ли Фэй‑фэй ключевой метафорой.
Она уточняет: «Я не философ, но для искусственного интеллекта мир не ограничивается словами.»
Модель мира — основа пространственного интеллекта
В основе новой парадигмы лежит понятие world model — модель мира.
Это генеративная система, которая создаёт и поддерживает внутреннее представление о мире, где геометрия, физика и взаимодействия согласованы между собой.
Ли Фэй‑фэй выделяет три столпа таких систем.
- Генеративность.
Модель должна уметь создавать бесконечно разнообразные, но физически и логически согласованные симулированные миры — собственные «вселенные опытов», где она обучается. - Мультимодальность.
Входом может быть любой тип сигнала — текст, изображение, видео, звук, движение, жест.
AI должен одинаково уверенно понимать их сочетание и отвечать многообразием выходов. - Интерактивность.
Модель бездействует, пока не научится реагировать на действие — меняя внутреннее состояние мира после нового шага или манипуляции.
Только тогда ИИ сможет не просто описывать, а вести себя в среде, как реальный агент.
Фактически, Ли Фэй‑фэй и её коллеги строят «физически достоверные метавселенные» для обучения машин — где каждое движение, взмах или нажатие клавиши порождает закономерное изменение состояния.
От ImageNet к World Labs — путь длиной в двадцать лет
Ли Фэй‑фэй вспоминает, что её работа над ImageNet в 2009 году стала первым шагом к обучению машин на реальных визуальных данных.
Тогда ИИ научился «видеть».
Сейчас настал момент научить его понимать пространство, а значит — действовать.
Вместе с коллегами она основала стартап World Labs, который создаёт прототипы таких моделей.
Первый демонстрационный проект — Marble — уже позволяет генерировать и сохранять трёхмерные сцены, управляемые мультимодальными подсказками.
Marble открывает новые возможности для режиссёров, дизайнеров и инженеров — создавать собственные миры без громоздких 3D‑редакторов.
Что меняется: от воображения к материализации
Пространственный интеллект уже сегодня проявляется в трёх направлениях:
- Творчество.
Истории превращаются в полноценные виртуальные миры.
AI‑инструменты дают художникам, гейм‑дизайнерам и архитекторам возможность мгновенно визуализировать и изменять идеи — буквально «рассказывать через пространство».
Процесс становится многомерным и интерактивным, а творчество — массово доступным. - Робототехника.
Мир‑модели станут «учебными симуляторами» для роботов, соединяя сенсоры, действия и цели в одну систему обучения.
Это устранит дефицит реальных тренировочных данных и позволит машинам обучаться в миллионах симулированных ситуаций.
Такие модели смогут координировать движение, манипулировать объектами и — что важно — понимать человеческие намерения.
«Робот‑помощник, который готовит вместе с пожилым человеком, но не лишает его удовольствия готовить сам», — приводит Ли Фэй‑фэй пример идеального взаимодействия. - Наука, здравоохранение и образование.
Пространственный ИИ поможет моделировать молекулы и материалы, строить прогнозы климата, проводить виртуальные эксперименты без риска.
В медицине — улучшить анализ изображений, планирование операций и уход за пациентами.
В образовании — создать погружение, где студенты взаимодействуют с историческими и научными явлениями, а не просто читают о них.
Дорога открытий: технические вызовы
Для создания мировых моделей предстоит решить три гигантских рубежа:
- разработать универсальную функцию обучения, аналог «предсказания следующего токена» для LLM, но со знанием физики;
- собрать и обработать гигантские мультимодальные датасеты из видео, изображений, сенсорных данных и симуляций;
- создать новые архитектуры памяти, способные удерживать трёх‑ и четырёхмерный контекст.
В World Labs уже экспериментируют с RTFM — моделью генерации по видео‑кадрам, где каждый кадр служит единицей пространственной памяти, что позволяет сохранять целостность мира в долгих сценах.
«ИИ должен усиливать человека, а не заменять»
Ли Фэй‑фэй подчёркивает:
«Моей целью всегда было и остаётся — сделать ИИ продолжением человеческих возможностей, а не их заменой. Он должен расширять наше творчество, сочувствие и эффективность.»
Пространственный интеллект воплощает этот гуманистический взгляд: он создаёт синергию человека и машины, где алгоритмы не соревнуются с людьми, а помогают им сделать невозможное возможным — от строительства новых миров до изобретения новых лекарств.
Новая эра: восприятие, воображение, действие
Создание машин с пространственным интеллектом — это попытка повторить путь эволюции: от животных, научившихся ориентироваться в пространстве, до человека, создающего города и культуры.
Теперь настал этап, когда машины сами научатся ориентироваться в нашем мире и помогать нам создавать следующий.
«Истинно интеллектуальные машины невозможны без пространственного интеллекта», — заключает Ли Фэй‑фэй.
«Это моя полярная звезда, указывающая путь.»
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru
Сайт https://www.smssystems.ru/razrabotka-ai/