Найти в Дзене
DigiNews

Li Auto представила MindVLA-o1: нейросетевую основу для автопилота нового поколения

Li Auto представляет MindVLA-o1 — VLA-модель нового поколения, которая привносит интеллект, основанный на рассуждениях, в автономное вождение. — pandaily.com Компания Li Auto представила свою модель искусственного интеллекта нового поколения для автономного вождения MindVLA-o1 на конференции NVIDIA GTC 2026, которая состоялась 17 марта. Модель MindVLA-o1, представленная руководителем отдела базовых моделей компании Чжань Кунем, разработана как унифицированная модель зрения-языка-действия (VLA) для обеспечения реального интеллекта. Она объединяет пять ключевых технологических инноваций: 3D-пространственное понимание, мультимодальное рассуждение, унифицированную генерацию действий, обучение с подкреплением с замкнутым контуром и совместное проектирование аппаратного и программного обеспечения. Эта модель знаменует собой переход к системам автономного вождения, основанным на логическом рассуждении. В отличие от традиционных подходов, ориентированных преимущественно на восприятие, MindVLA-

Li Auto представляет MindVLA-o1 — VLA-модель нового поколения, которая привносит интеллект, основанный на рассуждениях, в автономное вождение. — pandaily.com

Компания Li Auto представила свою модель искусственного интеллекта нового поколения для автономного вождения MindVLA-o1 на конференции NVIDIA GTC 2026, которая состоялась 17 марта.

Модель MindVLA-o1, представленная руководителем отдела базовых моделей компании Чжань Кунем, разработана как унифицированная модель зрения-языка-действия (VLA) для обеспечения реального интеллекта. Она объединяет пять ключевых технологических инноваций: 3D-пространственное понимание, мультимодальное рассуждение, унифицированную генерацию действий, обучение с подкреплением с замкнутым контуром и совместное проектирование аппаратного и программного обеспечения.

-2

Эта модель знаменует собой переход к системам автономного вождения, основанным на логическом рассуждении. В отличие от традиционных подходов, ориентированных преимущественно на восприятие, MindVLA-o1 объединяет данные с камер и лидаров через 3D-энкодер, что позволяет транспортным средствам воспринимать глубину, расстояние и движение способом, более близким к человеческому пространственному пониманию.

Модель также вводит «латентную мировую модель», способную симулировать сценарии ближайшего будущего, что позволяет системе предвидеть изменения и принимать более дальновидные решения. На стороне исполнения архитектура VLA-MoE (Mixture of Experts) дает возможность модели параллельно генерировать полные траектории движения, которые затем уточняются в процессе оптимизации, подобной шумоподавлению, для достижения более плавной и физически согласованной траектории.

Для ускорения обучения Li Auto создала крупномасштабную симуляционную среду, которая позволяет модели обучаться не только на реальных данных, но и посредством высокоэффективных виртуальных сценариев, что значительно снижает затраты на обучение. В то же время оптимизация программного и аппаратного обеспечения позволяет модели более эффективно работать на бортовых чипах, сокращая циклы проектирования архитектуры с месяцев до дней.

MindVLA-o1 отражает более широкие усилия Li Auto по интеграции крупномасштабных моделей ИИ в автономное вождение, поскольку отрасль все больше переходит от систем, основанных на правилах, к архитектурам, управляемым базовыми моделями.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи