Найти в Дзене
Почемучка?

Почему беспилотным автомобилям так сложно предсказать поведение пешеходов?

В 2018 году беспилотный Uber сбил женщину, хотя система зарегистрировала ее за 6 секунд до удара. Это не случайность, а отражение фундаментальной проблемы: человеческое поведение — самый сложный алгоритм для расшифровки. Даже самые продвинутые ИИ сталкиваются с парадоксом: пешеходы одновременно и предсказуемы, и непредсказуемы. Давайте разберем на пальцах ключевую сложность: Человек — не физическое тело, а когнитивная система
Беспилотник просчитывает траекторию по законам физики, но пешеход: Время реакции vs время принятия решения Социальные конвенции, недоступные ИИ: Язык тела Контекстуальные паттерны Проблемы восприятия реальности: Лидар Камеры Пример из тестов Waymo:
Система приняла группу подростков в одинаковых спортивных костюмах за один движущийся объект. Вариации поведения: Для ИИ это означает: необходимость переобучения для каждого региона. Проблема вагонетки в реальном времени: Гибридные модели: Пример Tesla:
Использует «искусственную интуицию» — предсказание на основе аналог
Оглавление

В 2018 году беспилотный Uber сбил женщину, хотя система зарегистрировала ее за 6 секунд до удара. Это не случайность, а отражение фундаментальной проблемы: человеческое поведение — самый сложный алгоритм для расшифровки. Даже самые продвинутые ИИ сталкиваются с парадоксом: пешеходы одновременно и предсказуемы, и непредсказуемы.

Проблема «последней секунды»: когда физика бессильна

Давайте разберем на пальцах ключевую сложность:

Человек — не физическое тело, а когнитивная система
Беспилотник просчитывает траекторию по законам физики, но пешеход:
  • Может резко развернуться из-за забытого телефона
  • Споткнуться о невидимый для камеры камень
  • Поднять руку, чтобы поймать ключи
Время реакции vs время принятия решения
  • Лидар обнаруживает объект за 0.1 секунды
  • Человек принимает решение изменить траекторию за 0.3 секунды
  • Автомобилю нужно 1.2 секунды для полной остановки с 60 км/ч

Неписаные правила: то, что знает каждый пешеход

-2

Социальные конвенции, недоступные ИИ:

Язык тела

  • «Взгляд через плечо» = возможно, человек собирается переходить
  • «Ускорение шага» = спешка, но не обязательно переход дороги
  • «Кивок водителю» = явное намерение перейти

Контекстуальные паттерны

  • Школьник утром у перехода — вероятно, бежит в школу
  • Человек с собакой — траектория зависит от поводка
  • Пьяный человек — хаотичное движение

Ограничения сенсоров: мир через «цифровые глаза»

Проблемы восприятия реальности:

Лидар

  • Не видит сквозь дождь и снег
  • Путает зонтик с препятствием
  • Не различает выражения лиц

Камеры

  • Плохое освещение = потеря деталей
  • Тень пешехода воспринимается как объект
  • Не может предсказать эмоции

Пример из тестов Waymo:
Система приняла группу подростков в одинаковых спортивных костюмах за один движущийся объект.

Культурные различия: правила пешехода в разных странах

Вариации поведения:

  • Нью-Йорк: Пешеходы агрессивно выходят на дорогу
  • Токио: Ждут зеленого сигнала даже на пустой улице
  • Москва: Переходят в неположенных местах, но предсказуемо
  • Рим: Используют активную жестикуляцию

Для ИИ это означает: необходимость переобучения для каждого региона.

Этические дилеммы: кого «спасать» в безвыходной ситуации

Проблема вагонетки в реальном времени:

  • Пожилой человек переходит медленнее расчетного времени
  • Ребенок может выбежать следом
  • Беспилотник должен выбрать: резко тормозить (риск ДТП сзади) или плавно останавливаться

Современные подходы к решению

Гибридные модели:

  • Машинное обучение на миллионах часов видео с пешеходами
  • Нейросети, тренированные на данных из разных городов
  • Карты высокой четкости с отмеченными «зонами риска»

Пример Tesla:
Использует «искусственную интуицию» — предсказание на основе аналогичных ситуаций в глобальной сети автомобилей.

Статистика и перспективы

Текущие показатели:

  • Беспилотники на 30% реже попадают в ДТП с пешеходами, чем люди
  • Но в 5% сложных сценариев их реакции недостаточно

Будущие разработки:

  • V2X (Vehicle-to-Everything): связь пешеходных смартфонов с автомобилями
  • Эмоциональный ИИ: анализ выражения лиц
  • Коллективный интеллект: обмен данными между автомобилями в реальном времени

Инженерный вердикт: Проблема не в технологиях, а в природе человеческого поведения. Как сказал ведущий инженер Cruise: «Мы можем предсказать траекторию тела, но не можем предсказать момент принятия решения».

А как вы думаете — смогут ли беспилотники когда-нибудь научиться понимать пешеходов так же, как это делают живые водители? Поделитесь мнением в комментариях!

Подписывайтесь на канал «Почемучка?» — исследуем технологии, которые меняют нашу повседневность!