Пока весь мир спорит, заменят ли нейросети программистов и дизайнеров, Яндекс нашел ИИ отличное прикладное применение. Компания обучила связку из двух разных ИИ-моделей оценивать доступность входов в заведения по всей России для людей на инвалидных колясках.
Результат за несколько месяцев работы: нейросети перелопатили более 5 миллионов фотографий от пользователей и бизнеса, добавив в Карты 120 тысяч новых отметок. Теперь общее число размеченных точек достигло внушительных 813 тысяч.
Техническая матчасть: как работают глаза и мозг
Самое интересное здесь архитектура решения. Это не просто глупый скрипт, который ищет слово пандус в описании. Яндекс запустил двухступенчатую экспертизу, где две модели работают в тандеме:
Этап 1. Alice AI VLM (Vision-Language Model) — это глаза системы. Модель сканирует загруженные фотографии входа и буквально разбирает их на детали.
Она оценивает: есть ли ступени и какова высота порога, присутствуют ли поручни и пандус, достаточно ли широк проход.
Этап 2. Alice AI LLM (Large Language Model) — это мозг. Она получает структурированные данные от первой модели, анализирует контекст и принимает финальное логическое решение: присвоить организации статус доступно или недоступно.
Такой подход исключает механические ошибки. Например, если пандус есть, но он установлен под диким углом 45 градусов (что часто бывает для галочки), мозг системы поймет, что подняться по нему невозможно, и не пропустит карточку.
От ресторанов до вокзалов
Изначально систему гоняли в тестовом режиме только на ресторанах и кафе.
После успешной обкатки её масштабировали на всё: супермаркеты, ТЦ, аптеки, клиники и вокзалы.
Процесс полностью автоматизирован: как только пользователь загружает в Карты свежее фото заведения, ИИ-тандем тут же отправляется его проверять. Чем больше фото тем точнее разметка.
Как это выглядит для пользователя?
Для тех, кому нужна эта информация, в Картах (которыми, к слову, пользуются 95 млн человек в месяц) есть два пути:
- Включить классический фильтр «Доступность входа на инвалидной коляске» при поиске.
- Спросить в ИИ-чате Карт нейросеть сама изучит данные и выдаст краткое текстовое описание входа.
Кроме того, алгоритмы уже учитывают около 40 тысяч пандусов при построении пешеходных маршрутов и знают подноготную более чем 900 транспортных организаций.
Почему это важный кейс?
Для IT-сообщества этот проект интересен как редкий и успешный пример мультимодального конвейера в продакшене. Совместить визуальный анализ и сложный логический вывод в рамках одного автоматизированного процесса на миллионах объектов — задача не из легких. И здорово, что технологии здесь работают на повышение доступности городской среды.
А как вам такое применение нейросетей? Замечали уже новые отметки в Картах своего города?
Пишите в комментариях, как ИИ помогает (или мешает) вам в повседневной жизни.
Просить конечно мне в лом, поэтому не напрягаю, кому не жалко на пивасик жду полтосик в виде донера, потому что полтосик всегда приветствуется на кармане :D https://dzen.ru/internet_2026?donate=true - ссылка для Дона!