Ильдар Бикташев, руководитель отдела картографии и алгоритмов Master Delivery, рассказывает, откуда мы знаем о зданиях, которых нет на картах, и зачем нам нужна собственная геоинформационная система.
По данным Росстата в России более 150 тыс. населенных пунктов, причем только в 87% из них действительно есть жители. Около 19 тыс. населенных пунктов существуют лишь номинально. Наряду с этим на картах есть жилые поселки без единого адреса, только названия.
За информацию о территории РФ в картографическом виде отвечает Росреестр. Кроме того, есть коммерческие сервисы Яндекс, 2ГИС, Гугл и ряд других компаний, которые работают с адресной и картографической информацией. В работе логистической платформы Master Delivery мы используем все доступные источники и объединяем их данные, чтобы строить максимально эффективные маршруты для курьеров. Однако с первых же дней работы мы столкнулись с тем, что информация на картах расходится с тем, что видят курьеры на местах. Скорость и стоимость доставки напрямую зависят от точности работы алгоритмов маршрутизации, которые, в свою очередь, опираются на картографические данные. Проще говоря, чем более точные карты будут использованы в работе алгоритмов, тем быстрее каждый клиент получит свой заказ. Поэтому для нас крайне важно иметь актуальные геоданные по всей территории присутствия.
Полнота адресных данных на картах — еще один важный для нас вопрос. Служба доставки Прямиком развозит заказы в 200+ городах России и Европы, и мы будем продолжать расширять территорию присутствия. Мы стремимся работать не только в крупных городах, но и развивать сервис в районных центрах, небольших региональных городах. В нашей стране даже в больших городах далеко не все объекты представляют собой многоквартирную или капитальную застройку и имеют полные адреса. Информация по частному сектору, СНТ и дачам зачастую отсутствует — на карты не нанесены ни сами строения, ни их адреса. А если нанесены, то содержат существенные неточности или попросту устарели. Доставку люди заказывают и на дачи, и в частный сектор, и в новостройки без адресов, так что полнота адресных данных для нас так же важна, как актуальность самих карт.
Интересная ситуация с точки зрения полноты данных на картах сложилась с адресами в населенном пункте Лорино, мы с командой давно за ним наблюдаем. Лорино — крупнейшее национальное село Чукотки с населением около 1 тысячи (!) человек. На картах Яндекса Лорино обозначено только границей.
Немного больше информации о Лорино дают карты Гугл:
Дальний Восток в целом не самая изученная территория и удивительно то, что максимально полные и актуальные данные по Дальневосточному округу, причем как по крупным городам, так и по малым населенным пунктам, мы обнаружили на картах OpenStreetMap (OSM). Например, вот так выглядит уже знакомое нам село Лорино на картах OSM:
OpenStreetMap — это карты, которые создавались и поддерживаются картографами-волонтерами. Через OSM-сообщество мы узнали, что дальневосточные компании, деятельность которых зависит от картографических данных о территории региона, взяли дело в свои руки и самостоятельно наполнили карты актуальной информацией. Примерно тем же путем, только гораздо дальше, мы пошли в Master Delivery.
Мы решили, что если ни один из доступных источников, ни все они вместе не могут обеспечить нужной нам точности и полноты геоданных, то мы создадим свою картографическую платформу, которая будет отвечать всем нашим требованиям и сможет обеспечить алгоритмы Прямиком качественными исходными данными.
Если данные собирают, значит, это кому-нибудь нужно
Создание собственной геоинформационной платформы — длительный и кропотливый процесс. Мы постепенно движемся вперед и оцифровываем новые территории своего присутствия. Для работы используем данные из открытых источников, соотносим их со спутниковыми снимками с помощью нейросетей и дополняем информацией от курьеров и супервайзеров на местах.
Курьеры — самые заинтересованные в наполнении карт люди, и они же — самый ценный источник информации о местности. От курьеров мы оперативно получаем данные о фактических адресах, открытых проездах, новых дорогах и микрорайонах. Курьеры помогают дополнить адресные данные информацией о времени работы инфраструктуры. Например, указывают, что въезд на территорию через шлагбаум возможен только с 9 до 18 часов, чтобы алгоритм маршрутизации Прямиком мог использовать эти данные для более точного расчета времени доставки.
Мы постоянно обрабатываем заказы на доставку по всей стране — собираем огромные массивы данных. В обезличенном виде информацию о заказах мы соотносим с данными о населении и анализируем потребительское поведение разных территорий, чтобы построить прогнозы на будущее: когда, где, сколько и каких курьеров потребуется. Фактически мы заранее знаем, в какой район чаще заказывают пиццу и электронику, а в какой — подгузники и детские товары. На сегодняшний день в 9 случаях из 10 мы даем точный прогноз спроса, это сокращает время курьера в пути в среднем на 6 минут. Таким образом картографический инструмент влияет и на работу предиктивных алгоритмов Прямиком.
Пока картографическая геоинформационная платформа Master Delivery используется только в работе сервиса Прямиком. Наша цель — обеспечить максимально точной и подробной картографической информацией собственные логистические алгоритмы. Но в будущем мы не исключаем возможность выпустить геоаналитические разработки отдельным продуктом. Уже сейчас мы предлагаем отдельные инструменты геоплатформы в качестве дополнительного сервиса для наших клиентов. Например, делаем расчет геозон доставки и помогаем определить локации для открытия новых торговых точек на основе анализа территории. Мы рассматриваем развитие геомаркетинговых инструментов как еще одно направление бизнеса по модели SaaS (software-as-a-service).