194 читали · 2 года назад
🐍🗺 Геокодирование для Data Scientists: вводное руководство с примерами
В статье разбираем три различных способа преобразования адреса в широту и долготу с помощью Geopy. Когда вы работаете с реальными данными, вы не можете полагаться на то, что в базах содержится вся необходимая информация для реализации вашего проекта Data Science. Чаще всего вы располагаете частичной информацией и должны обогатить данные дополнительными характеристиками. Может возникнуть ситуация, когда набор данных содержит адрес, но в то же время широта и долгота отсутствуют. В этом случае первым шагом для дополнения данных будет добавление этой пары координат...
5 месяцев назад
Геокодирование: анализ и нормализация адреса
Нормализация адреса — это обязательный этап предобработки исходных данных для прямого геокодирования, т.к. они могут содержать ошибки, опечатки и нестандартные сокращения. Перед поиском нужного объекта в эталонной базе, адресную строку нужно привести к каноническому виду. Это сложный, многоэтапный процесс, который включает в себя и лингвистический анализ, и работу с большими данными. В этой статье мы постараемся рассмотреть процесс в общем виде, хотя предобработка данных, последовательность процессов, их количество для сервисов разных поставщиков может несколько отличаться...