1987 читали · 4 года назад
Python методы работы с текстовыми данными c Pandas
Если вы работаете с текстовыми данными, изучите эти методы Pandas. Текстовые данные обычно несут больше информации, чем числа. Как бы мне ни нравилось работать с числами, текстовые данные постоянно присутствуют в моем рабочем процессе. Я не измерял и не анализировал их, но мне кажется, что количество текстовых данных у меня больше, чем числовых. Наиболее существенное различие между текстовыми и числовыми данными заключается в том, сколько и предварительной обработки они требуют. Числовые данные обычно приходят в формате, который можно напрямую использовать в анализе или моделировании данных...
846 читали · 7 лет назад
День 3: Смотрим данные. Pandas
Как правило все начинается с данных. Данные могут быть в абсолютно разном формате, например в виде csv-файлов (достаточно распространённый случай). Прежде чем двигаться дальше убедитесь, что вы зарегистрированы в kaggle и у вас установлен CLI клиент kaggle - <ссылка на kaggle нарратив> Подробнее о том, что это такое можно почитая здесь. Возьмём небольшой набор данных о студентах в формате CSV (comma separated values). Читаем данные с помощью shell команд Первое, что логично было бы сделать - посмотреть что это за данные...