Если вы работаете с текстовыми данными, изучите эти методы Pandas. Текстовые данные обычно несут больше информации, чем числа. Как бы мне ни нравилось работать с числами, текстовые данные постоянно присутствуют в моем рабочем процессе. Я не измерял и не анализировал их, но мне кажется, что количество текстовых данных у меня больше, чем числовых. Наиболее существенное различие между текстовыми и числовыми данными заключается в том, сколько и предварительной обработки они требуют. Числовые данные обычно приходят в формате, который можно напрямую использовать в анализе или моделировании данных...
Источник: Nuances of Programming Pandas — это золотой стандарт в обработке данных. А функциональные возможности библиотеки по загрузке, фильтрации, обработке и изучению данных быстро сделали ее излюбленным инструментом аналитиков. Конечно же, большинство из нас работает с самыми примитивными возможностями: загрузка данных из CSV-файла, фильтр нескольких столбцов и переход к визуализации данных. Однако в Pandas есть и малоизвестные, но от того не менее полезные функции, которые значительно упрощают обработку данных...