Всем привет, сегодня собрал подборку трюков, которые можно применять к своему Python коду. Приятного чтения! Очистка строки Это один из наиболее востребованных процессов в проектах data science при очистке данных. Отличный пример — это необработанный текст с пробельными символами и переносами строк. Мир регулярных выражений Иногда непросто очистить текст с помощью определенных символов или фраз. Вместо этого нам необходимо использовать некоторые шаблоны. И здесь нам на помощь приходят регулярные выражения и соответствующий модуль Python...
Источник: Nuances of Programming Одна из главных задач при работе с текстовыми данными — это создание множества текстовых функций. Некоторые функции ищут конкретные паттерны в тексте, например, адреса электронной почты или номера телефонов. Создание этого функционала может казаться довольно тривиальным, но значительно проще использовать модули регулярных выражений. Например, нужно посчитать количество знаков препинания в конкретном куске текста. Используем отрывок из Диккенса (оригинал). Как бы...