Найти в Дзене
IT

Полезные пакеты Python о который не многие знают

Что такое пакет в Python? Пакет в Python – это каталог, включающий в себя другие каталоги и модули, но при этом дополнительно содержащий файл __init__.py. Пакеты используются для формирования пространства имен, что позволяет работать с модулями через указание уровня вложенности (через точку). Некоторые из этих пакетов дейтвительно уникальны, другие просто забавны в использовании и являются реальными неудачниками среди исследователей и статистиков, с которыми я работал. Список потрясающих библиотек Исследование данных и моделирование Очистка и обработка данных Структуры данных Проверка производительности и оптимизация Разное Я надеюсь, что вы нашли что-то полезное или интересное для вашей работы!
Оглавление

Что такое пакет в Python? Пакет в Python – это каталог, включающий в себя другие каталоги и модули, но при этом дополнительно содержащий файл __init__.py. Пакеты используются для формирования пространства имен, что позволяет работать с модулями через указание уровня вложенности (через точку).

Некоторые из этих пакетов дейтвительно уникальны, другие просто забавны в использовании и являются реальными неудачниками среди исследователей и статистиков, с которыми я работал.

Список потрясающих библиотек

Исследование данных и моделирование

  • Pandas-profile: Создание HTML-отчета, со статистикой из Pandas DataFrame.
  • pydqc: позволяет сравнивать статистику между двумя наборами данных.
  • pivottable-js : функция drag’n’drop для Pandas внутри ноутбука Jupyter.

Очистка и обработка данных

  • ftfy: исправляет mojibake и другие глюки в тексте Unicode.
  • janitor: много классных функций для очистки данных.
  • Optimus: еще один пакет для очистки данных.
  • Great-expectations: отличный пакет, чтобы проверить, соответствуют ли ваши данные вашим ожиданиям.

Структуры данных

  • Bounter: эффективный счетчик, который использует ограниченныйобъем памяти независимо от размера данных.
  • python-bloomfilter: Масштабируемый фильтр Блума, реализованный в Python.
  • datasketch: дает вам вероятностные структуры данных, такие как LSH, Weighted MinHash, HyperLogLog и другие.
  • ranges: структуры данных Continuous Range, RangeSet и RangeDict для Python

Проверка производительности и оптимизация

  • Py-spy: профилировщик выборки для программ Python.
  • pyperf: инструментарий для запуска тестов Python.
  • snakeviz: браузер Python для просмотра профиля с отличной поддержкой NoteBook Jupiter.

Разное

  • tqdm: расширяемый индикатор выполнения для Python и CLI со встроенной поддержкой Pandas.
  • Colorama: простой кросс-платформенный цветной текстовый терминал.
  • Pandas-log: обеспечивает обратную связь об основных операциях с Pandas. 
  • Pandas-flavour: простой способ расширения Pandas DataFrame / Series.
  • More-Itertools : добавляет дополнительные функции, похожие на itertools.
  • Streamlit : простой способ создавать приложения для ваших проектов машинного обучения.

Я надеюсь, что вы нашли что-то полезное или интересное для вашей работы!