Найти в Дзене
Regexp_Like

Python. Однажды схватив уже не отпустит.

Почему так много аналитиков считает Python самым универсальным и чуть ли не единственным правильным выбором для работы с данными?

Давайте разберёмся по пунктам:

  1. Он бесплатный и может быть установлен даже на домашнюю машину, без каких-либо специальных навыков.
  2. Большинство задач на нём кто-то когда-то уже решил и выложил в сеть в виде готовой библиотеки, остаётся только правильно её применить.
  3. По нему огромное количество туториалов и обучающих материалов.
  4. Сам язык достаточно легко “читается”, даже без глубокого знания.
  5. Почти нет ограничений по его интеграции с другими системами и применению как таковому: Хочешь грузи данные из реляционной БД, хочешь мат модели строй, хочешь игры пиши, всё возможно с разной степенью изощренности.

Проблемы, как ни странно, произрастают из его же преимуществ:

  1. Python из коробки не оптимизирован под что-то конкретное, и работает в каждой отдельно взятой задаче значительно медленнее специализированных систем. Попробуйте заставить его, например работать в многопоточности, нужно будет хорошенько пошерстить сеть.
  2. Обилие библиотек в открытом доступе не гарантирует их качество, любой dummy код можно сохранить и выложить, а вы потом разбирайтесь.
  3. Многие поддаются искушению и пишут на Python, например всю аналитическую периферию: ETL процедуры, Dash’борды, WEB интерфейс для ввода данных, подобия BI аналитических систем, а потом удивляются, что для поддержания нужны узкоспециализированные специалисты, мелкие исправления тянут за собой кучу сбоев и занимают много времени.

Господа питонисты, есть что возразить/добавить?