Почему так много аналитиков считает Python самым универсальным и чуть ли не единственным правильным выбором для работы с данными?
Давайте разберёмся по пунктам:
- Он бесплатный и может быть установлен даже на домашнюю машину, без каких-либо специальных навыков.
- Большинство задач на нём кто-то когда-то уже решил и выложил в сеть в виде готовой библиотеки, остаётся только правильно её применить.
- По нему огромное количество туториалов и обучающих материалов.
- Сам язык достаточно легко “читается”, даже без глубокого знания.
- Почти нет ограничений по его интеграции с другими системами и применению как таковому: Хочешь грузи данные из реляционной БД, хочешь мат модели строй, хочешь игры пиши, всё возможно с разной степенью изощренности.
Проблемы, как ни странно, произрастают из его же преимуществ:
- Python из коробки не оптимизирован под что-то конкретное, и работает в каждой отдельно взятой задаче значительно медленнее специализированных систем. Попробуйте заставить его, например работать в многопоточности, нужно будет хорошенько пошерстить сеть.
- Обилие библиотек в открытом доступе не гарантирует их качество, любой dummy код можно сохранить и выложить, а вы потом разбирайтесь.
- Многие поддаются искушению и пишут на Python, например всю аналитическую периферию: ETL процедуры, Dash’борды, WEB интерфейс для ввода данных, подобия BI аналитических систем, а потом удивляются, что для поддержания нужны узкоспециализированные специалисты, мелкие исправления тянут за собой кучу сбоев и занимают много времени.
Господа питонисты, есть что возразить/добавить?