Найти в Дзене
Обучение Excel + SQL

Jupyter notebook - это новый Excel

Оглавление

Перевод с английского с дополнениями Автора канала.

Оригинал статьи: https://towardsdatascience.com/jupyter-is-the-new-excel-a7a22f2fc13a

Почему аналитики и специалисты по работе с данными должны изучать Python?

Если вы аналитик или работаете с данными, Excel - это ваш «хлеб с маслом»; Вы являетесь экспертом в сводных таблицах, формулах, диаграммах или даже VBA и PowerQuery. Вы можете быстро найти решение, но прежде, чем вы узнаете его, ваша таблица расширится на десятки вкладок, тысячи рядов и модулей VBA, поэтому его удобочитаемость и обслуживание оставляют желать лучшего. И когда вы осмеливаетесь нажать F9, чтобы обновить результаты, вы можете взять чашку чаю и долго ждать обновления расчётов и молиться, чтобы не выскочила ошибка.

Звучит знакомо? Вы, вероятно, горячо киваете.

Какими бы полезными они ни были, для обеспечения реального понимания данных электронные таблицы просто не дадут всех ответов, которые вы ищете. Давайте посмотрим, что делает Excel популярным и где его слабые места, но самое главное, почему ВЫ должны начать использовать Jupyter Notebooks в качестве альтернативного мощного аналитического инструмента.

Плюсы Excel

Несколько факторов сделали Excel таким ценным, что заслуживает особого внимания, поскольку он прост, но силен реактивная вычислительная модель с встроенными функциями. Электронная таблица похожа на чистый холст, где программист может писать код, используя собственный язык Excel (т.е. формулы и VBA).

Компании внедряют широкий спектр ИТ-систем для запуска критически важных для бизнеса процессов, однако произошел взрыв в форме электронных таблиц, которые дополняют эти основные системы и служат инструментами по умолчанию для новых бизнес-инициатив. Из-за того, что корпоративные системы не такие гибкие, Excel помогает в быстром выходе на рынок, или быстрой ситуативной аналитики. Как бы это ни было удобно, насколько это правильный подход?

Роль Excel на предприятии должна быть пересмотрена!

Недостатки Excel

Попытка использовать электронные таблицы для расширенной, отзывчивой аналитики с большим объемом данных, это неподходящий инструмент для работы.

Вот некоторые из проблем, с которыми сталкиваются пользователи Excel:

💥 Каскадные ошибки: Excel печально известен тем, что ошибки распространяются по столбцу, а затем по всей таблице, создавая снежный ком, который превращается в лавину неприятностей. Страшно, некоторые из них остаются невидимыми, пока не станет слишком поздно. Несколько случаев были опубликованы где все пошло не так с огромными последствиями для затрат.

💥 масштабируемость: Excel имеет предел на количество строк и столбцов, которые он может хранить, но с наборами данных, увеличивающимися с экспоненциальной скоростью, электронные таблицы скоро истощаются или используют большую часть процессора. Когда это происходит, риск повреждения данных возрастает.

💥 производительность: В сложных рабочих книгах изменение одного числа может повлиять на сотни повторяющихся расчетов, и Excel требует времени для разработки каждого из них. Когда достигается определенный размер, он не только замедляет саму таблицу, но также влияет на производительность любых других приложений, которым требуется пространство памяти.

💥 тестирование: Почти невозможно проверить правильность таблицы, а затем доказать, что последующие изменения больше ничего не сломали.

💥 Отслеживание / отладка: Часто даже небольшое изменение могут значительно повредить вашу сложную формулу, что делает ее чрезвычайно трудной для идентификации и исправления.

💥 Все включено: Все данные и расчеты содержатся в файле Excel и запускаются с локального компьютера. Это означает, что сотрудничество ограничено, что делает контроль версий кошмаром. Кроме того, данные являются статическими на основе последнего обновления, а не обновляются в режиме реального времени при изменении условий. Конечно, существуют Google-таблицы, которые решают эту проблему. Но пользователи не спешат отказываться от файлов excel на их локальных компьютерах.

Все эти проблемы уже решены для традиционного программирования десятилетия назад.

SQL 🧊 Блог

Продолжение статьи >>>