В Python одни и те же действия можно осуществить с помощью разных методов, от чего будет напрямую зависеть скорость получения результата. Так, для математических операций предпочтение отдавайте специализированным библиотекам NumPy или Pandas перед встроенными возможностями.
Рассмотрим примеры обработки датафрейма двумя разными вариантами одной функции минимакс преобразования:
В первом варианте используются NumPy функции, а во втором - их встроенные аналоги:
Видим, что способ с применением NumPy быстрее почти в 15 раз!
Отмечу, что если вы работаете с методами объектов NumPy или Pandas, то можно не переживать, так как специализированные способы обработки будут вызваны автоматически:
Как можно убедиться, время выполнения примерно такое же, как если явно вызывать функции NumPy.
Кратное резюме - всегда используйте для математики с массивами данных библиотеки NumPy или Pandas. Если для игрушечных датасетов время исполнения не критично, то при работе с реальными данными кратное преимущество станет еще как заметным и избавит вас от лишней головной боли.