13,7K подписчиков
Источник: Nuances of Programming Изучение программирования с помощью Pandas  —  это как начало работы с программой Hello World в мире науки о данных. Pandas  —  широко используемая, интуитивно понятная и простая в освоении библиотека Python. Она работает с датафреймами, в которых данные представлены в табличном формате со строками и столбцами (как электронные таблицы). Pandas загружает все данные в память машины (Single Node) для более быстрого выполнения. Почему стоит попробовать Pyspark? Хотя Pandas...
2 года назад
63 подписчика
Привет!

Делюсь небольшой, но полезной шпаргалкой по PySpark и Spark SQL. Позже обязательно расскажу подробнее про PySpark и его области применения 😉
2 года назад