спарк учебный центр официальный сайт

Томск

Тема · 144,8K интересуются

2 минуты

Томский художественный музей

Еженедельные экскурсии в Художественном музее Томска 💫

3 · 1 день назад

4 минуты

Ассоциация туроператоров (АТОР)

Томская область: путешествия от истории к инновациям

21 · 2 недели назад

5 минут

ЧС ИНФО

Грибные экспедиции: жительница Томска показывает сибирякам настоящие грибные места

150 · 2 недели назад

03:08

1,0×

00:00/03:08

Рыся и ребята .

46,9K просмотров · 2 месяца назад

У нашего котика Сени День рождения . Спи спокойно , мой любимый . В память о Сене.

Учебный центр "Коммерсант"

1 прочтение · 4 месяца назад

Источники данных Apache Spark

Какие источники исходных данных поддерживает Apache Spark для пакетной и потоковой обработки, обеспечивая отказоустойчивые вычисления в большом масштабе средствами SQL и Structured Streaming. Источники данных Apache Spark SQL и структурированной потоковой передачи Будучи фреймворком для создания распределенных приложений обработки больших объемов данных, Apache Spark может подключаться к разным источникам этих данных, в зависимости от используемого API. Например, Spark SQL поддерживает работу с различными источниками данных через интерфейс DataFrame...

02:08:51

1,0×

00:00/02:08:51

Интересные факты

44K просмотров · 3 года назад

Алтай

Учебный центр "Коммерсант"

1 прочтение · 2 месяца назад

Планы выполнения запросов при работе с API pandas в Apache Spark

Для чего смотреть планы выполнения запросов при работе с API pandas в Spark и как это сделать: примеры использования метода spark.explain() и его аргументов для вывода логических и физических планов. Разбираем на примере PySpark-скрипта. Мы уже писали, что PySpark, API-интерфейс Python в Apache Spark, позволяет работать с популярной библиотекой pandas, которая довольно известна, но по своей природе не очень хорошо работает с большим объемом данных. Тем не менее, многие аналитики данных и дата-инженеры по-прежнему используют pandas в своих PySpark-приложениях...