Архитектура и принципы работы Spark Connect
Что общего у клиент-серверной архитектуры Spark Connect с JDBC-драйвером подключения к БД, как взаимодействуют клиент и сервер по gRPC, как подключиться к серверу и указать обязательность поля в схеме proto-сообщения. О том, что представляет собой Spark Connect  и зачем нужен этот клиентский API, позволяющий удаленно подключаться к кластерам Spark с использованием API DataFrame и неразрешенных логических планов в качестве протокола, мы уже писали здесь и здесь. Сегодня разберем более подробно реализацию этой разделенной клиент-серверной архитектуры...
06:44
1,0×
00:00/06:44
325,2 тыс смотрели · 3 года назад
114 читали · 1 год назад
Лучшие курсы по Apache Spark + бесплатное онлайн-обучение с нуля
В январе 2021 года команда Apache Spark объявила о новом достижении: система обработки данных на базе Spark смогла сортировать 100 терабайт данных всего за 23 минуты на кластере из 207 машин. Это был удивительный прорыв в области обработки больших данных и подтверждение того, что Apache Spark является одной из самых мощных и эффективных систем анализа данных, способной справляться с огромными объемами информации во время выполнения сложных вычислений. Я и команда Kursfinder изучили более 40 программ обучения и составили список из 10 лучших курсов по Apache Spark...