8 месяцев назад
Python streaming (spark+kafka)
Привет, меня зовут Роман Вороновский и в этой статье, посвященной Python streaming с использованием Spark и Kafka мы рассмотрим основные шаги, представленные в видео: Чтобы предоставить вам более подробное описание процесса и помочь при развертывании локального окружения. Видео,как и статья нацелена на тех, кто только начинает свой путь в Big Data и еще не совсем умеет настраивать различные окружения для легкого старта в профессии. Итак начнем. необходимые компоненты и их проверка Для установки...
Как ускорить Apache Spark Structured Streaming: 3 главных параметра потоковой обработки
Как размер пакета, режим вывода и интервал срабатывания триггера потоковой обработки влияют на скорость вычислений в приложении Apache Spark Structured Streaming и как настроить эти параметры. Хотя скорость обработки данных средствами Apache Spark Streaming зависит от многих факторов, включая саму структуру и формат обрабатываемых данных, в большинстве случаев ее можно повысить, задав оптимальные настройки следующих параметров: Будучи основанном на Spark SQL, Structured Streaming используется для...