102,1 тыс подписчиков

Масштабируемая Big Data система в Kubernetes с использованием Spark и Cassandra

В предыдущей статье мы организовывали систему распределённого машинного обучения на GPU NVidia, используя язык Java с фреймворками Spring, Spark ML, XGBoost, DML в standalone-кластере Spark. Эксперимент оказался не вполне успешным. В этой статье посмотрим, как воспользоваться имеющимися наработками и запустить Spark Jobs в Kubernetes в режимах client и cluster. В этот раз будем использовать язык Kotlin.

Около минуты

5 июня 2023

329 читали