Найти тему
102,3 тыс подписчиков

Масштабируемая Big Data система в Kubernetes с использованием Spark и Cassandra


В предыдущей статье мы организовывали систему распределённого машинного обучения на GPU NVidia, используя язык Java с фреймворками Spring, Spark ML, XGBoost, DML в standalone-кластере Spark. Эксперимент оказался не вполне успешным. В этой статье посмотрим, как воспользоваться имеющимися наработками и запустить Spark Jobs в Kubernetes в режимах client и cluster. В этот раз будем использовать язык Kotlin.
Масштабируемая Big Data система в Kubernetes с использованием Spark и Cassandra  В предыдущей статье мы организовывали систему распределённого машинного обучения на GPU NVidia, используя язык Java с
Около минуты
329 читали