429 читали · 2 года назад
Обновление данных в таблицах ClickHouse
Немножко о ClickHouse, который не тормозит, о том как мы работаем с ClickHouse, и чутка об SRE и чутка о цифровом следе вашей активности. ClickHouse - это самая быстрая MPP СУБД, которую я на сегодня встречал за 15 лет работы в условиях, когда нужно делать расчеты с использованием больших массивов данных на лету. Ее разработал Yandex для своих нужд, в первую очередь под те кейсы, которые я укажу далее по тексту. Со временем Яндекс поделился ею с миром на безвозмездной основе. А позднее вывел ее в отдельную организацию, зарегистрированную кажись в Голландии. Платформа оказалось настолько хороша, что ее стали применять повсеместно, от Alibaba до FAANG...
5 причин использовать Clickhouse для ML-задач
Что такое хранилище признаков, зачем это нужно в машинном обучении, каковы его главные компоненты и как использовать ClickHouse в качестве Feature Store для ML-задач. Будучи колоночной базой данных, ClickHouse отлично подходит на роль хранилища фичей (Feature Store) для задач машинного обучения. Фичей или признаком называется некоторое свойство сущности, которое влияет на точность прогноза модели машинного обучения. Сущность — это набор признаков, а также класс или метка, представляющие реальное понятие...