4 года назад
TimescaleDB 2.0 - распределенный кластер для time-series данных на базе PostgreSQL
Регулярные выпуски онлайн-митапов "Постгрес-вторники" с Николаем Самохваловым и Ильей Космодемьянским на youtube.com/RuPostgres Наш технический директор Иван Муратов побывал в гостях на двух RuPostgres-вторниках и рассказал про новинку TimescaleDB 2.0. Сейчас расширение находится в статии релиз кандидата...
1115 читали · 3 года назад
Агломеративная кластеризация и дендрограмма в Python
Рассмотрим один из способов распределения объектов по группам - агломеративную кластеризацию в Python. Она является разновидностью иерархического алгоритма и заключается в последовательном объединении точек в кластеры. При этом сначала каждый объект лежит в отдельной группе, после на каждом шаге самые близкие кластеры объединяются на основании выбранных метрик расстояния. В качестве дистанций между кластерами часто принимают: В качестве метрики расстояния между точками обычно используется евклидова мера (также поддерживается много других, например, корреляция, косинусное различие)...