sfd
Кодеки сжатия данных в ClickHouse
ClickHouse предоставляет различные кодеки сжатия для оптимизации хранения данных и производительности запросов. Выбор подходящего кодека зависит от типа данных и сценария использования. -- LZ4 (по умолчанию) - хороший баланс скорости и степени сжатия
CODEC(LZ4)
-- ZSTD - более высокое сжатие при разумной скорости
CODEC(ZSTD, level) -- уровень от 1 до 22 (по умолчанию 1)
-- LZ4HC - высокое сжатие, но медленнее чем LZ4
CODEC(LZ4HC, level) -- уровень от 3 до 12 (по умолчанию 9)
-- Multiple - каскадное...
📝Анализ данных временных рядов: 5 советов Data Scientist’у
Одна из самых распространенных ошибок в анализе данных временных рядов, которую совершают новички – это предположение, что данные имеют регулярные точки и не содержат пропусков. На практике это обычно не подтверждается и приводит к неверным результатам. В реальных датасетах часто отсутствуют точки данных, а имеющиеся расположены неравномерно или непоследовательно. Поэтому перед анализом данных временных рядов следует провести этап предварительной подготовки: • Понять временной диапазон и детализацию временного ряда по точкам данных с помощью визуализации датасета; • Сравнить фактическое количество...