06:44
1,0×
00:00/06:44
517,1 тыс смотрели · 4 года назад
2 месяца назад
Кодеки сжатия данных в ClickHouse
ClickHouse предоставляет различные кодеки сжатия для оптимизации хранения данных и производительности запросов. Выбор подходящего кодека зависит от типа данных и сценария использования. -- LZ4 (по умолчанию) - хороший баланс скорости и степени сжатия CODEC(LZ4) -- ZSTD - более высокое сжатие при разумной скорости CODEC(ZSTD, level) -- уровень от 1 до 22 (по умолчанию 1) -- LZ4HC - высокое сжатие, но медленнее чем LZ4 CODEC(LZ4HC, level) -- уровень от 3 до 12 (по умолчанию 9) -- Multiple - каскадное...
📝Анализ данных временных рядов: 5 советов Data Scientist’у
Одна из самых распространенных ошибок в анализе данных временных рядов, которую совершают новички – это предположение, что данные имеют регулярные точки и не содержат пропусков. На практике это обычно не подтверждается и приводит к неверным результатам. В реальных датасетах часто отсутствуют точки данных, а имеющиеся расположены неравномерно или непоследовательно. Поэтому перед анализом данных временных рядов следует провести этап предварительной подготовки: • Понять временной диапазон и детализацию временного ряда по точкам данных с помощью визуализации датасета; • Сравнить фактическое количество...