5 месяцев назад
Качественные данные – что это?
Здравствуйте! Сегодня поговорим о данных, их качестве, способах и видах проверок, используемых для этого инструментах и последствиях некачественных данных. Если верить википедии, данные – это зарегистрированная информация, представление фактов, понятий или инструкций в форме, приемлемой для общения, интерпретации, или обработки человеком или с помощью автоматических средств. Для правильной интерпретации и предоставления заказчиками корректных данных, необходимо убедиться в их качестве. Это является...
2 года назад
Глубокое погружение в Data Quality Data Quality — один из важнейших компонентов пайплайна данных. И хотя забота о качестве данных часто кажется малопривлекательной и отнимает много времени, именно от их достоверности и надежности зависит качество дашборда и аналитики. Для одного из наших материалов на Хабре мы перевели статью о том, что такое Data Quality на самом деле, и как обеспечивать его на разных уровнях пайплайна. Из материала вы узнаете об основных сложностях с Data Quality, оцените важность качества данных и ознакомитесь со стратегиями по работе с данными. Подробности и примеры кода — на Хабре.