Здравствуйте! Сегодня поговорим о данных, их качестве, способах и видах проверок, используемых для этого инструментах и последствиях некачественных данных. Если верить википедии, данные – это зарегистрированная информация, представление фактов, понятий или инструкций в форме, приемлемой для общения, интерпретации, или обработки человеком или с помощью автоматических средств. Для правильной интерпретации и предоставления заказчиками корректных данных, необходимо убедиться в их качестве. Это является...
1 месяц назад
3,9K подписчиков
Основное искусство – в поиске баланса между тремя аспектами: текущими задачами, которые обеспечивают бизнес-ценность данных, перспективными задачами и стоимостью хранения и обработки. В эпоху массфолловинга в социальных сетях, холодных продаж и определителей спам-звонков – к примеру, производства «Тинькофф» и «Яндекс» – о больших данных знает каждый. Разберемся детальнее в насущных вопросах Big Data. Этимология больших данных Трактовать термин Big Data можно по-разному – в зависимости от цели. Пока...
2 года назад
64 подписчика
Ни один проект связанный с данными не обходится без стадии Data Profiling. Давайте разбираться что это такое. Data Profiling - это процесс исследования данных, понимания структуры, взаимосвязей, контекста и возможного применения этих данных в дальнейшем анализе. Аналитик должен понять значение данных с точки зрения бизнеса и текущих процессов, а также описать как эти данные могут быть использованы в анализе. Профайлинг данных помогает: Важное правило: Data Profiling необходимо планировать как можно раньше (на первых шагах) работы над проектом и продуктом...
2 года назад
2 подписчика
Я наиграл в моба игру от valve более 6 тысяч часов и у меня никогда не было привязанности к какому либо из сотни персонажей , но до не давнего времени один мой приятель , который имеет очень много игр на Tinker (более тысячи) , попал в топ 100 Dotabuff на этом герое...
3 года назад