Казалось бы, технология big data буквально создана для статистики. Но проблема в том, что государственная статистика отлично работает с традиционным форматом данных, а что делать с новой технологией пока до конца непонятно. Обещал рассказать про большие — рассказываю. Точнее даже не про сами большие данные, а про то, как использовать эту технологию в государственной статистике, а об этом сейчас очень много говорят и спорят. Для начала, что мы имеем в виду, когда говорим о больших данных? Это способ анализа и извлечения информации из наборов данных, которые являются слишком большими или сложными для обработки традиционными методами. Например, магазин оборудован системой видеонаблюдения и при помощи технологии распознавания лиц мы знаем маршруты покупателей в торговом зале и их покупки. Чтобы обработать информацию о тысячах посетителей в день нужно или посадить за компьютеры сотни человек, или нанять т.н. data scientist, который хорошенько подумает и напишет программу. Причем здесь госу