Утвержден ГОСТ Р ИСО/МЭК 20546-2021 «Информационные технологии. Большие данные. Обзор и словарь» Говоря коротко и официально, данные (data) — это представление информации в формализованном виде. Их совокупность именуется массивом данных (data set). Большие по объему, разнообразию, скорости обработки и вариативности массивы данных называются уже большими данными (big data) и требуют использования технологий масштабирования для более эффективного хранения, обработки, управления и анализа. Данные при этом делят на структурированные, частично структурированные и неструктурированные. Наука о данных (data science) — это извлечение практических знаний из данных посредством исследования или создания и проверки гипотез. В аналитику данных (data analytics) входит получение, сбор, проверка и обработка данных, включая их количественную оценку, визуализацию и интерпретацию. Похоже, что эти термины заменяют собой расхожее выражение data mining, под которым понимают совокупность методов обнаружения и