Найти в Дзене
Кадастр.Москва

Что за Большие данные?

Утвержден ГОСТ Р ИСО/МЭК 20546-2021 «Информационные технологии. Большие данные. Обзор и словарь» Говоря коротко и официально, данные (data) — это представление информации в формализованном виде. Их совокупность именуется массивом данных (data set). Большие по объему, разнообразию, скорости обработки и вариативности массивы данных называются уже большими данными (big data) и требуют использования технологий масштабирования для более эффективного хранения, обработки, управления и анализа. Данные при этом делят на структурированные, частично структурированные и неструктурированные. Наука о данных (data science) — это извлечение практических знаний из данных посредством исследования или создания и проверки гипотез. В аналитику данных (data analytics) входит получение, сбор, проверка и обработка данных, включая их количественную оценку, визуализацию и интерпретацию. Похоже, что эти термины заменяют собой расхожее выражение data mining, под которым понимают совокупность методов обнаружения и

Утвержден ГОСТ Р ИСО/МЭК 20546-2021 «Информационные технологии. Большие данные. Обзор и словарь»

Говоря коротко и официально, данные (data) — это представление информации в формализованном виде. Их совокупность именуется массивом данных (data set). Большие по объему, разнообразию, скорости обработки и вариативности массивы данных называются уже большими данными (big data) и требуют использования технологий масштабирования для более эффективного хранения, обработки, управления и анализа. Данные при этом делят на структурированные, частично структурированные и неструктурированные.

Наука о данных (data science) — это извлечение практических знаний из данных посредством исследования или создания и проверки гипотез. В аналитику данных (data analytics) входит получение, сбор, проверка и обработка данных, включая их количественную оценку, визуализацию и интерпретацию.

Похоже, что эти термины заменяют собой расхожее выражение data mining, под которым понимают совокупность методов обнаружения и извлечения паттернов (закономерностей) в данных в целях получения новых знаний.

Это первый утвержденный нормативный документ в этой области. Кроме него существует добровольный «Кодекс этики использования данных» от Ассоциации больших данных, а единственный законопроект на эту тему №01/05/02-20/00099549 от 02.2020 «О внесении изменений в Федеральный закон „Об информации...“» был отозван в 2020 году.

Стоит отметить, что применительно к большим данным выделяют такие классические методы их анализа, как ассоциативные правила, дерево принятия решений, кластеризация, регрессия и др. Основной технологией по работе с данными в настоящее время стало машинное обучение или применение искусственных нейронных сетей.

Новые термины добавлены в разделы Справочника кадастрового инженера «Цифровая трансформация» и «Базы данных».

Ссылка на новость: https://кадастр.москва/news/659

#КадастрМосква #gkn77ru #недвижимость #данные #наука #технологии #базаданных #нейронныесети #законопроект #информационныетехнологии

--------------------------------------------------------------------------------------------

Будем рады вашим вопросам по кадастровому учёту и регистрации права, а также обоснованным замечаниям по опубликованным материалам. Комментарии, не относящиеся напрямую к теме статьи или канала, а также выражающие неуважение к собеседникам, могут быть удалены. Спасибо за ваше понимание.

Больше информации о нас на сайте https://кадастр.москва

Все наши статьи читайте по ссылке https://кадастр.москва/news