Найти в Дзене
Темная ночь

Системы обработки больших данных (Big Data)

1. Объём накопленных человечеством цифровых данных на 2023 год измеряется: Зеттабайтами 2. Определите правильную последовательность модели распределенных вычислений MapReduce: 1) Reduce 2) предварительные 3) данные 4) выбирает 5) их 6) агрегирует 7) Map 3. Установите соответствие целей инфраструктуры Hadoop и их определений: Надежность - достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя Отказоустойчивость - обнаружение сбоев и их автоматическое и применение автоматического восстановления Масштабируемость - данные и их обработка распределяются в кластерах Портируемость - возможность установки на всех видах устройств и операционных систем 4. Не верно утверждение о том, что: Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных. 5. Определите правильную последовательность термина «Big Data»: Разнообразие отраслей, являющихся источниками данных. 1) цифровой информации 2) быстро п

1. Объём накопленных человечеством цифровых данных на 2023 год измеряется:

Зеттабайтами

2. Определите правильную последовательность модели распределенных вычислений MapReduce:

1) Reduce

2) предварительные

3) данные

4) выбирает

5) их

6) агрегирует

7) Map

3. Установите соответствие целей инфраструктуры Hadoop и их определений:

Надежность - достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя

Отказоустойчивость - обнаружение сбоев и их автоматическое и применение автоматического восстановления

Масштабируемость - данные и их обработка распределяются в кластерах

Портируемость - возможность установки на всех видах устройств и операционных систем

4. Не верно утверждение о том, что:

Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных.

5. Определите правильную последовательность термина «Big Data»:

Разнообразие отраслей, являющихся источниками данных.

1) цифровой информации

2) быстро поступающей

3) неоднородной

4) огромные объемы

5) которые

6) традиционными

7) невозможно

8) обработать

9) инструментами

6. Найдите соответствие между понятием и его описанием

Data lake - Хранилище больших данных в необработанном виде.

Data science - Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.

Data mining - Интеллектуальный анализ данных с целью выявления закономерностей.

Machine learning - Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.

7. Не верно, что технология Web Mining применяет Data Mining для анализа:

Структурированной информации

8. Установите соответствие между функциями и их определениями:

mutate_at - изменяет определенные переменные по имени

transmute - добавляет новые переменные во фрейм данных и удаляет существующие переменные

mutate - добавляет новые переменные во фрейм данных, сохраняя существующие переменные

9. Какой пакет позволяет загружать данные из листа Excel файла?

readxl

10. Data Mining — это процесс обнаружения в сырых данных…

неочевидных закономерностей  

практических закономерностей

объективных закономерностей

11. Интервальная шкала – это шкала…

разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла

12. Такие данные как температура воздуха относятся к …

непрерывным данным

13. Для какой шкалы применимы только такие операции как равно и не равно?

номинальная шкала

14. Деревья решений относятся к группам …

логических методов  

кибернетических методов

15. Регрессионный и дискриминантный анализ относятся…

к статистическим методам Data mining

16. Классификация относится к стратегии:

обучения с учителем

17. Алгоритм k-средних предназначен для решения задачи:

Кластеризации

18. Кластер можно охарактеризовать как …

группу объектов, имеющих общие свойства  

группу объектов, имеющую внутреннюю однородность

19. Найдите соответствие между функцией в R и еe описанием:

str(оbject) - Внутренняя структура объекта

summаry(оbject) - Общая информация об объекте

hеad(x) - Посмотреть начальные строки объекта

tаil(x) - Посмотреть последние строки объекта

20. Найдите соответствие между функцией в R и еe описанием:

с(…) - Объединяет аргументы в вектор

sеq(from, to, by=) - Генерирует последовательность чисел с шагом

list(…) - Создает список объектов

сbind(…) - Объединяет объекты по столбцам

21. Установите соответствие между функциями и их определениями:

mutate_at - изменяет определенные переменные по имени

transmute - добавляет новые переменные во фрейм данных и удаляет существующие переменные

mutate - добавляет новые переменные во фрейм данных, сохраняя существующие переменные

22. Какие типы данных используются в R:

1) logical

2) numeric

3) integer

4) character

5) attributive

6) complex