Большие данные/Big Data — совокупность различных данных, поступающих из разнообразных источников и генерируемых непрерывно. Объём и интенсивность появления этих данных настолько велики, что для их обработки и хранения требуются специальные технологии. Проще всего объяснить, что такое большие данные, на примере круговорота воды в природе. Так же, как и вода, они постоянно находятся вокруг нас — всё, что мы делаем, всё, что происходит вокруг нас, можно превратить в данные. Как и вода, данные могут находиться в облаках — больших дата-центрах с удалённым доступом. Данные могут течь с разной интенсивностью — как слабый ручеек в пустыне или как мощная горная река. Они даже могут быть разной температуры — от горячих до ледяных. И, наконец, они могут собираться в крупные водоёмы, вроде озёр или морей — массивы данных, которые находятся в специальных хранилищах. Как и с водой, большую часть данных перед «употреблением» — анализом — нужно обработать, иначе они только испортят конечный результа