Найти в Дзене
Atos Servers

Как построить озеро данных

Оглавление

Данные – новая нефть. Данные позволяют создавать инновации, тем самым повышая конкурентоспособность компании - ведь в современном мире преимущество будет за теми, кто извлекает прибыль из всего массива данных вне зависимости от их предварительной обработки.

Сегодня объем данных растет с огромной скоростью, и лишь малая часть этих данных может быть полностью структурированной. Тогда возникает актуальный вопрос о безопасном хранении неструктурированных данных, оптимальным решением которого является озеро данных. Озеро данных задумано как основное место, куда стекаются данные организации. Это репозиторий для всех данных, где они хранятся в необработанном или частично обработанном виде.

В Gartner комментируют, что озера данных позволяют анализировать различные несопоставимые данные в их оригинальном формате. Это не требует больших затрат на хранение и обработку, а данные из озера могут быть доступны любым пользователям в компании.

Варианты построения озера данных:

  1. Самостоятельно («самосбор»). Позволяет сэкономить в моменте, но характеризуется высоким риском неверной оценки своих сил. Вследствие чего проект по запуску озера может затянуться из-за несовместимого софта или железа и иных сложностей.
  2. Использовать облако. Подходит не всем, так как данных может быть слишком много или данные конфиденциальны (например, медицинские данные, банковская тайна и т. п.).
  3. Готовое решение – ПАК. Наиболее оптимальное решение, так как это полностью готовый и преднастроенный комплекс для работы с большими данными. Запуск озера в данном варианте понятен, прогнозируем с точки зрения сроков внедрения, и может масштабироваться с течением времени под потребности бизнеса.
-2

Atos DataLake Appliance для построения озер данных – программно-аппаратный комплекс под ключ, обеспечивающий полный контроль над данными. Atos DataLake Appliance на базе сервера Atos BullSequana SA - это согласованная система управления данными и обеспечения безопасности, которая осуществляет управление всем жизненным циклом информации, включая получение, очистку, комбинирование, обнаружение, аудит данных и внедрение политик управления данными. На текущий момент Atos DataLake Appliance – единственное в мире решение, сертифицированное Cloudera. Для проектов, имеющих требование по импортозамещению, Atos предлагает ПАК Atos DataLake Appliance, имеющий сертификацию Arenadata.

Преимущества ПАК Atos DataLake Appliance в сравнении с другими решениями:

  1. Синхронная закупка программной и аппаратной частей, услуг – при самосборном решении закупка всех элементов происходит по-отдельности
  2. Преднастройка комплекса на фабрике сокращает ввод в эксплуатацию до нескольких месяцев – с учетом различных требований на совместимость, самостоятельная настройка всех частей комплекса может занимать годы
  3. Консистентность версий ПО в рамках ПАК обеспечивает комплексную модернизацию решения – в отличии от «самосбора», где обновление каждой составляющей необходимо отслеживать и осуществлять самостоятельно
  4. Единое окно поддержки для всего комплекса с заявленным SLA снимает необходимость ручного отслеживания и разрешения конфликтов между компонентами
  5. Единый поставщик, ответственный за комплекс в целом гарантирует обеспечение безопасности на всех уровнях инфраструктуры
  6. Совокупная стоимость владения готового решения (ТСО) в перспективе 5 лет на 33% ниже.

Подробнее о комплексных решениях Atos для озёр данных вы можете узнать на нашем сайте.

-3