Рост обработки данных в экономике и обществе делает очевидным факт, что повторное использование и комбинирование наборов данных с целью анализа может приносить очень большую пользу. Конечно, при этом, возникают риски сохранения конфиденциальной информации. Исследовательский центр GovLab, работающий в университете Нью-Йорка, изучает способы повторного использования данных, максимизируя пользу от такого анализа и минимизируя возможные риски.
Одним из перспективных форматов работы с данными является «data collaboratives» - так называемое совместное использование данных. Таким термином обычно описывают партнёрства, при которых организации-партнёры предоставляют доступ к различным сегментам данных друг друга. Совместное использование данных может дать очень интересные результаты благодаря доступу граждан и/или государственных органов к большим данным частного сектора.
Ниже перечислены примеры проектов успешного совместного использования данных:
- Упрощение оказание помощи жертвам стихийного бедствия благодаря данным из Facebook о перемещении людей.
- Оценка экономической стойкости граждан во время природных катаклизмов за счёт данных от мексиканского банка BBVA по транзакциям и снятиям наличных.
- Предоставление дополнительной информации о городе местным властям благодаря использованию данных приложения Waze в рамках программы «Гражданин в сети» (Connected Citizen Program)
Не все проекты совместного использования данных были успешны. Успех зависит от нескольких факторов, в том числе от чёткости формулировки задачи, от технических возможностей взаимодействующих организаций в части обработки данных, от уровня доверия между сторонами, от качества самих данных (отсутствия ошибок, погрешностей и несоответствий).
И важный фактор успеха – слаженная работа специалиста по обработке обезличенных больших данных. Об этом мы поговорим дальше.
Важность специалистов по работе с большими данными
Успех в проекте по совместному использованию данных зависит от существования в организациях-партнёрах специалистов или команд, уполномоченных инициировать, вести и координировать такие работы в ситуациях, когда такие исследования могут быть полезными или необходимыми. Такие специалисты получили название «data stewards» (часто используется английский термин), что можно перевести как «хранитель данных», «управляющий данными», «распорядитель данных» или (по сути) «аналитик больших данных». Хотя нередко за всеми терминами стоят немного различные специальности. Хранители данных обладают необходимыми знаниями и полномочиями для отслеживания возможных партнёрств или принятия решений по запросам данных сторонними организациями. Они систематизируют процесс установления партнёрских отношений и помогают масштабировать усилия, когда появляются потенциально успешные проекты.
Ряд компаний, в том числе Mastercard, Facebook, LinkedIn, Uber, Cloudera и Digital Globe, ввели в свои штаты специалистов «data steward» (используются разные термины для этой профессии). Такие специалисты или команды выполняют задачи по определению, структурированию, направлению и оценке возможности сотрудничества.
Определение понятия «data steward»
По мере увеличения в компаниях количества должностей, близких по своей сути к «data steward» / «хранитель данных» возникает ощутимая путаница относительно спектра задач таких специалистов. Например, есть тенденция объединять роли стюардов данных с ролями тех, кого логичнее было бы назвать специалистом по защите данных или по информационной безопасности. Такая ошибка вполне понятна, но стоит смотреть на роль шире. Хотя конфиденциальность и безопасность являются ключевыми компонентами надежных и готовых к работе систем совместной работы с данными, настоящая цель состоит в использовании личных данных для достижения более широких социальных целей, одновременно предотвращая возможный ущерб.
Итак, какими характеристиками должен обладать data steward? Каковы его роли, задачи и обязанности? И как сделать так, чтобы они более успешными как в проектах совместного использования данных? Кто ещё входит в команду работающих над выявлением связей в данных? Кто такие data steward? Что делают аналитики больших данных?
Вот некоторые из вопросов, на которые частично будут даны ответы ниже, когда мы рассмотрим «Три задачи» и «Пять функций» «Data stewards, которые помогут приподнять завесу с вопросов о том, что нужно для эффективной работы таких специалистов. Хотя это сильно упрощённый подход, он может помочь сориентироваться в этом направлении деятельности.
Три задачи «data steward»
- Сотрудничество: Data stewards должны стремиться работать и сотрудничать с другими коллегами для понимания значимости собранных в компании данных и перспектив проектов.
- Защита: Data stewards должны обеспечить этичность в управлении частными данными, нести ответственность за передачу данных во вне и предупреждения возможного вреда лицам, чьи данные могут быть переданы.
- Действие: Data stewards должны быть проактивны в поиске потенциальных партнёров для монетизации накопленных в компании данных.
Пять функций «data steward»
- Партнерство и взаимодействие с сообществом. Основная функция Data stewards заключается в разработке и внедрении более активного и оперативного подхода к установлению контактов с потенциальными партнерами и их проверке. Кроме того, data stewards должны информировать потенциальных бенефициаров (и других) об инсайтах, полученных в результате совместной работы над данными. Как правило, Data stewards отвечают за взаимодействие со всеми участниками (как внутри, так и за пределами компаний), которые могут быть затронуты или иным образом заинтересованы в инновационном использовании данных.
- Внутренняя координация и взаимодействие с персоналом. Установление успешного сотрудничества в области данных требует внутренней координации и согласования с различными участниками компании, включая, например, юридические, технические отделы, отделы маркетинга и продаж. Data stewards играют ключевую роль в обеспечении информированности и согласованности заинтересованных сторон в компании и руководства компании. Кроме того, data stewards часто играют важную роль в составлении карт и подборе персонала, обладающего особыми навыками работы с данными, или интересом к инициативам по сотрудничеству в области данных.
- Аудит данных, этика и оценка ценности и риска. Data stewards отвечают за мониторинг и оценку значимости, потенциала и риска всех данных, хранящихся в организации. Эта обязанность включает в себя понимание того, какие данные собирает организация, и на какие общественно-важные вопросы потенциально могут помочь эти данные. Data stewards также должны участвовать в подготовке данных к анализу, оценке трудностей, связанных с совместным использованием этих данных, а также шагов по минимизации этих проблем и других рисков на разных этапах цепочки создания стоимости данных. Наконец, Data stewards должны учитывать этические последствия использования данных.
- Распространение и передача результатов исследований: data stewards часто выступают в качестве представителя компании, и отвечают за повышение её узнавания, распространение результатов и передачу общих результатов из data collaboratives. Data stewards могут также отвечать за коммуникации с клиентами, пользователями, партнерами, правительством и другими заинтересованными сторонами о соблюдении нормативных требований, договорных обязательствах и о том, как данные передаются и используются, а также о том, какие были общественные выгоды - потенциальные и реализованные.
- Поддерживайте совместную работу с данными для обеспечения устойчивости. Многие амбициозные проекты по совместной работе с данными рушатся после первых пилотных этапов или экспериментов. Совместные работы с данными могут сыграть ценную роль в развитии и содействии масштабированию этих проектов до тех пор, пока они не станут устойчивыми. Поскольку сами data stewards могут не располагать необходимым бюджетом для обеспечения долгосрочной стабильности, они должны работать с заинтересованными сторонами, чтобы собрать необходимые ресурсы и поддержку для обеспечения широкого и долгосрочного воздействия.
В России же специальность data steward только начинает формироваться одновременно с развитием культуры хранения и расширенного анализа больших данных – в этом аспекте мы повторяем путь запада. Разные компании по-разному понимают сферу компетенций и обязанностей такого специалиста, однако спрос на таких сотрудников растёт.
По материалам https://medium.com/data-stewards-network/the-three-goals-and-five-functions-of-data-stewards-60242449f378
Иллюстрации: freepik.com