В качестве консультанта я часто помогаю компаниям осознать стратегическую важность их данных. В большинстве случаев директивные органы хотят использовать эти наборы данных для создания надежных решений ИИ, но в некоторых случаях они рассматривают данные как новый поток доходов. В результате все большее число компаний изучает способы монетизации информационных активов для продажи или лицензирования третьим сторонам.
Я надеюсь, что эта статья поможет вам лучше понять стратегическую важность наборов данных в случае проектов ИИ и как их продавать.
Владение богатыми объемами данных не уникально в современном мире. Действительно, сами данные все больше становятся товаром. Однако возможность эффективного монетизации данных может стать источником конкурентного преимущества.
Со стратегической точки зрения доступ к высококачественным данным становится все более важным для всевозможных предприятий. Действительно, данные невероятно ценны. Он помогает создавать превосходные продукты, образует барьер для входа, и его можно напрямую монетизировать.
Потребность в данных усугубляется крупными достижениями в области технологий обработки данных за последние годы. Облачное хранение, новые методы науки о данных, увеличение мощности обработки, а также дальнейшее развитие и популярность подполей ИИ - все это позволило компаниям раскрыть новые знания из своих информационных активов, часто в виде тенденций, закономерностей и ассоциаций.
В контексте ИИ задача состоит в том, чтобы создать большие соответствующие наборы данных, с тем чтобы можно было обучить модели и получить более точные результаты.
Данные представляют собой наблюдения или измерения (необработанные или обработанные), представленные в виде текста, чисел или мультимедиа. Набор данных представляет собой структурированный набор данных, обычно связанных с уникальным объемом работы.
Сколько следует взимать за наборы данных?
Ценообразование наборов данных может быть сложным, но в целом я обнаружил, что три фактора делают наборы данных более ценными:
- Недавние
- Точный разнообразный
- Уникаьный
Более того, тот факт, что ваш набор данных трудно построить с нуля, также является мощным элементом. Исходя из моего опыта, "лучший" набор данных - это набор данных, соответствующий бюджету, удовлетворяющий требованиям к количеству и качеству данных проекта и ограниченность времени.
Недавно мне пришлось приобрести набор данных для проекта компьютерного зрения. Выбор может быть подавляющим, а цены и методы варьируются. Важно знать, что именно вы покупаете и поможет ли этот набор данных вашему проекту ИИ.
В зависимости от проекта могут потребоваться только открытые данные, но во многих случаях реальный край модели CV может быть разработан только путем сбора собственных обучающих данных, аналогичных данным, которые, как вы ожидаете, будут эффективно работать с окончательной моделью. Эти данные часто имеют нюансы и отличаются от общих доступных наборов данных.
Почему оценка данных важна?
Некоторые директивные органы стремятся монетизировать свои данные для создания новых источников поступлений. Однако они, как правило, недооценивают возможные последствия раскрытия данных третьим сторонам. На самом деле, несмотря на растущее признание потенциальных преимуществ, большинство организаций очень осторожно относятся к тому, какие данные они выставляют за пределами компании. Действительно, важно тратить время на оценку стратегической важности данных, чтобы определить, действительно ли продажа наборов данных повлияет на вашу конкурентную позицию или способность реализовать собственные преимущества.
Неточная оценка информационных активов может оказаться дорогостоящей для акционеров во время слияний и поглощений (M & A).
Прежде чем пытаться получить доход от набора данных, убедитесь, что он:
- Надежный
Вы должны быть в состоянии проверить, что вы собрали свои данные из надежного источника и таким образом, чтобы это не нарушало действительности. Для получения репрезентативной выборки также требуется достаточно данных и правильных данных. Этот элемент важен в рамках проекта ИИ, чтобы избежать предвзятости.
- Релевантный
Данные должны соответствовать бизнес-потребностям клиентов. Очевидно, что эти потребности будут меняться от компании к компании. Таким образом, вы должны понять их цели и понять, как ваш набор данных может помочь. Кроме того, вы должны убедиться, что он организован и в формате, они могут использовать.
- Собственность
Не предполагайте, что, поскольку у вас есть доступ к некоторым данным, он автоматически принадлежит вам... Например, в здравоохранении убедитесь, что пациенты из вашего набора данных подписали договор, разрешающий коммерческое использование их данных, изображений и т.д. А при продаже убедитесь, что покупатель подписывает договор исключительного пользования в исследовательских целях и добавляет в базу данных пункт о непубличном раскрытии этих данных.
- Безопасность и анонимность
Важно, чтобы ваши данные были безопасными и, возможно, анонимными. Существует несколько методов:
Шифрование скрывает данные, поэтому их невозможно прочитать в случае кражи. В противном случае можно использовать маркировку. Он заменяет значения в данных при сохранении определенных элементов, но использует для этого другой процесс. Это обеспечивает постоянную защиту информации, и вы можете гибко выбирать поля, которые должны быть маркированы, и даже маркировать только части полей.
Данные как стратегический актив
Для некоторых компаний монетизация информационных активов не является новой концепцией. Действительно, данные клиентов могут генерировать денежную стоимость прямо или косвенно. Однако все больше компаний пытаются создавать уникальные наборы данных, объединяя как внутренние, так и внешние данные.
Обычные материальные активы, как правило, имеют уменьшающуюся отдачу от использования. То есть они снижаются в стоимости, чем больше их используют. Но данные часто могут увеличиваться в стоимости, чем больше они используются. То есть данные, рассматриваемые как актив, могут проявлять все большую отдачу от использования.
Действительно, данные могут увеличиваться в стоимости, чем больше они используются. Иными словами, если рассматривать данные как актив, то это может стать стоить больше (это недееспособно, неунизительно, долговечно, стратегически).
Еще одним элементом, который следует учитывать, является время использования: правильные данные в нужное время - например, данные транзакций, собранные в определенные моменты розничных продаж, могут иметь очень высокую ценность.
Что могут сделать компании?
Прежде чем рассматривать возможность продажи наборов данных, компаниям крайне важно разработать политики в области оценки данных. Это начинается с создания каталога данных, чтобы все информационные ресурсы были известны, а также их использование. В целом, создание политик данных в компании является первым шагом в определении приоритетности ценности данных.
К сожалению, я понял, что компании склонны рассматривать процессы оценки данных, когда они находятся в середине приобретения, продажи или выбытия бизнес-единиц со значительными активами данных. Можно с уверенностью предположить, что в будущем некоторые из меняющихся обязанностей главных сотрудников по обработке данных могут включать оценку данных компании для этих целей.
Важность необработанных и внешних данных
Еще один интересный элемент в росте наборов данных, сделанных как из внешних, так и из внутренних данных. Чем больше независимых источников данных у вас есть доступ, тем лучше будет ваша информация. Можно подключить данные к другим собственным наборам данных или к открытым наборам данных для создания уникальных наборов данных.
Кроме того, мы, как правило, предпочитаем исходные данные, поскольку они имеют неопределенное количество возможных конечных применений, которые зависят от пользователя и намерения и могут изменяться с течением времени. Действительно, две компании могут иметь разные сценарии использования и поэтому требуют интеграции с различными источниками данных и различными типами анализа, и это привело бы к в значительной степени разным конечным значениям. Этот аспект данных особенно затрудняет оценку монетизации с помощью методов, основанных на доходах, поскольку возможные виды использования могут резко меняться среди различных покупателей.
Продажа представляет собой самый сложный способ монетизации наборов данных, главным образом потому, что для ее реализации требуется уникальная бизнес-модель, которую большинство компаний не настроено.
Большинство компаний, которые вводят бизнес по монетизации данных, идентифицируют партнеров, которые могут улучшить внутренние данные. Я рекомендую компаниям выявлять тенденции и анализ данных, которые нелегко реплицировать или получать от конкурентов.