Добавить в корзинуПозвонить
Найти в Дзене

🪄 Когда данные уже подготовлены за вас: а что так можно было

? Когда в разговоре речь заходит об интеллектуальной собственности и принятии решений в сфере управления инновациями и технологиями, я в какой-то момент говорю, что патентная информация уникальна и удобна для анализа... Но, несмотря на то что это реально так, за этими словами скрывается значительно больше. Настолько больше, что этот контекст сложно передать в формате выступления или короткой беседы. В текущей серии постов #культура_принятия_решений мы уже разобрали, как устроен процесс принятия решений и какие требования предъявляются к данным. А теперь давайте посмотрим на логику подготовки данных, если источником информации выступает патентная информация – обещаю, вы приятно удивитесь! Сначала пройдёмся по этапам подготовки данных (писал об этом здесь) и посмотрим, какие шаги остаётся выполнить вручную, а какие уже решены на уровне системы патентной информации. 1️⃣☑️Создание общей терминологии и определение единиц измерения В патентной аналитике это уже есть и называется «патентн

🪄 Когда данные уже подготовлены за вас: а что так можно было?

Когда в разговоре речь заходит об интеллектуальной собственности и принятии решений в сфере управления инновациями и технологиями, я в какой-то момент говорю, что патентная информация уникальна и удобна для анализа... Но, несмотря на то что это реально так, за этими словами скрывается значительно больше. Настолько больше, что этот контекст сложно передать в формате выступления или короткой беседы.

В текущей серии постов #культура_принятия_решений мы уже разобрали, как устроен процесс принятия решений и какие требования предъявляются к данным. А теперь давайте посмотрим на логику подготовки данных, если источником информации выступает патентная информация – обещаю, вы приятно удивитесь!

Сначала пройдёмся по этапам подготовки данных (писал об этом здесь) и посмотрим, какие шаги остаётся выполнить вручную, а какие уже решены на уровне системы патентной информации.

1️⃣☑️Создание общей терминологии и определение единиц измерения

В патентной аналитике это уже есть и называется «патентное семейство». А для особо изысканного анализа есть стандартизированные разделы патентных документов (реферат, формула, описание). Причём всё это уже практически «из коробки» увязывается с документами и семействами.

2️⃣☑️Создание поисковой стратегии

Безусловно, это один из ключевых навыков, который не так просто развить. Но инструменты для его реализации есть, опять же, «из коробки» в платных системах.

3️⃣☑️Поиск и отбор данных

За счёт структурированности и единообразия патентная информация фактически представляет собой одну большую базу данных. Формировать отдельный массив «с нуля» не требуется.

4️⃣☑️Извлечение и структурирование

Это во многом сделано на уровне самой системы: данные уже приведены к единому формату, агрегированы и нормализованы.

5️⃣👐🏼 Очистка и валидация

Здесь работа остаётся, но только на уровне проверки релевантности патентных публикаций. Несмотря на трудоёмкость процесса, это гораздо легче делать с патентной информацией, чем со статьями или новостным массивом данных.

6️⃣👐🏼 Гармонизация и интеграция

Для работы с патентной информацией этот этап не требуется. Но если речь идёт о комплексном исследовании с другими источниками – да, придется поработать.

7️⃣☑️Связывание сущностей и устранение дублирования

Архитектура системы, построенной на патентных семействах как единице информации, сама по себе решает проблему дублирования.

8️⃣👐🏼 Синтез, контроль качества и выпуск результата

Этап, на котором всё сводится воедино и формируются выводы и рекомендации – делаем ручками.

➡️Что получается?

Из 8 этапов остаётся выполнить только 3 – если работать только с патентной информацией, и 4 – если комбинировать её с другими источниками.

Теперь по такой же логике пробежимся по критериям качества данных (писал об этом здесь):

1️⃣☑️Релевантность

Если очистку и валидацию сделали корректно – то ничего больше делать не нужно.

2️⃣☑️Точность

Практически каждая единица патентной информации проходит через сито экспертизы, что даёт несопоставимый уровень точности при прочих равных.

3️⃣☑️Полнота и покрытие

Одна из самых насыщенных баз – как технологически, так и географически. Работать можно сразу со всем массивом. Так что этот параметр близок к максимуму.

4️⃣☑️Согласованность и сопоставимость

Обеспечиваются за счёт патентных семейств.

5️⃣☑️Структурированность и интерпретируемость

Заложены в структуре самих документов и единообразии логики их написания.

6️⃣❔Актуальность

Есть задержка публикации заявок (до 18 месяцев), но базы обновляются несколько раз в месяц.

7️⃣☑️Доступность

При желании данные можно найти бесплатно, но в платных системах они не только доступны, но и удобны в работе.

➡️Итог:

И тут практически по всем критериям сильный результат. Дальше можно провести мысленный эксперимент: взять другие источники информации и прогнать их через ту же логику. И вернуться к тому, что…

патентная информация уникальна и удобна для анализа… Но, несмотря на то что это реально так, за этими словами скрывается значительно больше)

Насколько больше? Пусть каждый решит для себя сам)