Найти в Дзене
Бизнес-Азимут

Как цифровая поисковая платформа Роспатента помогает науке и бизнесу

Одно из главных требований к изобретениям, полезным моделям и промышленным образцам – это новизна в мировом масштабе. Соответственно для проверки их уникальности, выявления, изучения и анализа сходных решений необходима удобная и эффективная система поиска по базам РФ и зарубежных стран. 15 лет назад в Роспатенте была создана система поиска, доступ к которой был исключительно у внутренних пользователей ведомства. С 2018 года Роспатент активно участвовал в национальной программе «Цифровая экономика Российской Федерации», в рамках которой остро стоял вопрос создания новой мощной российской системы поиска по патентной информации, которой бы могли пользоваться не только эксперты российского патентного ведомства, но и все заинтересованные внешние пользователи. Между вариантами использовать готовую зарубежную систему или разработать свою выбор был сделан в пользу создания собственного решения на основе российского софта и свободного программного обеспечения.

Суть проекта

Компания Бизнес-Азимут была приглашена для участия в реализации этого проекта. В результате проделанной масштабной работы поисковая система, рассчитанная на 10 000 одновременных пользователей, была успешно запущена в 2022 году.

-2

В силу сложившихся обстоятельств перед командой разработки стояла крайне амбициозная задача построения архитектуры системы, разработки функционала и загрузки более 100 Тб данных всего за 1 год. В системе собраны более 130 млн документов. Функциональность системы позволяет проводить почти любые виды поиска. Благодаря четко проработанному техническому заданию, слаженной работе, высокой вовлеченности и нацеленности на результат проектных команд как со стороны исполнителя, так и со стороны заказчика, все задачи проекта были выполнены в срок и в надлежащем качестве.

Удобство пользователей на первом месте

Любая поисковая система характеризуется в основном двумя вещами. Это функциональные возможности: доступные виды поисков, удобство просмотра и анализа результатов поиска; а также объем информации: базы данных, ее качество и уровень структурированности информации.

Особое внимание в системе уделили потребностям внешних пользователей, среди которых есть профессионалы в области информационного и патентного поиска. Это могут быть патентные поверенные или патентные отделы крупных компаний, которые анализируют целые отрасли. Соответственно им нужен широкий инструментарий для проведения всестороннего поиска. Однако среди пользователей системы есть и обычные авторы, студенты, ученые, которым нужно проверить, есть ли какое-то решение, похожее на их изобретение.

Одним из важнейших требований к системе при ее создании было то, что она должна была быть одинаково удобна и функциональна для всех пользователей. Так, например, для начинающих пользователей есть «простой поиск», когда можно в нужном поле указать номер документа или автора, простой термин, и система выдаст результаты. Для тех, кто хочет очень быстро проверить свою заявку на похожие патенты и даже не хочет формулировать запрос, можно просто загрузить в систему свою заявку или часть заявки, статьи, описания решения, и система выдаст наиболее похожие патенты с использованием искусственного интеллекта. В системе можно также воспользоваться функцией «Поисковый ассистент», который был сделан для того, чтобы пользователи, не знающие синтаксиса сложных запросов, могли бы создавать такие запросы или научиться это делать самостоятельно.

Для продвинутых пользователей реализована функциональность расширенного поиска. Она дает возможность создавать очень сложные запросы с большим количеством поисковых полей и поисковых операторов на различных языках, предоставляет доступ ко всем массивам данных в системе. Например, это могут быть запросы и по тексту, и по химическим формулам. Можно провести поиск по нескольким десяткам полей: это и даты, и имена, и различные части текста и т.д. Запросы могут содержать десятки операторов, достигать несколько тысяч символов, но при этом время обработки минимизировано благодаря сложной системе индексирования и поисковому движку. Одной из главных отличительных особенностей профессиональной поисковой системы – это поиск по специальным патентным классификаторам, таким как Международная патентная классификация, Совместная патентная классификация и японский классификатор.

Ищем не только патенты. А что еще?

Спектр поиска системы не ограничивается патентами. При экспертизе заявок на объекты промышленной собственности проверяется мировая новизна, а это значит, что нужно искать не только в патентной, но и среди другой научно-технической информации, доступ к которой также предоставлен в системе. В поисковую систему информация поступает из таких источников, как внутренние системы делопроизводства и публикации, в том числе неопубликованные заявки, внешние специализированные поисковые системы.

Следует обратить внимание также на специализированный вид поиска (по химии, генетическим последовательностям и др.). Например, генетический поиск – это один из важных видов поиска для экспертов. В системе используется три базы данных: Национальный центр биотехнологической информации (NCBI), Европейская молекулярно-биологическая лаборатория (EMBL), российская база данных. Большое внимание уделено использованию 3D представлений: генетические последовательности, химия, различные объекты в 3D виде. Генетический поиск осуществляется по белкам/нуклеотидам базах данных внешних источников, а также во внутренней базе данных последовательностей патентных документов РФ.

Несмотря на то, что в системе реализован качественный поиск по химии, цели заменить профессиональные системы поиска именно по химии, в которых много своих особенностей, не было, поэтому была реализована интеграция с этими системами.

-3

Использование искусственного интеллекта

Одним из важных направлений в работе Роспатента является развитие средств искусственного интеллекта, точнее их применение на практике для облегчения работы экспертов и внешних пользователей. Как это выглядит на практике: эксперту поступает на рассмотрение новая заявка, система анализирует эту заявку, проводит поиск с использованием искусственного интеллекта и выдает наиболее похожие заявки, которые эксперт может посмотреть. Для внешнего пользователя это выглядит практически так же: пользователь может указать номер документа, указать часть текста, загрузить свой текст заявки или статью, и система также выдаст похожие документы.

Узнайте о других проектах Бизнес-Азимут на сайте: https://bazt.ru/portfolios/