Обычно поиск литературы начинается хаотично. Открываем Google Scholar, eLibrary, CyberLeninka, патентные базы, несколько вкладок с журналами, потом ещё пару запросов в поисковике. Через час у нас уже есть десятки ссылок, несколько PDF-файлов, пара «вроде бы полезных» статей и ощущение, что тема стала не понятнее, а шире.
Проблема в том, что первые источники — это не первые 10 ссылок из выдачи.
Первые источники — это начальная карта темы. Кто уже работает в этой области? Какие подходы повторяются? Какие материалы и методы чаще всего встречаются? Где есть свежие исследования? Есть ли патенты? Какие организации и авторы появляются в выдаче чаще других?
Сегодня разберём, как собрать такую стартовую карту через семантический поиск INVENTORUS.
Это первая часть нашей серии про поиск. Дальше вас ждут посты про структурированный и векторный поиск с RAG-ответами с помощью ИИ-ассистента «Никола».
Тему возьмём прикладную на стыке химии, материаловедения и инженерии:
полимерные покрытия для защиты трубопроводов от коррозии
Она удобна для примера, в ней есть и научные публикации, и патентный слой, и промышленный контекст. Но тот же алгоритм поиска можно использовать для диплома, статьи, диссертации, заявки на грант или R&D-задачи.
Итак, переходите к пошаговому иллюстрированному гайду и сохраняйте, чтобы не потерять, когда приступите к своей работе.
Шаг 1. Формулируем тему обычным языком
Не начинайте с «идеального» поискового запроса.
Сначала опишите задачу так, как вы бы объяснили её коллеге:
«Нужно собрать первые источники по теме полимерных покрытий для защиты трубопроводов от коррозии.»
Для семантического поиска это нормальная отправная точка. Здесь важен смысл, а не сложная конструкция из операторов.
Шаг 2. Выбираем семантический поиск
На главной странице INVENTORUS семантический поиск используется по умолчанию.
Он подбирает результаты не только по буквальному совпадению слов, а по смыслу запроса. Поэтому для первого прохода лучше использовать не длинную формулу, а понятное словосочетание или короткую фразу.
Например: полимерные покрытия для защиты трубопроводов от коррозии или антикоррозионные полимерные покрытия для труб
На этом этапе наша задача — не сузить поиск до идеальных 15 документов, а увидеть поле целиком.
Шаг 3. Смотрим не только публикации
В INVENTORUS можно переключать тип объектов НТИ: интеллектуальная собственность, публикации, авторы, организации.
Для первого обзора темы стоит пройтись по нескольким слоям:
Публикации — чтобы понять научный ландшафт.
Патенты — чтобы увидеть прикладные решения и защищённые технологии.
Авторы — чтобы найти исследователей, которые системно работают по теме.
Организации — чтобы увидеть университеты, институты и компании с активностью в этой области.
Шаг 4. Читаем выдачу как карту, а не как список
На странице результатов не нужно сразу открывать всё подряд.
Сначала смотрим карточки:
название документа, авторов, аннотацию или формулу патента, год, тип объекта, страну, журнал, цитируемость, статус доступа, квартиль при наличии.
Для нашей темы уже на этом этапе можно разделять находки по смыслу:
- обзорные статьи по антикоррозионным покрытиям
- исследования по эпоксидным и полиэтиленовым покрытиям
- работы по методам нанесения
- публикации по испытаниям стойкости
- патенты на составы покрытий и способы защиты труб
- организации, которые регулярно появляются в результатах
Так выдача перестаёт быть «простынёй ссылок» и начинает превращаться в структуру.
Шаг 5. Настраиваем сортировку
Первый проход удобно делать по релевантности.
Затем стоит поменять оптику:
- сортировка по дате публикации покажет свежие исследования;
- сортировка по цитируемости поможет найти более опорные работы;
для патентов можно смотреть дату начала действия, цитируемость, размер патентного семейства и другие параметры.
Это разные вопросы к одной и той же теме.
Релевантность отвечает: «что ближе всего к запросу?»
Дата отвечает: «что появилось недавно?»
Цитируемость отвечает: «на что чаще всего опираются другие?»
Шаг 6. Подключаем фильтры
Фильтры лучше применять после первого широкого просмотра, а не сразу.
Для публикаций можно сузить выдачу по году, ключевым словам, странам, авторам, типу документа, журналам и другим параметрам.
Для патентов — по периоду действия, географии, статусу, МПК и другим техническим признакам.
Например, по нашей теме можно сделать несколько проходов:
- последние 5 лет — чтобы увидеть актуальное состояние исследований;
- только обзорные работы — чтобы быстро войти в тему;
- отдельно патенты — чтобы понять прикладные решения;
- отдельно российские источники — чтобы увидеть локальный контекст;
- отдельно зарубежные публикации — чтобы не потерять мировую картину.
! Главное правило: не «зажимайте» выдачу слишком рано. Сначала карта, потом фильтрация.
Шаг 7. Сохраняем не всё, а только рабочее ядро
Хороший результат первого поиска — это не 200 документов. Хороший результат — это стартовое ядро, с которым уже можно работать.
Для статьи достаточно собрать 10–20 источников.
Для диплома — 30–60.
Для диссертации список будет расширяться дальше, но начальное ядро всё равно должно быть осмысленным.
В стартовый набор можно включить:
- 2–3 обзорные статьи;
- 5–10 свежих исследований;
- несколько базовых работ, на которые часто ссылаются;
- 2–5 патентов или прикладных материалов, если тема технологическая;
- список ключевых авторов и организаций.
Каждый найденный документ можно добавить в Проект.
Например, для нашей темы можно создать проект:
Антикоррозионные полимерные покрытия для труб
А внутри держать отдельные смысловые группы:
- обзоры
- материалы покрытий
- методы нанесения
- испытания стойкости
- патенты
- ключевые авторы
- организации
Так список литературы становится не архивом PDF-файлов, а рабочим исследовательским пространством.
Шаг 8. Выгружаем результат
Когда стартовая подборка собрана, её можно сохранить. Если нужно передать список научному руководителю, коллеге или команде, удобна выгрузка в Excel. Если нужно зафиксировать материалы проекта в более презентационном виде, можно использовать PDF-отчёт.
На практике Excel особенно полезен на раннем этапе. Его можно дополнить своими колонками:
- почему источник важен
- к какой группе относится
- что нужно прочитать полностью
- что можно оставить как справочный материал
- какие вопросы остались после просмотра
Что должно получиться в итоге
После первого семантического поиска у вас должна появиться не «куча источников», а первичная карта темы:
- какие направления внутри темы существуют;
- какие материалы и методы чаще всего встречаются;
- какие авторы и организации заметны в выдаче;
- есть ли патентная активность;
- какие источники стоит читать первыми;
- какие пробелы требуют отдельного поиска.
Именно из этих пробелов часто рождается актуальность работы.
Например, вы можете увидеть, что много публикаций посвящено лабораторным испытаниям покрытия, но мало данных о промышленной эксплуатации. Или что есть зарубежные патенты на составы, но мало российских работ по конкретному типу трубопроводов. Или что тема активно развивается в Китае, но почти не представлена в вашей локальной научной повестке.
Это уже не просто поиск. Это первый слой исследовательской аналитики.
В следующей части мы разберём, когда семантического поиска уже недостаточно и как переходить к структурированному поиску с операторами, областями документа и более точной логикой запроса.