Добавить в корзинуПозвонить
Найти в Дзене
KBPublisher

Массовая миграция документов в базу знаний: как перенести файловый архив в веб за 1 час

Сетевая папка Z:\Docs\ — это кладбище полезной информации. Сотрудники тратят часы, пытаясь найти "тот самый регламент за 2023 год", открывают устаревшие версии договоров, а с мобильного телефона доступ к архиву вовсе невозможен. Перенос тысяч файлов в веб-интерфейс кажется задачей на месяц ручного труда. Но если вы используете Open Source Knowledge Base или облачное решение вроде KBPublisher, этот процесс занимает от 30 до 60 минут настройки. Система сама просканирует ваши папки, создаст структуру категорий и сделает содержимое файлов доступным для поиска. При внедрении базы знаний администраторы сталкиваются с выбором метода миграции. В KBPublisher предусмотрено три сценария, закрывающих разные потребности. Если у вас сложная кастомная система документооборота, используйте REST API. Это гибкий метод, который позволяет программно создавать записи, загружать бинарные данные и прописывать мета-теги. Подходит для интеграторов, готовых писать код. Классический метод для структурированных
Оглавление

Сетевая папка Z:\Docs\ — это кладбище полезной информации. Сотрудники тратят часы, пытаясь найти "тот самый регламент за 2023 год", открывают устаревшие версии договоров, а с мобильного телефона доступ к архиву вовсе невозможен.

Перенос тысяч файлов в веб-интерфейс кажется задачей на месяц ручного труда. Но если вы используете Open Source Knowledge Base или облачное решение вроде KBPublisher, этот процесс занимает от 30 до 60 минут настройки. Система сама просканирует ваши папки, создаст структуру категорий и сделает содержимое файлов доступным для поиска.

как перенести файловый архив в веб за 1 час
как перенести файловый архив в веб за 1 час

3 способа массовой загрузки (от сложного к простому)

При внедрении базы знаний администраторы сталкиваются с выбором метода миграции. В KBPublisher предусмотрено три сценария, закрывающих разные потребности.

Способ 1: API (для разработчиков)

Если у вас сложная кастомная система документооборота, используйте REST API. Это гибкий метод, который позволяет программно создавать записи, загружать бинарные данные и прописывать мета-теги. Подходит для интеграторов, готовых писать код.

Способ 2: CSV Импорт

Классический метод для структурированных данных. Вы формируете таблицу со ссылками на файлы, описаниями и тегами, а система загружает их пакетно. Это быстрее ручного ввода, но требует предварительной подготовки файла импорта.

Способ 3: Автоматизация через Directory Rules (Лучший выбор)

Это "киллер-фича" для системных администраторов. Вы просто указываете системе путь к папке на сервере, и KBPublisher зеркалирует её содержимое в базу знаний. Никакого кода, никаких CSV-таблиц. Именно этот метод мы разберем детально.

Как работает "Магия" Directory Rules в KBPublisher

Функция Directory Rules (Правила директорий) превращает статичное файловое хранилище в динамическую базу знаний. Логика работы следующая:

  1. Источник: Вы выбираете источник файлов. Это может быть локальная директория на сервере или облачное хранилище Yandex cloud.
  2. Синхронизация: Скрипт по расписанию проверяет папку. Новые файлы добавляются в базу, удаленные — деактивируются или удаляются (в зависимости от настроек).
  3. Обработка: Система не просто сохраняет файл. Запускается процесс извлечения текста (OCR / Индексация), считывается размер и формат.
Как работает Directory Rules в KBPublisher
Как работает Directory Rules в KBPublisher

Главное преимущество — полнотекстовый поиск (Full-text search). Пользователь найдет договор не только по названию "Договор_123.pdf", но и по фамилии клиента или ИНН, упомянутым внутри документа. Поддерживаются форматы PDF, Word, Excel и OpenOffice.

Пошаговый гайд: Настраиваем миграцию

Настройка занимает несколько минут и не требует навыков программирования.

Шаг 1: Подготовка файлов

Убедитесь, что в исходной папке нет "мусора". Структурируйте папки так, как вы хотите видеть их в базе знаний. KBPublisher умеет считывать вложенность, но чистота источника — залог удобной навигации.

Шаг 2: Создание правила

В панели администратора перейдите в раздел "Файлы" -> "Правила директорий". Создайте новое правило:

  • Укажите путь к директории (например, /var/www/docs/finance).
  • Выберите категорию в базе знаний, куда будут попадать файлы.
  • Установите статус по умолчанию (например, "Опубликован").
  • Назначьте теги, которые автоматически применятся ко всем загруженным документам.

Шаг 3: Настройка расписания

Чтобы база знаний всегда была актуальной, настройте автоматическую проверку директорий. Используйте встроенный планировщик задач (Scheduled Tasks). Рекомендуем настроить проверку раз в сутки или чаще, если документы обновляются динамично.

Что вы получите в итоге

Автоматизация загрузки решает не только проблему переноса, но и кардинально меняет работу с информацией.

  • Мгновенный поиск. Как упоминалось выше, полнотекстовый поиск работает по содержимому. Исследования McKinsey показывают, что сотрудники тратят до 20% рабочего времени просто на поиск информации. Индексация файлов сокращает это время до секунд.
  • Контроль версий. Если вы обновите файл в исходной папке, KBPublisher подтянет новую версию, сохранив историю изменений. Сотрудники всегда видят актуальный документ, но администратор может откатить изменения при необходимости.
  • Безопасность. Вы можете настроить права доступа так, что финансовые документы увидят только бухгалтеры, а инструкции — все сотрудники. Права назначаются на уровне категорий.
-3

Перенос файлового архива в веб — это вопрос гигиены бизнес-процессов. Файлы на диске мертвы, файлы в базе знаний — работают.

Вы можете выбрать удобный формат старта:

  1. Быстрый старт: Попробуйте KBPublisher Облачную версию. Мы уже настроили окружение, индексацию и конвертеры. Вам останется только загрузить файлы. Попробовать бесплатно 30 дней
  2. Полный контроль: Скачайте Community Edition с GitHub. Это бесплатная версия, которую вы можете развернуть на своем сервере и настроить под любые требования безопасности. Скачать с GitHub