Добавить в корзинуПозвонить
Найти в Дзене

Как мы превратили Word-прейскуранты филиалов в единую аналитическую Excel-таблицу с помощью LLM

Экономист медицинской организации всё чаще работает не только с готовыми таблицами, но и с «неудобными» источниками данных: Word-файлами, PDF-документами, сканами, прейскурантами филиалов, разрозненными Excel-таблицами, внутренними справочниками, выгрузками из медицинских информационных систем и отчётных подсистем. Формально в этих документах уже содержатся нужные сведения, но практически они часто представлены в виде, неудобном для анализа. Типовая ситуация: существует единый Word-документ с прейскурантами по нескольким филиалам. В каждом разделе указаны медицинские услуги, коды услуг, наименования и цены. Однако для экономического анализа, сверки, нормализации, загрузки в программный продукт или подготовки управленческого отчёта требуется не набор отдельных прейскурантов, а единая сводная таблица. В рассматриваемом кейсе исходный файл содержал прейскуранты по филиалам, а итоговая таблица была сформирована в формате Excel со следующей логикой: в первых столбцах указаны номер строки, к
Оглавление

Введение: зачем экономисту в здравоохранении нужны LLM-системы

Экономист медицинской организации всё чаще работает не только с готовыми таблицами, но и с «неудобными» источниками данных: Word-файлами, PDF-документами, сканами, прейскурантами филиалов, разрозненными Excel-таблицами, внутренними справочниками, выгрузками из медицинских информационных систем и отчётных подсистем. Формально в этих документах уже содержатся нужные сведения, но практически они часто представлены в виде, неудобном для анализа.

Типовая ситуация: существует единый Word-документ с прейскурантами по нескольким филиалам. В каждом разделе указаны медицинские услуги, коды услуг, наименования и цены. Однако для экономического анализа, сверки, нормализации, загрузки в программный продукт или подготовки управленческого отчёта требуется не набор отдельных прейскурантов, а единая сводная таблица.

В рассматриваемом кейсе исходный файл содержал прейскуранты по филиалам,

-2

а итоговая таблица была сформирована в формате Excel со следующей логикой: в первых столбцах указаны номер строки, код услуги и наименование услуги, далее отдельные столбцы по каждому филиалу, а в ячейках указана стоимость услуги в конкретном филиале либо знак «-», если услуга в данном филиале не оказывается.

-3

Итоговый результат имел практическую ценность: вместо разрозненного Word-документа была получена единая аналитическая таблица. Такая структура сразу пригодна для фильтрации, сравнения цен, выявления отсутствующих услуг, поиска расхождений и последующей загрузки в информационную систему.

LLM-системы в подобных задачах полезны не потому, что «заменяют экономиста», а потому что позволяют быстро выполнить трудоёмкий этап первичной структуризации данных. Экономист при этом остаётся методологом, постановщиком задачи и контролёром качества результата.

Суть технологии простыми словами

LLM-система работает как интеллектуальный помощник, который способен понять не только отдельные слова, но и смысловую структуру документа. Если в документе есть повторяющиеся блоки — например, прейскурант филиала, затем другой филиал, затем третий филиал, — система может распознать закономерность и преобразовать данные в более удобный формат.

В задаче обработки прейскуранта LLM-система выполняет несколько действий:

  1. Определяет, где в документе начинаются и заканчиваются разделы по филиалам.
  2. Находит внутри каждого раздела строки с медицинскими услугами.
  3. Выделяет из каждой строки ключевые элементы: код услуги, наименование услуги и цену.
  4. Сопоставляет одинаковые услуги между филиалами.
  5. Формирует единую таблицу, где каждая услуга занимает одну строку, а цены по филиалам размещены по столбцам.
  6. Если услуга отсутствует в филиале, заполняет ячейку условным обозначением, например «-».

Таким образом, LLM-система переводит документ из формата «человек читает последовательно» в формат «экономист анализирует таблично».

Почему такая задача важна для экономиста медицинской организации

Работа с прейскурантами медицинских услуг имеет не только техническое, но и управленческое значение. Единая таблица по филиалам позволяет решать сразу несколько практических задач.

Во-первых, появляется возможность сравнивать цены на одну и ту же услугу между филиалами. Это важно для выявления необоснованных отклонений, устаревших цен и различий, которые требуют экономического объяснения.

Во-вторых, можно быстро определить, в каких филиалах услуга отсутствует. Это полезно для анализа доступности платных медицинских услуг, оценки полноты ассортимента и планирования развития направлений.

В-третьих, единая таблица позволяет выявлять дубли, разные написания одной и той же услуги, неполные коды, ошибочные наименования, пропуски цен и иные дефекты справочника.

В-четвёртых, такая таблица может быть использована как промежуточный этап для загрузки данных в программный продукт, например в модуль управления стоимостью медицинских услуг, справочник прейскуранта или систему калькуляции себестоимости.

В-пятых, структурированный прейскурант помогает готовиться к внутренним проверкам, сверке с Номенклатурой медицинских услуг, анализу соответствия кодов и наименований, а также к экономическому обоснованию стоимости услуг.

Общая схема применения LLM-системы

Технологию применения LLM для подобных задач удобно рассматривать как последовательность из шести этапов.

Этап 1. Постановка экономической задачи

Перед загрузкой файла необходимо чётко определить, какой результат нужен. В рассматриваемом случае задача была сформулирована так: обработать Word-файл с прейскурантами по филиалам и сформировать единую Excel-таблицу со столбцами «№ п/п», «Код услуги», «Наименование услуги», далее — названия филиалов, а в ячейках — стоимость услуги или «-».

Это хороший пример прикладной постановки задачи. В ней указаны:

  • исходный тип данных;
  • требуемый формат результата;
  • структура будущей таблицы;
  • правило заполнения отсутствующих значений;
  • логика сведения данных по филиалам.

Главный методологический вывод: LLM-системе нужно давать не абстрактную команду «обработай файл», а конкретное описание будущей таблицы.

Этап 2. Подготовка исходного файла

Перед отправкой документа в LLM-систему желательно оценить его качество. Экономисту следует проверить, содержит ли файл все филиалы, читаются ли таблицы, не нарушена ли нумерация, нет ли сканов низкого качества, не смешаны ли услуги с пояснительными строками, не присутствуют ли персональные данные пациентов или сотрудников.

Для прейскурантов особенно важно, чтобы в документе были различимы три элемента: код услуги, наименование услуги и цена. Если хотя бы один из этих элементов представлен нестабильно, результат может потребовать дополнительной проверки.

Если файл содержит конфиденциальные сведения, персональные данные или коммерчески чувствительную информацию, необходимо применять внутренние правила организации по обезличиванию, использованию корпоративных защищённых LLM-систем или локальных инструментов обработки данных.

Этап 3. Формулирование промпта

Промпт — это рабочее задание для LLM-системы. От качества промпта зависит качество результата. Хороший промпт должен быть понятен не только нейросети, но и человеку-исполнителю.

Пример базового промпта:

Обработай файл, сформируй на его основе в Excel единую таблицу со столбцами: № п/п, Код услуги, Наименование услуги, далее Название каждого филиала. Для каждого филиала проставь стоимость соответствующей услуги в этом филиале или «-», если в данном филиале услуга не оказывается.

Этот промпт уже содержит основную бизнес-логику. Однако для регулярной профессиональной работы его можно усилить.

Расширенный вариант промпта

Проанализируй приложенный файл с прейскурантами медицинских услуг по филиалам.Необходимо сформировать единый Excel-файл для экономического анализа.

Требуемая структура таблицы:

  1. № п/п;
  2. Код услуги;
  3. Наименование услуги;
  4. далее отдельные столбцы по каждому филиалу.

По каждой уникальной услуге сформируй одну строку. Если услуга присутствует в филиале, укажи её стоимость. Если услуга отсутствует, укажи «-».

При сопоставлении услуг ориентируйся прежде всего на код услуги, затем на наименование услуги. Если код отсутствует или вызывает сомнение, используй наименование, но такие случаи желательно отразить отдельно в примечаниях.

Сохрани исходные названия филиалов в заголовках столбцов.

В отдельном листе сформируй краткую сводку: количество филиалов, количество уникальных услуг, количество исходных строк, выявленные дубли или спорные случаи.

Результат подготовь в формате Excel.

Такой промпт лучше подходит для повторяемой технологии, потому что не только задаёт итоговую структуру, но и описывает правила сопоставления, требования к контролю качества и необходимость сводного листа.

Ключевой принцип: LLM не просто извлекает данные, а нормализует их

В практической работе важно понимать разницу между простым извлечением и нормализацией.

Простое извлечение означает, что система переносит строки из документа в таблицу почти без изменений. Это полезно, но недостаточно для экономического анализа.

Нормализация означает, что система приводит данные к единой структуре: одинаковые услуги объединяет в одну строку, цены раскладывает по филиалам, пустые значения заменяет заданным обозначением, а повторяющиеся строки сворачивает или помечает.

Именно нормализация создаёт аналитическую ценность. Без неё экономист получает просто «перепечатанный» документ. После нормализации появляется полноценный инструмент для анализа.

Как LLM-система сопоставляет услуги между филиалами

При сведении прейскурантов главная методологическая сложность состоит в том, чтобы понять, какие строки из разных филиалов относятся к одной и той же услуге.

Наиболее надёжный идентификатор — код услуги. Если код одинаковый, высока вероятность, что речь идёт об одной услуге. Однако в реальных прейскурантах возможны проблемы: код может быть указан не полностью, содержать лишние пробелы, отличаться количеством нулей, иметь ошибку в одном символе или отсутствовать.

Второй идентификатор — наименование услуги. Оно помогает, когда код отсутствует или требует проверки. Но наименование менее надёжно, потому что одна и та же услуга может быть написана по-разному: с сокращениями, дополнительными уточнениями, разным порядком слов, скобками, кавычками или примечаниями.

Поэтому для медицинских прейскурантов целесообразно использовать комбинированное правило:

  • основное сопоставление — по коду услуги;
  • дополнительная проверка — по наименованию;
  • спорные случаи — выносить в отдельный контрольный список.

Такой подход снижает риск ошибочного объединения разных услуг и помогает сохранить проверяемость результата.

Что обязательно проверить после получения результата

LLM-система может качественно выполнить первичную обработку, но результат обязательно должен пройти экономическую и методологическую проверку. Это особенно важно для медицинских услуг, где ошибка в коде, цене или наименовании может повлиять на расчёты, загрузку справочника и управленческие выводы.

Практическая методика проверки результата в Excel

После получения Excel-файла экономисту рекомендуется выполнить несколько простых контрольных действий.

Проверка 1. Фильтр по пустым кодам

Включить фильтр по столбцу «Код услуги» и проверить, есть ли пустые значения. Если есть, эти строки нужно отдельно разобрать.

Проверка 2. Поиск повторяющихся кодов

Если каждая услуга должна быть уникальной строкой, повторяющиеся коды требуют проверки. В Excel можно использовать условное форматирование для выделения дублей.

Проверка 3. Проверка ценовых столбцов

По каждому филиалу следует проверить, что цены отображаются как числа. Если Excel воспринимает цену как текст, дальнейшие расчёты могут работать некорректно.

Проверка 4. Контроль экстремальных значений

Полезно отсортировать цены по убыванию и возрастанию. Это помогает выявить очевидные ошибки: лишние нули, потерянные нули, цену «120 000» вместо «12 000» или наоборот.

Проверка 5. Сравнение с исходным документом по выборке

Необходимо выбрать несколько услуг из разных разделов исходного документа и вручную сверить их с итоговой таблицей. Проверка должна включать как популярные услуги, так и редкие услуги, а также услуги из разных филиалов.

Проверка 6. Проверка услуг с одинаковым наименованием и разными кодами

Такие случаи могут быть корректными, но могут указывать на ошибку справочника. Их лучше выделять отдельно.

Проверка 7. Проверка услуг с одинаковым кодом и разными наименованиями

Это более критичный случай. Он может означать, что код используется некорректно или наименование услуги было изменено в одном из филиалов.

Как правильно формулировать задания для аналогичных задач

Для экономистов важно не просто повторить один успешный промпт, а научиться переносить методику на другие задачи. Для этого промпт должен включать пять обязательных элементов.

1. Описание исходных данных

Нужно указать, что именно содержится в файле: прейскуранты, перечни услуг, отчёты по оказанным услугам, калькуляции, штатные расписания, табели, выгрузки из МИС, справочники материалов или оборудования.

Пример:
В файле содержатся прейскуранты медицинских услуг по нескольким филиалам. Каждый раздел относится к отдельному филиалу и содержит код услуги, наименование услуги и стоимость.

2. Описание конечного результата

LLM-система должна понимать, какой файл и какая структура нужны на выходе.

Пример:
Сформируй единый Excel-файл, в котором каждая уникальная услуга представлена одной строкой, а филиалы вынесены в отдельные столбцы.

3. Правила обработки

Нужно заранее указать, как объединять строки, что считать уникальной услугой, как обозначать отсутствующие значения, что делать с дублями и спорными случаями.

Пример:
Уникальность услуги определяй по коду услуги. Если код отсутствует, используй наименование услуги и пометь такие случаи как требующие проверки.

4. Требования к контролю качества

LLM-системе полезно прямо поручить сформировать сводку или лист контроля.

Пример:
В отдельном листе укажи количество исходных строк, количество уникальных услуг, количество филиалов, выявленные дубли и строки, требующие ручной проверки.

5. Формат результата

Нужно указать формат файла и желаемую структуру листов.

Пример:
Результат сохрани в формате Excel. Первый лист — единая таблица, второй лист — сводка контроля качества, третий лист — спорные случаи.

Примеры аналогичных задач для экономиста в здравоохранении

Технология, использованная для сведения прейскурантов, применима к широкому кругу задач.

1. Сведение цен по филиалам

Исходные данные: отдельные прейскуранты филиалов.
Результат: единая матрица «услуга × филиал».
Практическая польза: сравнение цен, выявление отклонений, подготовка единой тарифной политики.

2. Сопоставление прейскуранта с Номенклатурой медицинских услуг

Исходные данные: внутренний прейскурант и эталонный справочник.
Результат: таблица соответствия внутреннего кода, внутреннего наименования, номенклатурного кода и официального наименования.
Практическая польза: повышение нормативной корректности справочника.

3. Объединение отчётов по оказанным услугам

Исходные данные: выгрузки по филиалам или периодам.
Результат: единая таблица с объёмами услуг, суммами, подразделениями и исполнителями.
Практическая польза: анализ выручки, структуры спроса, загрузки подразделений.

4. Обработка калькуляционных карт

Исходные данные: файлы с нормами времени, материалами, медикаментами, оборудованием.
Результат: единая структура затрат по услугам.
Практическая польза: расчёт себестоимости, сравнение нормативной и фактической стоимости.

5. Сравнение нескольких версий прейскуранта

Исходные данные: прейскуранты за разные даты.
Результат: таблица изменений цен, новых услуг, исключённых услуг и переименований.
Практическая польза: контроль динамики цен, подготовка обоснования изменений.

6. Подготовка данных для загрузки в программный продукт

Исходные данные: Word, Excel, PDF или смешанные файлы.
Результат: нормализованная таблица в формате, пригодном для импорта.
Практическая польза: сокращение ручного ввода, снижение ошибок, ускорение внедрения.

Методологические риски при применении LLM

LLM-системы значительно ускоряют обработку данных, но их нельзя рассматривать как безошибочный источник истины. Экономист должен понимать основные риски.

1. Риск неверного объединения услуг

Система может ошибочно объединить похожие, но разные услуги. Например, две услуги могут иметь похожие наименования, но отличаться методом выполнения, локализацией или использованием расходных материалов.

2. Риск пропуска строки

Если строка в исходном документе плохо отформатирована, LLM-система может не распознать её как услугу.

3. Риск неправильного определения филиала

Если в документе нарушена структура заголовков, часть услуг может быть отнесена к неправильному филиалу.

4. Риск преобразования цены в неверный формат

Например, цена может быть считана как текст, число может потерять пробел-разделитель тысяч, или значение с примечанием может быть перенесено некорректно.

5. Риск игнорирования примечаний

В прейскурантах часто встречаются пояснения: «включая расходный материал», «без стоимости анестезии», «при наличии направления», «для иностранных граждан», «с контрастированием». Такие примечания могут быть экономически значимыми.

6. Риск ложного ощущения полной автоматизации

Главный риск — считать, что если таблица выглядит аккуратно, значит она полностью корректна. На практике аккуратная таблица должна пройти контрольную сверку.

Роль экономиста: не оператор, а постановщик и контролёр

Правильная модель работы с LLM-системой выглядит следующим образом:

LLM выполняет трудоёмкую первичную обработку, а экономист задаёт правила и проверяет результат.

Экономист должен определить:

  • какие поля являются обязательными;
  • что считать уникальной услугой;
  • как обрабатывать дубли;
  • как обозначать отсутствие услуги;
  • какие ошибки критичны;
  • какие случаи требуют ручной проверки;
  • какой формат нужен для дальнейшей работы.

Именно эти решения определяют качество результата. LLM-система может быстро преобразовать документ, но она не знает внутреннюю экономическую политику организации, требования конкретной информационной системы, правила ведения справочников и управленческий контекст.

Как улучшить промпт, если первая версия результата недостаточно хорошая

Работа с LLM редко ограничивается одной командой. Часто результат нужно уточнять.

Если система неправильно определила филиалы, следует написать:

Проверь, что каждый раздел исходного документа соответствует отдельному филиалу. Переформируй таблицу так, чтобы каждый филиал был отдельным столбцом. Не объединяй филиалы с похожими названиями.

Если появились дубли услуг:

Найди повторяющиеся строки по коду услуги и наименованию. Если повтор относится к одному филиалу и цена одинаковая, сверни его в одну запись. Если цена разная, вынеси такие случаи на отдельный лист «Контроль дублей».

Если цены распознаны как текст:

Преобразуй все цены в числовой формат Excel. Значение «-» оставь текстовым только для отсутствующих услуг. Не используй пустые ячейки для отсутствующих услуг.

Если есть сомнения по кодам:

Сформируй отдельный лист со строками, где отсутствует код услуги, код имеет нестандартный формат или один и тот же код встречается с разными наименованиями.

Если нужно подготовить файл для загрузки:

Добавь отдельный лист «Для загрузки» в плоском формате: филиал, код услуги, наименование услуги, цена. Исключи строки, где цена равна «-».

Два формата итоговой таблицы: матричный и плоский

Для экономиста важно понимать, что одна и та же информация может быть представлена в двух полезных форматах.

Матричный формат

Это формат, использованный в рассматриваемом кейсе:

Код услуги Наименование услуги Филиал 1 Филиал 2 Филиал 3

Он удобен для визуального сравнения цен между филиалами. Такой формат хорошо подходит для руководителей, экономистов, анализа отклонений и подготовки презентационных материалов.

Плоский формат

В плоском формате каждая строка содержит одну цену одной услуги в одном филиале:

Филиал Код услуги Наименование услуги Цена

Этот формат удобен для загрузки в базы данных, BI-системы, Power Query, Power BI, программные продукты и автоматизированные справочники.

Хорошая практика — просить LLM-систему формировать оба формата: основной лист в матричном виде, а дополнительный лист в плоском виде для импорта.

Расширенный промпт для профессиональной обработки данных

Для регулярной работы экономического отдела можно использовать следующий профессиональный шаблон.

Ты выступаешь как аналитик по медицинской экономике.
Проанализируй приложенный файл с прейскурантами медицинских услуг.

Необходимо подготовить Excel-файл для экономического анализа, контроля справочника и возможной загрузки данных в программный продукт.

Сформируй следующие листы:

Лист 1 «Единая таблица»:
№ п/п;
Код услуги;
Наименование услуги;
далее столбцы по филиалам;
в ячейках — цена услуги в филиале или «-», если услуга отсутствует.

Лист 2 «Плоский формат»:
Филиал;
Код услуги;
Наименование услуги;
Цена.
В этот лист включай только услуги, которые оказываются в филиале.

Лист 3 «Контроль качества»:
строки без кода;
строки без цены;
повторяющиеся услуги внутри одного филиала;
одинаковые коды с разными наименованиями;
одинаковые наименования с разными кодами;
прочие спорные случаи.

Лист 4 «Сводка»:
количество филиалов;
количество исходных строк;
количество уникальных услуг;
количество услуг по каждому филиалу;
количество выявленных дублей;
количество строк, требующих проверки.

При сопоставлении услуг используй код услуги как основной идентификатор. Наименование используй как дополнительный признак. Не скрывай спорные случаи, а выноси их на лист контроля качества.

Таблицы должны быть пригодны для фильтрации, сортировки и дальнейшего анализа в Excel.

Практические выводы

LLM-системы особенно полезны там, где данные уже есть, но они представлены в неудобном для анализа виде. Прейскуранты, перечни услуг, отчёты, калькуляции, справочники и выгрузки можно быстро привести к единой структуре, если правильно сформулировать задание.

Главная ценность LLM для экономиста в здравоохранении — ускорение первичной обработки и нормализации данных. При этом методологическая ответственность остаётся за специалистом. Экономист должен определить правила обработки, проверить результат, выявить спорные случаи и принять решение, можно ли использовать таблицу для анализа, расчётов или загрузки в систему.

-4

Этот анализ — часть нашей большой работы.

Чтобы всегда иметь под рукой актуальную аналитику по экономике здравоохранения, цифровизации и эффективности медицинских организаций, присоединяйтесь к нашему профессиональному сообществу.

👉 Продолжение — в Telegram-канале «АРМ в белом»

Здесь мы регулярно публикуем:

  • комментарии к последним нововведениям и отраслевым отчетам;
  • кейсы и примеры из практики;
  • анонсы наших собственных исследований.

Специальные вопросы, практические разборы и справочные материалы по теме предоставляются в рамках уникального практического курса.

Подписаться: https://t.me/medsoftlab_arm, https://max.ru/id772647093722_biz

👉 Полная информация о проектах и технологиях «МедСофтЛаб» — на официальном сайте: https://medsoftlab.ru/