Найти в Дзене
Bukva - всему golova

СПИ: Система палеографических инспекций

Анализ взаимосвязи стилей письма и культурного фона в древних рукописях является важной задачей палеографа. Эти связи используются для пространственно-временного размещения документов, особенно при отсутствии другой полезной информации. Морфологический анализ шрифтов является важнейшим компонентом палеографической науки. Тем не менее, иногда палеографы сталкиваются с многочисленными неясностями при определении личности рукописей. Из-за отсутствия каких-либо четких и четко определенных критериев эксперты расходятся во мнениях относительно того, какой морфологический признак следует считать релевантным, и разные эксперты обладают разными экспертными знаниями. Эту проблему можно решить, предоставив экспертам по палеографии объективные методы, обходящие субъективность личного опыта. Необходимость разработки объективного метода, основанного на строгой статистической/цифровой процедуре, является основной мотивацией нашей работы, которая в настоящее время ограничивается анализом книжных руко
Оглавление

Анализ взаимосвязи стилей письма и культурного фона в древних рукописях является важной задачей палеографа. Эти связи используются для пространственно-временного размещения документов, особенно при отсутствии другой полезной информации. Морфологический анализ шрифтов является важнейшим компонентом палеографической науки. Тем не менее, иногда палеографы сталкиваются с многочисленными неясностями при определении личности рукописей. Из-за отсутствия каких-либо четких и четко определенных критериев эксперты расходятся во мнениях относительно того, какой морфологический признак следует считать релевантным, и разные эксперты обладают разными экспертными знаниями. Эту проблему можно решить, предоставив экспертам по палеографии объективные методы, обходящие субъективность личного опыта.

Необходимость разработки объективного метода, основанного на строгой статистической/цифровой процедуре, является основной мотивацией нашей работы, которая в настоящее время ограничивается анализом книжных рукописей. Кроме того, основными пользователями палеографических советов являются историки, которые не специализируются на палеографии. Такая система, как эта, может также помочь такому типу пользователей получить начальную консультацию. По этой причине я предлагаю адаптивную систему поддержки, которая на основе изображений древних документов генерирует модели различных стилей письма, которые затем используются для связи новых неизвестных документов с теми, которые разработаны системой. Методы, используемые в системе, основаны на недавно введенной концепции расстояния, касательного расстояния, которая позволяет системе быть инвариантной в отношении глобальных преобразований (таких как сдвиги и вращения) и фиксировать с помощью процедур обучения морфологические особенности, характеризующие стиль письма конкретного документа. В нашем подходе каждая рукопись представлена набором прототипов. Каждая модель создается из набора символов одного и того же типа, взятых из документа, и содержит информацию, представляющую основные морфологические характеристики класса символов. Разработанная система представляет различные вспомогательные средства палеографического анализа: классификация новых документов комитетом классификаторов по отдельным признакам, морфологический анализ односимвольной модели и анализ связей между моделями в (априорно определенном) подмножестве моделей. Первый инструмент ориентирован на пользователей с низким палеографическим опытом, в то время как остальные больше подходят для специалистов, которым необходимо выполнить более глубокий анализ стилей символов.

Системная архитектура

Целью предлагаемой системы является извлечение неизвестных знаний, анализ цифровых образов документов с различными стилями письма. Для достижения этого результата простое решение заключается в том, чтобы рассматривать написанный текст как набор отдельных символов. Таким образом, можно сосредоточиться на небольших особенностях стилей письма. Надеюсь, что любая компьютерная система, направленная на решение задач классификации или анализа, должна удовлетворять определенным требованиям:

  • выходные данные должны быть устойчивыми к глобальным трансформациям (т.е. трансформации, включающие в себя полное изображение, такие как повороты, масштабирование, смещение местоположения и т.д.);
  • система должна быть способна извлекать знания из набора данных, сохраняя понятное представление, полезное для человеческого анализа;

В системе рассматриваются глобальные преобразования, которые не изменяют морфологических особенностей образов. Для удовлетворения этих требований предлагаемая система извлекает модели стилей символов с помощью методов обучения, основанных на тангенциальном расстоянии. На самом деле, эти методы конструируют модели, обладающие свойством быть легко понятными людям. Затем эти модели используются в рамках ближайшего соседнего алгоритма с тангенциальным расстоянием в качестве классификационной меры. Поскольку каждый документ представляет собой собрание одного или нескольких изображений средневековой рукописи, нам нужна система, способная извлекать символы по одному и рассматривать их как однородный набор информации в процессе засекречивания.

https://pixabay.com/photos/papyrus/hieroglyphics-63004/
https://pixabay.com/photos/papyrus/hieroglyphics-63004/

Систему можно рассматривать как реализацию двух основных процессов:

Первый процесс (обучение) извлекает для каждого документа набор символов интересов с помощью алгоритма сегментации, а затем, группируя однородные данные, генерирует набор эталонных моделей (по одной для каждого типа символов).

Второй процесс (оперативный этап) включает изучение уже смоделированных документов и связанных с ними прототипов, а также классификацию нового документа, который система никогда раньше не видела. В этом случае классификация документов заключается в возвращении наиболее похожего документа, с морфологической точки зрения, среди хранящихся в системе.

Система также предоставляет три графических инструмента для проверки ранее вставленных документов: анализ касательной, дендограмма и полная диаграмма. Для управления всеми данными система ведет реляционную базу данных, содержащую всю необходимую информацию. Взаимодействие с пользователем ограничивается выбором символов, представляющих интерес в рамках оцифрованного документа. Эти символы автоматически извлекаются из документа и могут быть использованы либо для создания новых прототипов, либо для ввода в систему классификации. Выбор символов для использования в тренировочном наборе полностью остается на усмотрение пользователя.

Систему можно рассматривать как набор агентов, взаимодействующих через базу данных: агент сегментации, агент генерации модели и агент интерпретации модели. Агент сегментации обращается к базе данных всякий раз, когда ему необходимо получить изображения для получения новых символов и для хранения новых сегментированных символов. Агент по созданию модели запрашивает базу данных всякий раз, когда ей нужен набор символов для обучения и хранения сгенерированных прототипов. Агенты по классификации и интерпретации запрашивают в базе данных информацию, хранящуюся у других агентов.

Обучение

Фаза обучения является основной и наиболее вычислительно тяжелой частью системы. Это объясняется тем, что, учитывая набор символов, относящихся к справочным документам, система должна подготовить модель, суммирующую их морфологические особенности. Более того, сгенерированная модель должна быть понятна человеку, чтобы дать возможность экспертам анализировать особенности и изменчивость каждого стиля письма. Методы обучения, разработанные для создания моделей тангенциального расстояния, особенно подходят для этого контекста, поскольку они позволяют разрабатывать модели, которые являются инвариантными для глобальных преобразований, таких как ротация и сдвиг, которые обычно вводятся путем оцифровки документов, с учетом конкретных особенностей и изменчивости каждого стиля сценария.

Классификация и анализ

По окончании этапа обучения модели могут быть использованы как для классификации новых документов, так и для изучения морфологических особенностей конкретного документа.

Системный интерфейс

SPI (Система палеографических осмотров) предлагает удобный интерфейс для пользователей, которым необходимо классифицировать или анализировать палеографические документы путем проверки содержащихся в них символов.

Заключение

Я описал систему, способную извлечь из набора оцифрованных книжных рукописей объективные знания о морфологии образов, составляющих рукописи. Система способна почти автоматически извлекать из документов отдельные символы и создавать прототипы символов, принадлежащих одному и тому же документу. Эти прототипы создаются с помощью тангенциальных дистанционных методов, которые позволяют инвариантно реагировать на глобальные преобразования моделей, преобразования, которые могут быть осуществлены во время оцифровки рукописей. Кроме того, эти методы позволяют системе фиксировать соответствующие морфологические особенности каждого стиля письма. Разработанные прототипы затем используются как для связи неизвестных документов с документами, хранящимися в системе, так и для графического отображения общих морфологических характеристик, разделяемых символами, принадлежащими одному и тому же документу. Эта последняя особенность системы реализуется с помощью набора инструментов для анализа одной модели или анализа набора моделей. Для облегчения и интеграции различных функций системы используется палеографическая база данных, содержащая как изображения документов, так и извлеченные символы и разработанные модели, которая, как показали испытания 37 различных документов и более 7000 символов, является чрезвычайно стабильной и надежной. Дальнейшее развитие системы будет включать добавление интерфейса для пользователей, которые не являются специалистами по методам обучения, и расширенное тестирование ее функциональных возможностей.