- Крупномасштабные проекты по оцифровке, осуществленные за последние двадцать лет, и возможность их использования с помощью Международной сети оперативной совместимости изображений (МСОСИ) внесли существенный вклад в достижение критической массы, которая позволяет применять углубленное изучение средневековых шрифтов.
- В средневековье шрифты развивались с течением времени:
- Дисциплина изучения этих хронологических и региональных вариаций шрифта называется палеографией, и она требует глубокого и детального знания исторических особенностей шрифта и опыта.
Крупномасштабные проекты по оцифровке, осуществленные за последние двадцать лет, и возможность их использования с помощью Международной сети оперативной совместимости изображений (МСОСИ) внесли существенный вклад в достижение критической массы, которая позволяет применять углубленное изучение средневековых шрифтов.
Проект «Цифровая криминалистика исторических документов. Скрипт анализов в мире анонимных писателей» пытается создать цифровой инструмент, который должен быть основан на на сложных нейронных сетях, в котором уникальные характеристики определенного образца сценария будут сочетаться с аналогичными образцами, при этом используя оцифрованные коллекции рукописей, имеющиеся во всемирной сети.
В средневековье шрифты развивались с течением времени:
- от скорописных шрифтов древности до каролинских минускульных,
- готических шрифтов,
- гуманистических
- и ранних современных шрифтов.
Дисциплина изучения этих хронологических и региональных вариаций шрифта называется палеографией, и она требует глубокого и детального знания исторических особенностей шрифта и опыта.
Работу палеографов от остальных ученых, занимающихся письменностью, отличает высокий уровень мастерства, умение быстро сравнивать рукопись с современными объемами и умение локализовать почерк. Таким образом, на местах есть лишь несколько органов власти, занимающихся этим. Решающей причиной применения вычислительных подходов является не недоверие к мнению немногих экспертов, а тот факт, что в связи с массовой оцифровкой имеется большой объем материала, которому требуется научный подход и взгляд, а соответственно и специалисты в области палеографии. Экспериментирование с новыми подходами становится неизбежным.
Представленная статья посвящена задаче определения и поиска "наземной истины" для цифровой, компьютерной или искусственной палеографии. В ИИ наземные достоверные данные имеют большое значение для успешного обучения нейросетей, чтобы они затем могли помогать определять рукописи во много раз лучше.
Я собираюсь представить два возможных подхода к маркировке наборов данных для средневековой палеографии.
Первый подход
Связан с состоянием метаданных коллекции различных письменных исторических находок и вопросом о том, как же все таки справиться с неопределенностями. Теоретически метаданные цифровых объектов содержат ценный объем справочных данных, который конечно е пригодиться для дальнейшего изучения, однако информация о происхождении, датировке, месте написания, причине написания, авторстве написанного, классификации сценариев часто не является надежными. Надежность наземных достоверных данных является важным фактором палеографической значимости результатов вычислений.
Здесь же и возникают определенные вопросы, требующие ответа:
- Как мы можем преодолеть это возражение и выбрать подходящие данные по обучению из коллекций МСОСИ?
В моей будущей статье будет обсуждаться первичный обзор состояния фондов цифровых рукописей:
- Каково современное состояние метаданных в оцифрованных коллекциях?
- Какие стандарты имеются в наличии, а какие наиболее часто используемые?
- Как мы можем использовать предоставленные данные, независимо от их (цифрового) состояния и неопределенности, в наших исследовательских целях?
Второй подход
К установлению истины на местах заключается в привлечении экспертов и их знаний.
При этом так же возникает ряд вопросов, как и в первом подходе:
- Могу ли я воспользоваться услугами экспертов для создания обучающих данных, отражающих (дис-)сходство шрифта в средневековье, не увеличивая при этом черный ящик палеографии?
- Каким образом эксперты могут быть привлечены к отбору данных?
- И как убедить экспертов поделиться своими данными с проектом?
На все это, конечно же, необходимо ответить и со всем разобраться, чтобы после суметь привнести свой важный и ценный вклад в такую науку, как палеография.
А пока, на этом у меня все. Надеюсь, что скоро дополню своими мыслями свой канал, и вы сможете прочитать и подчерпнуть для себя что то интересное и, возможно, вдохновляющее. Спасибо за внимание! Подписывайтесь на канал, ставьте лайки, и оставляйте обязательно комментарии. До скорых встреч!