Найти в Дзене
Bukva - всему golova

В поисках наземной правды для искусственной палеограммы...

Крупномасштабные проекты по оцифровке, осуществленные за последние двадцать лет, и возможность их использования с помощью Международной сети оперативной совместимости изображений (МСОСИ) внесли существенный вклад в достижение критической массы, которая позволяет применять углубленное изучение средневековых шрифтов. Проект «Цифровая криминалистика исторических документов. Скрипт анализов в мире анонимных писателей» пытается создать цифровой инструмент, который должен быть основан на на сложных нейронных сетях, в котором уникальные характеристики определенного образца сценария будут сочетаться с аналогичными образцами, при этом используя оцифрованные коллекции рукописей, имеющиеся во всемирной сети. В средневековье шрифты развивались с течением времени: Дисциплина изучения этих хронологических и региональных вариаций шрифта называется палеографией, и она требует глубокого и детального знания исторических особенностей шрифта и опыта. Работу палеографов от остальных ученых, занимающихся
Оглавление

Крупномасштабные проекты по оцифровке, осуществленные за последние двадцать лет, и возможность их использования с помощью Международной сети оперативной совместимости изображений (МСОСИ) внесли существенный вклад в достижение критической массы, которая позволяет применять углубленное изучение средневековых шрифтов.

Проект «Цифровая криминалистика исторических документов. Скрипт анализов в мире анонимных писателей» пытается создать цифровой инструмент, который должен быть основан на на сложных нейронных сетях, в котором уникальные характеристики определенного образца сценария будут сочетаться с аналогичными образцами, при этом используя оцифрованные коллекции рукописей, имеющиеся во всемирной сети.

https://cdn.pixabay.com/photo/2014/11/26/23/43/manuscript-547042_960_720.jpg
https://cdn.pixabay.com/photo/2014/11/26/23/43/manuscript-547042_960_720.jpg

В средневековье шрифты развивались с течением времени:

  • от скорописных шрифтов древности до каролинских минускульных,
  • готических шрифтов,
  • гуманистических
  • и ранних современных шрифтов.

Дисциплина изучения этих хронологических и региональных вариаций шрифта называется палеографией, и она требует глубокого и детального знания исторических особенностей шрифта и опыта.

Работу палеографов от остальных ученых, занимающихся письменностью, отличает высокий уровень мастерства, умение быстро сравнивать рукопись с современными объемами и умение локализовать почерк. Таким образом, на местах есть лишь несколько органов власти, занимающихся этим. Решающей причиной применения вычислительных подходов является не недоверие к мнению немногих экспертов, а тот факт, что в связи с массовой оцифровкой имеется большой объем материала, которому требуется научный подход и взгляд, а соответственно и специалисты в области палеографии. Экспериментирование с новыми подходами становится неизбежным.

Представленная статья посвящена задаче определения и поиска "наземной истины" для цифровой, компьютерной или искусственной палеографии. В ИИ наземные достоверные данные имеют большое значение для успешного обучения нейросетей, чтобы они затем могли помогать определять рукописи во много раз лучше.

https://cdn.pixabay.com/photo/2016/10/13/20/25/scrapbooking-1738737_960_720.jpg
https://cdn.pixabay.com/photo/2016/10/13/20/25/scrapbooking-1738737_960_720.jpg

Я собираюсь представить два возможных подхода к маркировке наборов данных для средневековой палеографии.

Первый подход

Связан с состоянием метаданных коллекции различных письменных исторических находок и вопросом о том, как же все таки справиться с неопределенностями. Теоретически метаданные цифровых объектов содержат ценный объем справочных данных, который конечно е пригодиться для дальнейшего изучения, однако информация о происхождении, датировке, месте написания, причине написания, авторстве написанного, классификации сценариев часто не является надежными. Надежность наземных достоверных данных является важным фактором палеографической значимости результатов вычислений.

Здесь же и возникают определенные вопросы, требующие ответа:

  • Как мы можем преодолеть это возражение и выбрать подходящие данные по обучению из коллекций МСОСИ?

В моей будущей статье будет обсуждаться первичный обзор состояния фондов цифровых рукописей:

  • Каково современное состояние метаданных в оцифрованных коллекциях?
  • Какие стандарты имеются в наличии, а какие наиболее часто используемые?
  • Как мы можем использовать предоставленные данные, независимо от их (цифрового) состояния и неопределенности, в наших исследовательских целях?
https://cdn.pixabay.com/photo/2014/11/26/23/43/manuscript-547041_960_720.jpg
https://cdn.pixabay.com/photo/2014/11/26/23/43/manuscript-547041_960_720.jpg

Второй подход

К установлению истины на местах заключается в привлечении экспертов и их знаний.

При этом так же возникает ряд вопросов, как и в первом подходе:

  • Могу ли я воспользоваться услугами экспертов для создания обучающих данных, отражающих (дис-)сходство шрифта в средневековье, не увеличивая при этом черный ящик палеографии?
  • Каким образом эксперты могут быть привлечены к отбору данных?
  • И как убедить экспертов поделиться своими данными с проектом?

На все это, конечно же, необходимо ответить и со всем разобраться, чтобы после суметь привнести свой важный и ценный вклад в такую науку, как палеография.

А пока, на этом у меня все. Надеюсь, что скоро дополню своими мыслями свой канал, и вы сможете прочитать и подчерпнуть для себя что то интересное и, возможно, вдохновляющее. Спасибо за внимание! Подписывайтесь на канал, ставьте лайки, и оставляйте обязательно комментарии. До скорых встреч!