В палеографии ученые изучают историю почерка, важнейший аспект истории книги и рукописного дела.
Это знания по-прежнему очень трудно выразить открыто, чтобы поделиться ими с другими. Поэтому палеографы проявляют все больший интерес к методам цифрового моделирования в целях содействия созданию и распространению палеографические знания.
Важнейшей задачей палеографии является классификация типы скриптов,
особенно сейчас, когда электронные библиотеки собирают репродукции средневековых рукописей, часто со скудными метаданными.
Способность распознать тип сценария таких исторических артефактов имеет решающее значение на сегодняшний день, локализовать или (полу)автоматически транскрибировать их.
Средневековая классификация шрифтов была в центре внимания недавний конкурс CLaMM (Классификация латиноамериканских средневековых рукописей).
Воспроизведение выделенных страниц, из латинских рукописей, которые были классифицированы как 12 классов шрифтов, включая уставные, каролиновые, текстуалистические и гуманистические, но также и более сложные для разграничения классы, такие как курсива или (полу)гибрида.
Прорывы в современном искусстве классификации изображений, нейронные сети,
применяемые в компьютерном зрении, обычно являются сложными: они скользят маленькими "фильтрами" (детекторами свойств) на всех изображениях, чтобы сделать сеть надежной и компактной.
Сети используют множество "уровней" таких извещателей, где выходной сигнал одного извещателя всегда поступает в следующий. Эти нейронные сети лежат в основе, например, современных алгоритмов проверки личности на сайтах социальных сетей, таких как Facebook.
Нейронные сети состоят из миллионов параметров,
которые необходимо оптимизировать. Для этого имеющиеся данные тренировки разбиваются на набор тренировочных изображений.
Меньший набор изображений для разработки (соответственно
ок. 1 800 и 200 изображений), используется для оптимизации параметров сети во время обучения, последняя используется для мониторинга исполнения сети.
Используя набор средств разработки, мы можем остановить оптимизацию сети, если ее прогнозы по развитию, данные больше не повышаются в качестве. Только при этом алгоритм оценивается на реальных тестовых изображениях. Далее, мы выбираем случайный квадрат.
Кадрирование или фрагменты изображения
(150x150 пикселей) и обучать алгоритмам работы с партиями этих культур. Этот подход является грубым, но в то же время новаторским, поскольку мы не прилагаем никаких усилий для того, чтобы извлечь более конкретные области, представляющие интерес.
Чтобы избежать переустановки, мы также применили аугментацию:
каждая тренировочная культура будет "искажена" случайным изменением уровня масштабирования, севооборота и перевода. Введение такого шума на входе является обычным делом.
Ручная классификация изображений CLaMMM вручную основывалась на морфологических различиях и аллограммах, как они определены в стандартных работах на латинской графике.
Полное изображение отнесенных к классу с наибольшей средней вероятностью. Ручная классификация изображений CLaMMM вручную основывался на морфологических различиях и аллограммах, как они определены в стандартных работах на латинской графике.
Например, часто ошибочно принимают за южный или полутекстуальный вариант). Матрица путаницы для данных по развитию. Используя принцип градиентного подъема, мы начинаем со случайного... шумовое изображение и передать его в один из фильтров на последнем из них изогнутый слой: в течение 3 000 итераций мы изменяем изображение.
Таким образом,
чтобы оно максимально активизировало его определённый фильтр. Например, изображение отчетливо фиксирует наличие петель в восходящих потоках.
Эти визуализации непосредственно касаются следующих вопросов
выпуск компьютерного "черного ящика" в цифровых гуманитарных науках и, в особенности, цифровой палеографии.
Искусственно сгенерированные изображения, которые максимально активизируют фильтры в конечном свернутом слое.