Отчасти в ответ на восприятие палеографии как "догмы" ученые всего мира разрабатывают и применяют новые технологии и компьютерные методы палеографических исследований. Этот подход, часто называемый цифровой палеографией и применяемый в более широкой области цифровых гуманитарных наук, направлен на совершенствование традиционных методов. Его цель заключается в том, чтобы помочь эффективно решать палеографические проблемы и/или предоставлять больше количественных данных для палеографических аргументов и, как следствие, способствовать лучшему пониманию нашего культурного наследия.
На сегодняшний день существует множество проектов, связанных с разработкой таких методологий. Они включают широкий спектр научных междисциплинарных подходов, таких как
- криминалистический анализ документов
- оптическое распознавание символов
- количественное определение "отпечатков пальцев"
- метрический анализ, количественные методы
- передовые методы анализа рукописей
- такие как ДНК и методы визуализации
- такие как многоспектральная оцифровка
- системы классификации
- базы данных.
Хотя некоторые достижения уже достигнуты, многое еще предстоит исследовать. Например, такие, казалось бы, фундаментальные вещи, как автоматическое распознавание букв в рукописных текстах, оказались чрезвычайно сложными, в основном из-за очень большого разнообразия стилей письма, сохранившихся рукописей зачастую низкого качества, отсутствия стандартных орфографий, что затрудняет прогнозирование, и так далее. Такие вычислительные методы, как цифровая палеография, были предметом исследований в последние несколько лет, но большинство из них были теоретическими или применялись только в небольших случаях, отчасти из-за очень высокой трудоемкости. На сегодняшний день заявки были также сосредоточены почти исключительно на вопросе письменности, игнорируя другие аспекты палеографии. Более того, они склонны рассматривать формы писем как объекты вне рукописи или документального контекста, в котором они были написаны, но палеографы давно поняли, что почерк во многом зависит от контекста, в котором он создается. Гораздо более важно то, что эти методы делают компьютер "черным ящиком", который получает изображения рукописей с одного конца и возвращает классификацию почерка с другого.
Однако, как правило, они в значительной степени зависят от очень тонких и часто неустановленных предположений о базовых данных, но "традиционным" палеографам трудно или невозможно их оценить, поэтому обычно ученые не могут оценить "черный ящик" и поэтому справедливо не желают принимать его результаты. Основная проблема для вычислительных подходов заключается в предоставлении системы, которая представляет палеографические данные быстро и легко таким образом, чтобы ученые могли их понять, оценить и доверять им.
Успех и воздействие исследований и инициатив в области вычислительных методов показали настоятельную необходимость сочетания научных вычислений и палеографии в целях дальнейшего изучения междисциплинарных методов и научных областей. Очевидно также, что ни одно учреждение, не говоря уже об одном ученом, не способно проводить всеобъемлющие исследования, охватывающие все эти методы (и, возможно, даже больше). Таким образом, необходимы совместные усилия, предпочтительно на международном уровне. Как стало очевидным в ходе научных встреч по этой теме, палеографы и ученые в области информатики склонны мыслить по-разному и, как правило, не согласны даже с самыми основными понятиями, такими как "доказательства" или "значение".
Успешное сотрудничество между исследователями в области гуманитарных наук и информатики не так просто, как "определить вычислительную проблему и найти алгоритм ее решения". Вкладываемые ресурсы часто определяются в общих чертах, и итоговый результат должен быть больше, чем просто оценка по какой-то абстрактной шкале. Поэтому крайне важно определить общий уровень, на котором может быть установлена эффективная коммуникация.
Сбор данных
В последние годы репозитории всего Европейского Союза проводят широкомасштабные работы по оцифровке, в результате чего в фондах хранятся сотни тысяч или даже миллионы цифровых изображений рукописных книг и материалов. Цифровая палеография основывается на существовании этих цифровых суррогатов рукописей. Более того, некоторые из наиболее интересных перспектив этой области могут быть продемонстрированы только на достаточно больших коллекциях. Однако для того чтобы это стало возможным, необходимо изменить как политику, так и практику приобретения. В частности, с точки зрения пользователя компьютера, получение цифровых копий требует соответствующих процедур и стандартизации.
Инструменты, библиотеки и ресурсы
Общей целью инструментов, библиотек программного обеспечения и ресурсов, разрабатываемых в контексте палеографии, является обеспечение поддержки в установлении взаимосвязи между текстом как формой и текстом как смыслом, что в самом общем смысле также может рассматриваться как одна из целей палеографии как субъекта. Отправной точкой является твердое признание и определение областей специализации участников этого процесса, а именно людей и компьютерных средств. С одной стороны, компьютеры превосходно справляются с "большими данными", а именно с задачами, начиная от хранения больших объемов данных в памяти до выполнения трудоемких вычислений, таких как выявление мелких различий и редких случаев в больших массивах данных.
С другой стороны, люди (включая палеографов) преуспевают в работе с неоднозначными, сложными или широкими данными в том смысле, что наборы данных состоят из разнородных фрагментов данных. Люди также преуспевают в осмыслении данных, в выражении их гештальта в том смысле, что все данные выражают больше, чем сумма их частей. Принимая во внимание эти различные наборы навыков, высшим приоритетом при разработке вычислительных ресурсов для палеографии является производство полуавтоматических и интерактивных инструментов, где палеографы могут постоянно вмешиваться, информировать, корректировать, понимать, использовать и повторно использовать результаты и процессы, полученные с помощью этих инструментов.
Только таким образом палеография сможет оптимально использовать соответствующие сильные стороны человеческих и вычислительных ресурсов. В идеале, разработка таких полуавтоматических и интерактивных инструментов будет стимулировать создание взаимовыгодного непрерывного цикла обратной связи между человеком и машиной, в котором люди будут вовлечены на всех уровнях мышления, машины смогут учиться на человеческом опыте, а палеографы и другие будут учиться и создавать новые знания более эффективно с использованием машин. Признаю, что для проведения исследований необходима критическая масса данных, и что упреждающее восприятие этих данных исследователями является одним из основных факторов в выдвижении новых гипотез.
С другой стороны, эту критическую массу данных можно получить только с помощью удобных и эргономичных инструментов. Поэтому при разработке инструментов для цифровой палеографии необходимы фокус-группы, тестирование пользователей и надлежащее проектирование пользовательского интерфейса в консультации с гуманитарными учеными как конечными пользователями.
Отсюда вытекает еще одно требование - признание разработки инструментов в качестве академического исследования, призванного стимулировать публикацию работ ученых в области цифровых гуманитарных наук и сделать их доступными для более широкой аудитории.