Найти в Дзене
Bukva - всему golova

Цифровые подходы к палеографии и книжной истории.

Оглавление

Количественные методы и использование технологий в палеографии и истории книг отнюдь не новы.

Новое палеографическое общество использовало новейшие технологии печати для создания своих факсимильных альбомов в конце XIX века; Жан Маллон начал использовать фильм в 1930-х годах для иллюстрации развития письма; Гилиссен (1973) применял статистические меры к письменности задолго до широкого использования компьютеров; и даже Мабильон (1681) использовал передовые методы в области печати. Смит (1938) применял инновации в фотографии для восстановления поврежденного или неразборчивого шрифта в 1930-х годах, и база данных еврейских рукописей Малахи Бейт-Арие начала создаваться в 1960-х годах и остается одним из самых важных, вероятно, наиболее важных произведений количественной кодикологии. Этот список ни в коей мере не является полным, и он демонстрирует постоянную заинтересованность в поиске новых способов помочь нам понять книги и документы. Однако также очевидно, что недавние события кардинально изменили ситуацию. Прошло уже 10 лет с тех пор, как была опубликована, возможно, основополагающая статья в так называемой "цифровой" или "вычислительной" палеографии. С тех пор была проделана большая работа, в результате которой, возможно, возродилась вся область палеографии. Тем не менее, многое еще предстоит сделать, как в палеографии в узком смысле этого слова, так и, возможно, даже больше, в других областях истории книги и дипломатии. Что касается палеографии, то за последние 10 лет проделана большая работа по вопросам^ что было написано, кем, когда и где? Однако палеография имеет гораздо больше общего с этим. Как насчет вопросов техники, таких как поиск "колотых" штрихов, которые могут указывать на то, что писатель привык писать на воске, или изменений в каракулярном "равновесии", которые могут подсказать опыт, подделку или имитацию?

http://cdn.pixabay.com/photo/2019/08/06/22/48/artifical-intelligence-4389372_960_720.jpg
http://cdn.pixabay.com/photo/2019/08/06/22/48/artifical-intelligence-4389372_960_720.jpg

"ГЛОБАЛЬНЫЕ" ПОДХОДЫ

На сегодняшний день большая часть работы сосредоточена на нескольких "основных" системах письма. Поэтому одна из задач состоит в обеспечении того, чтобы в этой работе было представлено все разнообразие письменной и книжной продукции и чтобы мы не увековечивали существующие различия между культурой, политикой, историей и властью. Кроме того, растет интерес к тому, что можно назвать "сквозной" или даже "глобальной" палеографией. Палеография и история книги давно носят как многогранный, так и междисциплинарный характер, однако ученые, как правило, весьма специализируются на том, что они считают. Это не зря, учитывая высокий уровень подготовки, необходимо понимать системы письма, языки, методы книгоиздания, исторический и культурный контекст производства и так далее. Однако некоторые цифровые методы уже доказали свою эффективность в самых разных системах письма, и сравнительная кодикология существует уже некоторое время, как далеко эти новые методы могут применяться "сквозным образом"?

  • Каковы возможности и пределы?
  • Могут ли методы для, скажем, современного печатного иврита применяться и к монгольской вертикали письма?
  • Может ли западноевропейская кодикология переноситься, скажем, на малайзийские книги на пальмовых листах и наоборот?
  • Может ли существовать универсальная модель представления книг и почерка?
  • Зачем подпись и печать? Для украшения?
  • Являются ли современные и средневековые книги настолько разными, насколько это позволяет научная практика, или же одни и те же методы могут быть применены к обоим?
  • Могут ли палеографы учиться у типографов, и наоборот?

Это может оказаться несложным для таких проблем, как идентификация писателя, которые являются относительно невосприимчивыми к системе письма, хотя даже они могут включать предположения о механизмах письма, которые не являются универсальными, таких как форма пера или кисти, и способах ее хранения и манипулирования. Однако, как представляется, проблема здесь гораздо серьезнее для более семантических или онтологических подходов. Поиск универсальных элементов здесь может оказаться невозможным, но успех может лишь намекнуть на нечто очень фундаментальное о человечестве и о нашем развитии и использовании технологий.

"БОЛЬШИЕ ВОПРОСЫ" ЦИФРОВЫХ ГУМАНИТАРНЫХ НАУК.

Многие из "больших вопросов" цифровых гуманитарных наук очень актуальны для истории книги и дипломатии и уже обсуждались в этом контексте. Большой и, возможно, неясный вопрос - сможем ли мы найти пределы автоматизации сейчас и в обозримом будущем? Другой вопрос - "80/20": учитывая присущую книгоиздательству и дипломатии неразбериху и "человеческую" природу, представляется маловероятным, что цифровые методы дадут прекрасные результаты по многим нашим вопросам в ближайшее время. Поэтому стоит не только попытаться повысить точность результатов, но и спросить, что мы можем сделать сейчас с результатами, которые "достаточно близки". Одним из примеров может служить работа по нахождению фрагментов из Каирской Генизы: этот корпус из многих тысяч фрагментов слишком велик для людей, чтобы справляться в одиночку, но компьютер может предложить, где искать. Даже если только 1% из этих предложений верны, это все равно равнозначно примерно 3 500 новым частям, которые не были найдены ранее. В отличие от проверки писателем, где методы могут быть одинаковыми, но основной вопрос существенно отличается: не "найдите мне образцы, которые похожи", а скорее "У меня два образца письма, теперь скажите мне, были ли они написаны одним и тем же человеком". Разница заключается в том, как проверить результат. Эти два примера чем-то похожи, что достаточно просто для того, чтобы определить данные метрики на предмет сходства. Однако совсем не ясно, как проверить, что сходство, выявленное компьютером, обязательно означает производство одним и тем же автором, особенно в тех случаях, когда у нас нет достоверной информации, на основании которой можно было бы проверить наши методы. Если предположить, что у нас нет абсолютно надежного алгоритма, любой результат будет представлен в виде вероятности, и тогда окончательное решение будет возложено на эксперта-человека. Однако если бы эксперты могли проверить это сами, то компьютер им бы не понадобился. На каком основании может быть принято такое решение?

Эта дискуссия приводит к вопросам о доказательствах и коммуникации. Как мы можем решить проблему "черного ящика" и обеспечить возможность проверки результатов? Как мы представляем результаты вычислений таким образом, чтобы аудитория могла их понять и использовать? Имеет ли это значение: в какой степени все специальные стипендии должны приниматься, по крайней мере частично, на доверительной основе? Удивительно, но актуальным здесь является вопрос, поднятый Деролезом более 10 лет назад:

"Как можно сделать так, чтобы описание почерка было понятным и убедительным как для читателя, так и для автора?"

Его вопрос был не "как я могу знать", а "как я могу убедить вас", и это различие, похоже, часто забывается.

Эти вопросы, в свою очередь, указывают на важность визуализации и дизайна интерфейсов - областей, которым, как представляется, уделялось относительно мало внимания при работе с книгами и рукописями. Является ли кажущийся повсеместным зритель манускриптов действительно наиболее подходящим способом представления этого материала? Являются ли изображения действительно наилучшим способом "воспроизведения" оригинала? В какой степени другие подходы, такие как структурированные данные, могут или должны также рассматриваться в качестве репрезентаций таким образом? Как мы можем сообщить о невизуальных аспектах наших материалов? Как можно улучшить поисковые запросы и результаты в области с сильно варьирующейся терминологией, с большой неопределенностью в диапазоне дат и месте, и где сами объекты со временем претерпели значительные изменения?

Наконец, этот диахронический аспект является еще одним вызовом, которому, похоже, уделялось относительно мало внимания. Стэнсбери уже отметил, что цифровые методы имеют тенденцию фокусироваться на классификации, а не на развитии или эволюции, но его работа встретила относительно мало внимания. Была проделана некоторая работа по датировке рукописей, основанная на предположении, что изменения в сценарии развиваются с течением времени, но цель здесь все еще заключается в определении дат, а не в исследовании эволюции как таковой. Как мы можем использовать компьютеры для представления и исследования диахронических вариаций как самоцель? Как мы можем даже однозначно ссылаться на одну рукопись, когда она может быть составной, может быть восстановлена, страницы переставлены, разделы перенесены между томами и т.д.? Места также меняются: современный Лондон в некотором смысле отличается, например, от Лондона одиннадцатого века. Как все это повлияет на связанные данные и семантическую паутину? Твой Лондон на самом деле такой же, как и мой? А если нет, то каковы будут последствия?

Вопросы, поднятые здесь, не являются новыми, и действительно, многие из них уже рассматривались ранее, будь то в Digital Humanities или задолго до того, как этот ярлык был даже воображен. Тем не менее проблемы сохраняются. Ставки высоки, поскольку эффективные ответы на эти вопросы будут иметь весьма широкие последствия не только для изучения книг и документов, но и гораздо шире. Многое произошло со времени выхода основополагающей статьи Сьюлы, но многое еще предстоит сделать.

Наука
7 млн интересуются