Всем привет!
Меня зовут Артем и я придумал себе очень нестандартное хобби — я назвал это "цифровая реставрация книг".
Я нахожу бумажные книги, которые мне кажутся интересными и достойными сохранения. И создаю их идеальную цифровую копию... Но обо всем по порядку.
Меня всегда расстраивало, особенно когда я учился в университете, что очень много книг, выложенных в интернете, имеют крайне печальное состояние. Обычно это файл в формате DPF или DJVU, внутри которого находится просто набор криво-косо отсканированных страниц.
Читать такие книги — боль, я не знаю людей, которые по собственной воле читали бы такие издания. Когда тебе необходимо получить зачет или подготовиться к уроку — у тебя просто нет выбора. Но многие книги действительно очень интересные и их можно было бы прочитать просто так, для себя. Но в таком виде их читать никто не будет.
Как же я решил эту проблему?
Я покупаю, обычно в букинистических магазинах, книгу. И начинаю заново, с нуля верстать эту книгу на компьютере. Что значит "верстать"? Давайте по порядку:
1. Программа для верстки.
В современном книгопечатании любую книгу перед изданием нужно сверстать. Для этого используются специализированные программы — просто в Word это сделать нельзя. Потому что Word не позволяет точно контролировать расположение всех элементов и текстовых блоков на странице. Вы сами наверняка сталкивались с тем, что можно на одной странице чуть-чуть поправить таблицу и получить съехавшее форматирование по всему оставшемуся документу. Это называется "Эффект бабочки от Microsoft".
В специализированных программах для верстки создается документ с очень точными размерами страницы в миллиметрах, и на каждую страницу добавляется набор текстовых блоков и изображений. Каждый блок имеет очень точные размеры и положение на странице. Даже, если текст внутри блока не помещается — это не повлияет ни на что, просто текст не будет отображаться.
Как видите, на примере мы имеем целых 9 блоков, а на самом деле 10, потому что черная черта, отделяющая основной текст от сноски (не видно на фото) — это тоже отдельный элемент. И каждый из этих блоков вручную с точностью до миллиметра (а то и полумиллиметра) позиционируется на странице.
Так производится верстка. Как вы понимаете, после расстановки блоков их уже ничто не может сдвинуть с места — ни добавление новых страниц, ни изменение текста или даже набора блоков на предыдущих страницах.
2. Пустой проект
Итак, я получаю в руки книгу и первым делом очень точно измеряю размеры страницы, а также отступы от краев (часто, особенно в старых книгах эти отступы плавают. Тогда я выставляю какое-то среднее значение, чтобы было от чего отталкиваться). Создаю новый проект и задаю для него полученные реальные, физические размеры книги.
3. Шрифты
Следующий, один из самых сложных шагов — это разобраться со шрифтами. Так как я делаю именно копию реальной книги, для меня очень важно, чтобы в цифровом издании использовались максимально похожие или те же самые шрифты и символы, что в оригинале. На поиск нужного шрифта может уйти несколько дней.
В этом процессе я, многократно увеличивая отсканированный текст, изучаю все мельчайшие детали начертания букв и сравниваю это с тем, что удается найти в интернете.
Помимо достоверности, которой я стараюсь добиться в своей работе, неправильно подобраный шрифт будет иметь совершенно другие параметры — разную ширину и высоту букв, разные расстояния между буквами и так далее. И как результат, текст набранный другим шрифтом может просто не поместиться в нужные мне границы текстового блока (которые я с линейкой вымеряю из книги). Из-за разницы в начертании символов текст, который в книге помещается в одну строку — в программе уже никак в нее не влезет. И тогда все пропало.
Еще одна проблема в том, что в одной книге используется не один шрифт. Например, в обычной советской книжке, о которой будет моя следующая статья (и страница из которой приведена выше), содержится аж ПЯТЬ разных шрифтов. И каждый индивидуально нужно было сначала найти и увидеть в книге, а потом найти его копию в интернете.
Ну и найденные шрифты с облегчением на сердце (и в моем кошельке) обычно покупаются, потому что авторам шрифтов тоже хочется кушать :)
4. Обложка и иллюстрации
Что за книга без иллюстраций! И самая главная иллюстрация — это обложка. Часто обложку достаточно лишь изрядно "отфотошопить", но иногда ее приходится полностью перерисовывать с нуля. Потому что, опять же, моя цель создать изображение, которое максимально приближено к тому исходнику, с которого печаталась обложка. То есть различные блики, выцветшие участки, не говоря уже про откровенные царапины, грязь и замятые углы никак не могут попасть в мою цифровую копию.
Здесь все зависит от качества книги, особенностей печати и сложности воспроизведения. Например, обложку к следующей книге мне пришлось полностью перерисовывать вручную. Но об этом будет отдельная статья.
То же самое касается абсолютно всех иллюстраций внутри книги — иногда их можно отреставрировать в фотошопе, иногда их приходится перерисовывать. Конечно же, сложные многоцветные иллюстрации и тем более фотографии перерисовать невозможно. Одним словом, задача очень творческая, кропотливая и требующая индивидуального подхода к каждой ситуации.
5. Верстка книги
А затем начинается кропотливая работа. Каждая страничка тщательно вымеряется линейкой, вымеряются все отступы, размеры букв, межстрочных интервалов и многое другое — одним словом происходит калибровка. Чтобы точно настроить параметры текстовых блоков.
То есть каждый текстовый блок, его размер и расположение (равно как и расположение иллюстрации) с изображения страницы выше выставляются в строгом соответствии с реальными размерами в книге.
Особенно сложно работать с первыми и последними страницами. Вот на примере ниже нужно понимать, что каждая пунктирная линия — это выставленный размер с точностью до миллиметра, а по этим пунктирам уже располагаются блоки содержимого.
6. Распознавание текста и вычитка
Как же, собственно, текст с листа попадает в мою книгу? Никакой магии — я сканирую страницу, программой распознаю на ней текст. Этот текст сохраняется в текстовый документ, и я внимательно его вычитываю — исправляя все ошибки распознавания, а иногда даже опечатки самой книги. Затем этот текст копируется и вставляется в пустые блоки на размеченной странице.
Конечно же, если на странице были иллюстрации — они тоже проходят реставрацию и после отправляются на страницу будущей книги.
После этого я вывожу книгу в PDF формат и моя жена снова тщательно, очень внимательно читает книгу и выписывает все найденные ошибки. И поверьте, этих ошибок не мало! Хотя я стараюсь максимально внимательно все вычитывать с первого раза.
Но самое интересное, что когда уже вся книга готова, и я еще раз просто пробегаюсь по ней глазами, расставляя цифровое оглавление для будущего PDF файла,я нахожу еще с десяток разных ошибок и опечаток!
Философский вопрос, который не перестает меня терзать — возможно ли сделать книгу вообще без ошибок и огрехов? Пока что все книги, которые мне попадались, имели опечатки внутри.
Вот так
Вот таким странным занятием я занимаю себя все свободное от работы время. Нужны ли кому-нибудь настолько точные цифровые копии книг? Я не знаю, но хочется верить, что нужны. Лично мне очень приятно видеть то, как эта книга выглядела изначально, на самом деле. Я специально стараюсь не сильно вмешиваться и исправлять особенности форматирования и расположения блоков, чтобы запечатлеть в своей работе некий исторический оттиск. Открыв и читая такую книгу, вы можете видеть ее именно так, как она много лет и даже десятилетий назад версталась, создавалась и была напечатана.
До встречи в новых статьях!