Конвертирование PDF в TXT
Как я за неделю написал конвертер PDF в DOCX на C#, а потом понял, что проще было перепечатать руками
Привет, Хабр… ой, то есть Дзен! Сегодня хочу поделиться эпичной историей о том, как я решил написать свой конвертер PDF в Word на C#. Казалось бы: ну что там, закинул библиотеку, пролистал страницы – и готово. Спойлер: ничего готово не было, зато было много слёз, костылей и магии на ровном месте. Однажды мне прислали договор в PDF. А надо было его отредактировать. Сервисы онлайн — «загрузи и получи DOCX за 2 минуты» — выдали файл, в котором вместо таблиц была каша из символов, а шрифты напоминали послание из другого измерения...
Как я чуть не поседел, создавая конвертер PDF в DOC на C# (и вы сможете!)
Знаете, что объединяет разработчиков и алхимиков? И те, и другие пытаются превратить один материал в другой, рискуя взорвать лабораторию. Конвертация PDF в DOC — это та самая задача, где вместо золота часто получается что-то, напоминающее философский камень с ошибками форматирования. Но мы-то с вами не ищем лёгких путей! 😈 Сегодня я расскажу, как на C# можно скрестить ужа с ежом и получить работающий конвертер, который спасёт ваши нервы и, возможно, даже сделает пару рабочих задач. Будет код, немного магии и пара забавных граблей, на которые я сам наступил...