Привет, Хабр… ой, то есть Дзен! Сегодня хочу поделиться эпичной историей о том, как я решил написать свой конвертер PDF в Word на C#. Казалось бы: ну что там, закинул библиотеку, пролистал страницы – и готово. Спойлер: ничего готово не было, зато было много слёз, костылей и магии на ровном месте. Однажды мне прислали договор в PDF. А надо было его отредактировать. Сервисы онлайн — «загрузи и получи DOCX за 2 минуты» — выдали файл, в котором вместо таблиц была каша из символов, а шрифты напоминали послание из другого измерения. «Напишу сам!» — подумал я. И правильно сделал, потому что психушка ещё не закрылась на карантин. Итак, задача: берём PDF, отдаём DOCX с сохранением форматирования. Звучит как «взять Луну, покрасить в розовый и доставить на Землю без повреждений». Первая остановка — iTextSharp. Отличная библиотека, но её коммерческое использование стоит как iPhone 15 Pro Max. Вторая — PdfPig. Бесплатно, открыто, но с текстом работает так, будто читает его через запотевшее стекло.
Как я за неделю написал конвертер PDF в DOCX на C#, а потом понял, что проще было перепечатать руками
25 апреля25 апр
6
3 мин