1 год назад
Узнаём кодировку текста
Узнаём кодировку текста Наверное, у всех были ситуации, когда вы открыли файл или получили ответ от сервера, а внутри оказывается набор странных символов в непонятной кодировке. Пакет chardet как раз был создан для работы с кодировками...
125 читали · 1 год назад
Как распознать текст пдф
PDF-формат является одним из наиболее распространенных и удобных для обмена документами. Однако, если вам нужно работать или редактировать текст внутри PDF-файла, вы сталкиваетесь с проблемой его нераспознавания компьютером. В этой статье мы рассмотрим простой способ, как распознать текст в PDF-документе и обработать его на ПК или мобильном устройстве. Перед тем, как начать, давайте разберемся в терминологии. Распознавание текста в PDF процесс преобразования изображения текста в электронный формат, который компьютер может прочитать и обрабатывать...