Узнаём кодировку текста Наверное, у всех были ситуации, когда вы открыли файл или получили ответ от сервера, а внутри оказывается набор странных символов в непонятной кодировке. Пакет chardet как раз был создан для работы с кодировками...
1 год назад
11 подписчиков
Аннотация. В данном тексте будет рассмотрена тема кодировки текста, которая является необходимой для проверки на уникальность в антиплагиате, а также будет описано, как использовать эту кодировку для успешной проверки работы. Перед тем, как рассказывать о текстовой кодировке для программы антиплагиата, стоит рассмотреть различные способы повышения уникальности текста. Их существует больше, чем обычно предполагается, и они могут быть разделены на три основные группы. Однако, в данном тексте мы сконцентрируемся именно на текстовой кодировке...
11 месяцев назад
9,4K подписчиков
Текст переводится из набора байтов в символы, которые мы видим с помощью кодировок. Узнать, какую кодировку использует текст, можно с помощью chardet. Установка: pip install chardet Можно запустить приложение...
2 года назад
128 подписчиков
Я очень часто говорю и пишу о кодировке, Однако, не все люди знают, что это такое. Вроде бы понимают, что кириллица - это "windows-1251" ("cp1251"), а Unicode - это "utf-8". А что такое кодировка, так и не понимают...
5 лет назад