Узнаём кодировку текста Наверное, у всех были ситуации, когда вы открыли файл или получили ответ от сервера, а внутри оказывается набор странных символов в непонятной кодировке. Пакет chardet как раз был создан для работы с кодировками...
Всем привет, поговорим о кодировках. Кодировка - это описание символов числами (кодами), и будь она одна, не было бы и проблемы, какая разница, как там кодируются символы на экране. Но кодировок много. Есть предпосылки к тому, чтобы осталась одна, но пока приходится учитывать существование по крайней мере двух. И помнить про прочие. Оглавление рубрики Кодировки Если речь про английский язык, то есть ASCII: семибитная кодировка, описывающая 128 символов. Туда входит латиница без диакритики, цифры и прочие символы стандартной клавиатуры и кое-какие управляющие символы...