Текст переводится из набора байтов в символы, которые мы видим с помощью кодировок. Узнать, какую кодировку использует текст, можно с помощью chardet. Установка: pip install chardet Можно запустить приложение из терминала: chardetect somefile или импортировать его в python: from chardet import detect.