Текст переводится из набора байтов в символы, которые мы видим с помощью кодировок. Узнать, какую кодировку использует текст, можно с помощью chardet.
Установка: pip install chardet
Можно запустить приложение из терминала: chardetect somefile или импортировать его в python: from chardet import detect.