Найти в Дзене
serovodovorot

Почему вместо букв — кракозябры? Простое объяснение проблем с кодировкой

Вы когда-нибудь открывали файл, а вместо привычного текста видели вот такое: Ãòè ïðèâåò!
Или Word вдруг выдавал загадочное окно: "Выберите кодировку для правильного отображения текста"? ​ Если да — вы столкнулись с проблемой кодировки. Звучит как что-то из мира программистов, но на самом деле всё куда проще, чем кажется. Давайте разберёмся — простыми словами. Компьютер — это, по сути, коробка, в которой бегают электроны. У него только два состояния:
🔘 Нет сигнала — это 0
🔘 Есть сигнал — это 1 Вот и всё. Это называется двоичная система — язык, на котором "разговаривают" все компьютеры мира. Одна такая единичка или нолик называется бит. Но чтобы закодировать хотя бы одну букву, одного бита недостаточно. Поэтому компьютеры объединяют их в группы по 8 бит — это называется байт. 1 байт может хранить 256 разных комбинаций ноликов и единичек (от 00000000 до 11111111).
А значит, 256 возможных символов: буквы, цифры, знаки препинания, пробелы и даже "☺". Теперь внимание! У компьютера есть
Оглавление

Вы когда-нибудь открывали файл, а вместо привычного текста видели вот такое: Ãòè ïðèâåò!

Или Word вдруг выдавал загадочное окно:
"Выберите кодировку для правильного отображения текста"?

​

Если да — вы столкнулись с проблемой кодировки. Звучит как что-то из мира программистов, но на самом деле всё куда проще, чем кажется. Давайте разберёмся — простыми словами.

Как компьютер "видит" буквы

Компьютер — это, по сути, коробка, в которой бегают электроны. У него только два состояния:

🔘
Нет сигнала — это 0

🔘
Есть сигнал — это 1

Вот и всё. Это называется двоичная система — язык, на котором "разговаривают" все компьютеры мира.

Одна такая единичка или нолик называется бит. Но чтобы закодировать хотя бы одну букву, одного бита недостаточно. Поэтому компьютеры объединяют их в группы по 8 бит — это называется байт.

Пример:

1 байт может хранить 256 разных комбинаций ноликов и единичек (от 00000000 до 11111111).

А значит, 256 возможных
символов: буквы, цифры, знаки препинания, пробелы и даже "☺".

Таблицы символов — кто что значит

Теперь внимание! У компьютера есть таблица, в которой написано:

🔹 01000001 = A

🔹 01000010 = B

🔹 00100000 = пробел

и так далее…

Такая таблица называется кодировкой.

Самая первая и простая — ASCII. Её придумали в США, и она подходит только для английских букв, цифр и базовых знаков. Ни русских букв, ни иероглифов в ней нет.

Чтобы добавить в компьютер другие языки, люди создали новые кодировки:

  • KOI8-R — для русского языка в СССР
  • Windows-1251 — русская кодировка в Windows
  • UTF-8 и UTF-16 — международные стандарты, способные отобразить любой язык мира

А теперь угадайте…

Что будет, если текст был сохранён в одной кодировке (например, Windows-1251), а вы открываете его в другой (например, UTF-8)?

Правильно: вместо слова "Привет" вы увидите "Ïðèâåò", и будете в лёгком шоке.

Это как если бы вы взяли японскую газету и попытались её прочитать, считая, что это английский текст.

Что делать, если на экране «кракозябры»?

Вот несколько простых советов:

  1. Попробуйте открыть файл другой программой. Например, если Excel не справился — откройте в Notepad++ или LibreOffice.
  2. При открытии выберите нужную кодировку вручную. Например, в Word можно при открытии указать "Windows-1251", если знаете, что файл на русском.
  3. Сохраните файл в универсальной кодировке. Лучше всего использовать UTF-8 — она поддерживается практически везде.

Пример из жизни

Вы скачали таблицу с сайта госуслуг или какой-нибудь базы данных. Открываете — а там абракадабра.

Скорее всего, файл был сохранён в Windows-1251, а Excel решил, что это UTF-8. Всё, поплыли буковки.

В таком случае:

  • Откройте файл в Блокноте
  • Сохраните его через "Сохранить как..." и выберите кодировку UTF-8
  • Потом откройте в Excel — и вуаля, текст читается!

Заключение

Проблема с кодировками — это как языковой барьер между программами. Но если понимать, в чём суть — решить её очень просто.

На моём бесплатном курсе по Просто Excel я подробно рассказываю:

  • как работать с текстами и таблицами,
  • что делать, если Excel "не понимает" файл,
  • как сохранить данные, чтобы всё открывалось корректно.

Переходите по ссылке ниже — и начнём разбираться в Excel без страха и паники 👇

Просто Excel