Найти в Дзене
Джино.Журнал

Кракозябры на сайтах: откуда они берутся?

Нечитаемые и незнакомые символы вместо букв — знакомая ситуация? С этим сталкиваются и посетители сайтов, и их админы. Расскажем простыми словами, что это такое и как с этим быть. Почему буквы заменяются кракозябрами? Так устроен интернет, что информация в нём передаётся не буквами и словами, а битами и байтами. Чтобы превратить биты в знакомые нам символы и наоборот, нужны механизмы кодировки и декодирования. Таких механизмов за всё время существования Всемирной паутины появилось целое множество, к тому же у кодировки кириллицы есть свои особенности, в отличие от латиницы. Из-за всего этого мы иногда и не видим в интернете родную речь там, где она должна быть. Зачем нужны разные кодировки символов? Сейчас в мировом интернет-пространстве доминирует кодировка UTF-8 стандарта Unicode, который в своё время окончательно решил вопрос с кодировкой письменности всех распространённых мировых языков. Однако до этого были созданы другие наборы символов, которые подходили какому-то конкретному яз

Нечитаемые и незнакомые символы вместо букв — знакомая ситуация? С этим сталкиваются и посетители сайтов, и их админы. Расскажем простыми словами, что это такое и как с этим быть.

Почему буквы заменяются кракозябрами?

Так устроен интернет, что информация в нём передаётся не буквами и словами, а битами и байтами. Чтобы превратить биты в знакомые нам символы и наоборот, нужны механизмы кодировки и декодирования.

Таких механизмов за всё время существования Всемирной паутины появилось целое множество, к тому же у кодировки кириллицы есть свои особенности, в отличие от латиницы. Из-за всего этого мы иногда и не видим в интернете родную речь там, где она должна быть.

Зачем нужны разные кодировки символов?

Сейчас в мировом интернет-пространстве доминирует кодировка UTF-8 стандарта Unicode, который в своё время окончательно решил вопрос с кодировкой письменности всех распространённых мировых языков.

Однако до этого были созданы другие наборы символов, которые подходили какому-то конкретному языку или конкретному программному обеспечению — и некоторые из них используются по сей день. Отменить их все и оставить только UTF-8 нельзя, поэтому путаница в кодировках по-прежнему происходит.

Примеры текста в неверной кодировке
Примеры текста в неверной кодировке

Что делать, если нужно перевести текст с «кракозябрского» на русский?

Самый простой способ — воспользоваться одним из декодеров, например, этим или этим. Просто копируйте текст, вставляйте его в поле ввода и получайте его очеловеченный вариант. Но учтите, что не всегда текст получится восстановить и что в восстановленном тексте может не быть отдельных букв.

Если же вы регулярно сталкиваетесь с кракозябрами на самых разных сайтах, проверьте настройки кодировки в браузере и установленный язык и регион на устройстве.

Что делать, чтобы на моём сайте не было кракозябр?

Для ответа на этот вопрос есть отдельные инструкции. Но если кратко, то следите за тем, чтобы нужная кодировка на вашем сайте обязательно была задана. Даже если речь о ресурсе на базе WordPress или Joomla!, так как и в случае с CMS бывают сложности с отображением символов.

Обозначать кодировку можно в верхней части кода всех страниц сайта или сразу в файле .htaccess. Лайфхак: используйте для создания текстовых документов продвинутый редактор (Notepad++ или же другой) и сохраняйте текст в кодировке UTF-8 без BOM. Тогда вы с меньшей долей вероятности столкнётесь с ошибками в расшифровке текста.