4. Кодировка UTF-8 и размер символов русского и латинского алфавитов
Что такое кодировка символов UTF-8 и зачем она нужна?
UTF-8, или UCS Transformation Format 8, — это стандартизированная кодировка символов, широко используемая в Интернете. Кодировка символов — это метод, который компьютеры используют для хранения символов в качестве данных. По сути, весь текст на веб-странице представляет собой последовательность символов, хранящихся в виде одного или нескольких байтов. В вычислительной технике байт — это единица данных, состоящая из 8 бит или двоичных цифр. UTF-8 поддерживает каждый символ в наборе символов Unicode, включая символы из всех систем письма, языков и технических символов...
UTF — универсальная кодировка для всего
Продолжение рассказа про Юникод В прошлый раз мы рассказали про Юникод — универсальную таблицу символов, в которой есть знаки почти всех языков. Вот краткое содержание: Получается, что Юникод — универсальное решение проблемы совместимости текста. Текстовый файл, записанный в таком формате, можно прочитать на любом современном компьютере. Поддержка Юникода есть во всех новых операционных системах последних лет. Чтобы пользоваться Юникодом, нужна была новая кодировка, которая бы определяла правила хранения информации о каждом символе...