Продолжение рассказа про Юникод В прошлый раз мы рассказали про Юникод — универсальную таблицу символов, в которой есть знаки почти всех языков. Вот краткое содержание: Получается, что Юникод — универсальное решение проблемы совместимости текста. Текстовый файл, записанный в таком формате, можно прочитать на любом современном компьютере. Поддержка Юникода есть во всех новых операционных системах последних лет. Чтобы пользоваться Юникодом, нужна была новая кодировка, которая бы определяла правила хранения информации о каждом символе...
Привет, коллеги. Обратимся снова к Юникоду. Внизу ссылки на другие материалы по этой теме. Мы знаем, что у символов есть коды. Например, у точки код 46, шестнадцатеричный 0х2е (это и есть 46), у буквы Я код 1071 (или 0х42f), у буквы è код 232 (0хe8), и так далее. Однако код символа не тождественен числовому значению байт, которыми он кодируется в кодировке! Если мы про utf8, то у неё первая половина ASCII совпадает и кодируется одним байтом (первый бит всегда нуль), и код символа совпадает с кодом в кодировке...