Рубрика "Секреты Вим". Байты, коды, символы
Привет, коллеги. Обратимся снова к Юникоду. Внизу ссылки на другие материалы по этой теме. Мы знаем, что у символов есть коды. Например, у точки код 46, шестнадцатеричный 0х2е (это и есть 46), у буквы Я код 1071 (или 0х42f), у буквы è код 232 (0хe8), и так далее. Однако код символа не тождественен числовому значению байт, которыми он кодируется в кодировке! Если мы про utf8, то у неё первая половина ASCII совпадает и кодируется одним байтом (первый бит всегда нуль), и код символа совпадает с кодом в кодировке...
Как текст хранится в компьютере? Часть 3.
Здравствуй и хорошей, товарищ! На связи Тюрин Роман, это канал Симпличные условия, где о сложном говорится просто. Это третья часть рассказа, поэтому я надеюсь, мой читающий друг, ты знаком с первыми двумя: Часть 1 - шифр Морзе, код Бодо и Мюррея, понятие бита Часть 2 - кодировка ASCII - как прочесть это слово и что это. Проблема национальных кодировок и причина появления крокозябр Содержание: Появление Unicode Как кодируют в Unicode: UTF-8 Как шифруется один символ? UTF-16 - а это...