Знакомые всем нам "лайки" на Facebook – это всего лишь маленькие звездочки во вселенной Unicode. Юникод (Unicode) – это стандарт, который представляет символы разных языков и позволяет компьютерам "понимать" и обрабатывать эту информацию. Звездочки, нашедшие свое место в Юникоде, помогают нам выразить свои эмоции и поддержку в цифровом мире. Но юникодная звезда способна на гораздо большее, чем просто украшать наши социальные медиа. В Юникоде есть несколько вариантов звездочек, каждая из которых имеет свой собственный код...
Привет, коллеги. Сразу предупреждаю, что всё ниже очень интересно, но на практике нужно редко. Разве что вам надо работать с текстом на странном языке или отлаживать софт, который много работает с юникодом. Юникодных кодировок известно несколько, но имеет смысл сосредоточиться на UTF8. Ее достоинство в том, что она совместима с семибитной ASCII (грубо говоря, латиницей). Дело в том, что символы кодируются в UTF8 разным числом байт, от одного до четырех, и однобайтовые накрывают ASCII. Проще говоря, текст на английском одинаково выглядит и в UTF8 и, в latin1...