3 года назад
UTF-8 станет кодировкой по умолчанию в JDK 18 Компания Oracle, занимающаяся поддержкой стандартов языка Java, объявила, что начиная с JDK 18, кодировкой по умолчанию в Java-приложениях и других программных продуктах станет UTF-8. В настоящее время кодировка UTF-8 доминирует как стандарт для веб-сайтов — в ней публикуется примерно 95% контента. Кодировка по умолчанию в JDK 18 решит проблему с искажением текста в Windows. Это связано с тем, что объект FileReader считывает текстовое содержимое в кодировке 1252, которая является языковым стандартом в Windows. В macOS подобная проблема отсутствует, поскольку в этой операционной системе UTF-8 является кодировкой по умолчанию Изменение согласуется с существующими в Java методами newBufferedReader/Writer класса java.nio.file.Files, где UTF-8 считается значением по умолчанию, если не задана определенная кодировка. Благодаря единому стандарту кодировки API-интерфейсы ввода-вывода JDK теперь всегда будут работать одинаково, предсказуемо, без необходимости обращать внимание на среду хоста и / или пользователя. Читать статью
1 месяц назад
Что такое кодировка символов UTF-8 и зачем она нужна?
UTF-8, или UCS Transformation Format 8, — это стандартизированная кодировка символов, широко используемая в Интернете. Кодировка символов — это метод, который компьютеры используют для хранения символов в качестве данных. По сути, весь текст на веб-странице представляет собой последовательность символов, хранящихся в виде одного или нескольких байтов. В вычислительной технике байт — это единица данных, состоящая из 8 бит или двоичных цифр. UTF-8 поддерживает каждый символ в наборе символов Unicode, включая символы из всех систем письма, языков и технических символов...