Найти в Дзене
Информатика для всех

Решение задачи 1 ОГЭ по информатике 2026 года. В одной из кодировок Unicode каждый символ кодируется 16 битами

Приветствуем всех на канале "Информатика для всех"! Начнем новую серию статей, посвященных разбору задач ОГЭ 2026 года. Первая задача - это задача на знание кодировок и умение рассчитывать объем информации для хранения данных. Формулировка задачи 1 в демо-варианте ОГЭ 2026 года: В одной из кодировок Unicode каждый символ кодируется 16 битами. Ученик написал текст (в нём нет лишних пробелов): «Мои любимые герои мультфильмов: Шрек, Пумба, Маугли, Рататуй, Пиноккио, Винни-Пух, Белоснежка, Малефисента, Человек-паук, Конёк-Горбунок». Ученик удалил из списка имя героя одного мультфильма, а также лишние запятую и пробел – два пробела не должны идти подряд. При этом размер нового предложения в данной кодировке оказался на 12 байт меньше, чем размер исходного предложения. Напишите в ответе удалённое имя героя мультфильма. Что нам понадобится для решения данной задачи? Знание единиц измерения информации и понимание, что в кодировке Unicode каждый символ занимает 16 бит, что составляет 2 байт.
Оглавление

Приветствуем всех на канале "Информатика для всех"!

Начнем новую серию статей, посвященных разбору задач ОГЭ 2026 года.

 Создано автором канала Информатика для всех
Создано автором канала Информатика для всех

Первая задача - это задача на знание кодировок и умение рассчитывать объем информации для хранения данных.

Формулировка задачи 1 в демо-варианте ОГЭ 2026 года:

В одной из кодировок Unicode каждый символ кодируется 16 битами.

Ученик написал текст (в нём нет лишних пробелов):

«Мои любимые герои мультфильмов: Шрек, Пумба, Маугли, Рататуй, Пиноккио, Винни-Пух, Белоснежка, Малефисента, Человек-паук, Конёк-Горбунок».

Ученик удалил из списка имя героя одного мультфильма, а также лишние запятую и пробел – два пробела не должны идти подряд. При этом размер нового предложения в данной кодировке оказался на 12 байт меньше, чем размер исходного предложения. Напишите в ответе удалённое имя героя мультфильма.

Что нам понадобится для решения данной задачи?

Знание единиц измерения информации и понимание, что в кодировке Unicode каждый символ занимает 16 бит, что составляет 2 байт.

Единицы измерения информации
Единицы измерения информации

Ученик удалил название одного мультфильма, запятую и пробел (т.е. одно название мультфильма + еще два символа по 2 байта) и размер предложения стал на 12 байт меньше. Значит название составляло 12 - 2*2 = 12 - 4 = 8 байт.

Т. к. 1 символ в кодировке Unicode занимает ровно 2 байт, то значит название удаленного мультфильма составляло 8/2 = 4 символа.

Остается найти в списке исходных слов (Шрек, Пумба, Маугли, Рататуй, Пиноккио, Винни-Пух, Белоснежка, Малефисента, Человек-паук, Конёк-Горбунок) название из 4 букв - это и будет наш ответ.

Ответ в задаче: Шрек

И немного теории о кодировках символов

Unicode

Кодировка Unicode — это стандарт, который предназначен для представления и обработки текста на различных языках мира. Она задает уникальные числовые коды (кодовые точки) для каждого символа, что позволяет компьютерам одинаково интерпретировать символы независимо от платформы, языка или программы.

Основные особенности Unicode:

  • Обеспечивает уникальный код для каждого символа, включая буквы, цифры, знаки препинания, эмодзи и специальные символы.
  • Поддерживает множество систем кодирования, таких как UTF-8, UTF-16 и UTF-32.
  • Позволяет объединять символы из различных алфавитов и систем письма в одном документе.

Например, буква «А» в Unicode имеет код U+0410 (в кириллице), а смайлик 😀 — U+1F600. Благодаря этому стандартизации можно надежно обмениваться текстами между разными устройствами и программами.

UTF-8 — это кодировка символов, которая может представлять любой символ в стандарте Unicode. Она является одной из самых популярных кодировок, используемых в веб-разработке и программировании, благодаря своей совместимости с ASCII и способности обрабатывать множество языков и символов. Символы в UTF-8 могут занимать от 1 до 4 байт. Символы ASCII (от U+0000 до U+007F) занимают 1 байт, а более сложные символы могут занимать большее количество байт. Первые 128 символов UTF-8 совпадают с ASCII, что делает ее удобной для использования в системах, которые изначально поддерживали только ASCII.

UTF-16 — кодировка Unicode, использующая 2 или 4 байта для представления символов. Широко используется в некоторых операционных системах и приложениях (например, Java).

UTF-32 — кодировка Unicode, использующая фиксированное количество 4 байт для каждого символа. Упрощает обработку текста за счет фиксированной длины, но занимает больше места по сравнению с UTF-8 и UTF-16.

КОИ-8

Кодировка КОИ-8 (Код Обмена Информацией, 8-битная) — это одна из первых кодировок, разработанных для представления кириллицы в компьютерных системах. Она была создана в Советском Союзе в 1980-х годах и использовалась для обработки текстов на русском языке.

Основные характеристики кодировки КОИ-8:

  • 8-битная кодировка: Каждому символу соответствует 8 бит (1 байт), что позволяет закодировать до 256 различных символов.
  • Совместимость с ASCII: Первые 128 символов (0-127) совпадают с кодировкой ASCII, что обеспечивает совместимость с английским текстом.
  • Кириллические символы: Символы кириллицы занимают диапазон от 128 до 255. Это позволяет использовать КОИ-8 для представления русского текста.
  • Использование: Кодировка КОИ-8 была широко распространена в России и других странах СНГ в ранних версиях Windows, но со временем была заменена более современными кодировками, такими как UTF-8.

ASCII

ASCII (American Standard Code for Information Interchange) — кодировка, использующая 7 бит для представления 128 символов, включая английские буквы, цифры и некоторые специальные символы. Стандарт кодирования букв латинского алфавита, цифр, некоторых специальных знаков и управляющих символов, принятый еще в 1963 году Американской ассоциацией стандартов как основной способ представления текстовых данных в ЭВМ.

Windows-1251

Windows-1251 — кодировка, используемая для представления кириллицы в Windows. Поддерживает русский и другие славянские языки. Является 8-битной кодировкой. На данный момент почти вытеснена кодировкой UTF-8.

Следующая задача ОГЭ:

Подборка решений всех задач ОГЭ по информатике (пополняется)

Подписывайтесь на канал, ставьте лайки, оставайтесь на связи!

Успехов на экзаменах!