Найти в Дзене
Димилиан медиа

Почему раньше SMS на кириллице (70 знаков) было короче, чем на латинице (160)

Помните времена, когда SMS на русском (или другом языке с кириллицей) приходилось ужимать до смешного, а на английском можно было писать больше? Это не просто так! Ограничение в 160 символов для латиницы и 70 для кириллицы было жестким техническим правилом ранней эпохи мобильной связи. Вот почему: Первые массовые сотовые сети (GSM) были спроектированы в основном для Европы и латинского алфавита. Для кодирования символов использовалась 7-битная кодировка GSM (иногда называемая GSM-7). Она идеально подходила для базовых латинских букв, цифр и некоторых знаков препинания – всего 128 символов. 7 бит на символ = 160 символов в одном SMS (1120 бит / 7 бит = 160). Кириллица, арабская вязь, иероглифы и многие другие символы не влезали в скромный набор из 128 символов GSM-7. Чтобы передать любой символ из огромного набора Unicode (включая кириллицу), требовалась 16-битная кодировка UCS-2. 16 бит на символ = 70 символов в одном SMS (1120 бит / 16 бит = 70). Физический "размер" SMS в битах остава
Оглавление

Помните времена, когда SMS на русском (или другом языке с кириллицей) приходилось ужимать до смешного, а на английском можно было писать больше? Это не просто так! Ограничение в 160 символов для латиницы и 70 для кириллицы было жестким техническим правилом ранней эпохи мобильной связи. Вот почему:

Изображение взято с сайта https://ru.freepik.com/
Изображение взято с сайта https://ru.freepik.com/

"Место" в эфире: технология GSM

Первые массовые сотовые сети (GSM) были спроектированы в основном для Европы и латинского алфавита.

Для кодирования символов использовалась 7-битная кодировка GSM (иногда называемая GSM-7). Она идеально подходила для базовых латинских букв, цифр и некоторых знаков препинания – всего 128 символов.

7 бит на символ = 160 символов в одном SMS (1120 бит / 7 бит = 160).

Проблема с кириллицей и другими алфавитами

Кириллица, арабская вязь, иероглифы и многие другие символы не влезали в скромный набор из 128 символов GSM-7.

Чтобы передать любой символ из огромного набора Unicode (включая кириллицу), требовалась 16-битная кодировка UCS-2.

16 бит на символ = 70 символов в одном SMS (1120 бит / 16 бит = 70). Физический "размер" SMS в битах оставался тем же (1120 бит), но под каждый символ теперь отводилось вдвое больше бит.

Последствия для пользователя

Стоимость

Даже короткое русское сообщение из 71 символа разбивалось на 2 SMS и стоило как два сообщения.

Удобство

Приходилось очень сильно сокращать слова и избегать знаков препинания, чтобы уложиться в 70 символов (`"Прив! Как д? Встр в 7 у метро?"`).

Раздражение

Отправка длинного сообщения на кириллице могла стоить в 2, 3 или даже 4 раза дороже аналогичного по смыслу сообщения на английском.

Почему сейчас это не так актуально

Умные телефоны и сети

Современные телефоны и сети научились "упаковывать" сообщения эффективнее. Технологии вроде конкатенации SMS позволяют автоматически склеивать длинные сообщения при отправке и получении, хотя тарификация может зависеть от оператора.

Господство Unicode

UCS-2 эволюционировал в UTF-16 (часть Unicode), ставший стандартом де-факто для представления текста, включая эмодзи. Современные системы изначально рассчитаны на множество языков.

Сдвиг в коммуникации

SMS уступило первенство мессенджерам (WhatsApp, Telegram, Viber) и соцсетям, где ограничения на длину сообщения либо очень велики, либо отсутствуют, а кодировка символов не является проблемой.

Итог

Ограничение в 70 символов для кириллицы против 160 для латиницы – это наследие технических стандартов 90-х годов, оптимизированных под латинский алфавит. К счастью, развитие технологий и стандартов связи практически стерло эту разницу для обычного пользователя, освободив нас от необходимости считать каждую букву в русском SMS.