Найти в Дзене
Каждодневье

Как сделать транслитерацию ссылок в Python? Осваиваем модуль transliterate.

Оглавление

Недавно открыл для себя шикарный пакет, который помогает строить ссылки для сайте по ГОСТу, из транслитерации получить нормальный текст, определять к какому языку относится текст.

Давайте установим пакет в свое окружение. Для этого откроем консоль|терминал и введем команду:

pip install transliterate

Пакет установлен, начинаем заполнять скрипт командами.

Начнем с импорта пакета и команды вывода поддерживаемых локалей:

Поддерживаемые локали.
Поддерживаемые локали.

На июнь 2021 года в пакете есть поддержка следующих локалей:

  • Armenian
  • Bulgarian (beta)
  • Georgian
  • Greek
  • Macedonian (alpha)
  • Mongolian (alpha)
  • Russian
  • Serbian (alpha)
  • Ukrainian (beta)

Что даёт поддержка локалей?

Модуль transliterate имеет ряд полезных инструментов, таких как:

  • Функционал генерации url transliterate.slugify() для нелатинских текстов.
  • Генератор "lorem ipsum", который позволяет генерировать "lorem ipsum" для выбранной локали.
  • Регистрация собственных языковых пакетов.

Формирование транслитерации

Кто не знает что такое транслитерация - wiki помогает:

точная передача знаков одной письменности знаками другой письменности, при которой каждый знак (или последовательность знаков) одной системы письма передаётся соответствующим знаком (или последовательностью знаков) другой системы письма.

Транслитерация текста с русского языка на английский, т .е. замена всех русских букв в строке на английские буквы.

Очень даже неплохо вышло. Изначально EN не тронуло.
Очень даже неплохо вышло. Изначально EN не тронуло.

Генерация URL-адреса.

Проверим на втором варианте, который использовался в транслитерации. Это реальное именование товара в интернет-магазине:

Круто! Осталось только в начало добавить путь-разсположение карточки и готово.
Круто! Осталось только в начало добавить путь-разсположение карточки и готово.

Надеюсь пригодится в ваших проектах.