Недавно открыл для себя шикарный пакет, который помогает строить ссылки для сайте по ГОСТу, из транслитерации получить нормальный текст, определять к какому языку относится текст.
Давайте установим пакет в свое окружение. Для этого откроем консоль|терминал и введем команду:
pip install transliterate
Пакет установлен, начинаем заполнять скрипт командами.
Начнем с импорта пакета и команды вывода поддерживаемых локалей:
На июнь 2021 года в пакете есть поддержка следующих локалей:
- Armenian
- Bulgarian (beta)
- Georgian
- Greek
- Macedonian (alpha)
- Mongolian (alpha)
- Russian
- Serbian (alpha)
- Ukrainian (beta)
Что даёт поддержка локалей?
Модуль transliterate имеет ряд полезных инструментов, таких как:
- Функционал генерации url transliterate.slugify() для нелатинских текстов.
- Генератор "lorem ipsum", который позволяет генерировать "lorem ipsum" для выбранной локали.
- Регистрация собственных языковых пакетов.
Формирование транслитерации
Кто не знает что такое транслитерация - wiki помогает:
точная передача знаков одной письменности знаками другой письменности, при которой каждый знак (или последовательность знаков) одной системы письма передаётся соответствующим знаком (или последовательностью знаков) другой системы письма.
Транслитерация текста с русского языка на английский, т .е. замена всех русских букв в строке на английские буквы.
Генерация URL-адреса.
Проверим на втором варианте, который использовался в транслитерации. Это реальное именование товара в интернет-магазине:
Надеюсь пригодится в ваших проектах.