Регулярные выражения (Regex) - шаблон для поиска соответствующего фрагмента текста.
Регулярные выражения состоят из набора литералов (букв и цифр) и метасимволов
Все Regex инструменты находятся в модуле re, который входит в стандартный дистрибутив Python – достаточно импортировать его в свой проект:
import re
наиболее популярные методы
re.match()
Этот метод ищет по заданному шаблону в начале строки
import re
s='python is the best programming language'
match=re.match(r'py',s)
print(match)
#<re.Match object; span=(0, 2), match='py'>
re.search()
Метод похож на match(), но ищет не только в начале строки.
re.findall()
Возвращает список всех найденных совпадений. У метода findall() нет ограничений на поиск в начале или конце строки
re.split()
re.sub()
re.compile()
Более подробнее можно прочитать в официальной документации
https://docs.python.org/3/library/re.html
Основные метасимволы в Regex
. Один любой символ, кроме новой строки \n.
? 0 или 1 вхождение шаблона слева
+ 1 и более вхождений шаблона слева
* 0 и более вхождений шаблона слева
\w Любая цифра или буква (\W — все, кроме буквы или цифры)
\d Любая цифра [0-9] (\D — все, кроме цифры)
\s Любой пробельный символ (\S — любой непробельный символ)
\b Граница слова
[..] Один из символов в скобках ([^..] — любой символ, кроме тех, что в скобках)
\ Экранирование специальных символов (\. означает точку или \+ — знак «плюс»)
^ и $ Начало и конец строки соответственно
{n,m} От n до m вхождений ({,m} — от 0 до m)
a|b Соответствует a или b
() Группирует выражение и возвращает найденный текст
\t, \n, \r Символ табуляции, новой строки и возврата каретки соответственно
python yellow
давай изучать Python вместе?