Найти тему
python yellow

Регулярные выражения (Regex)

Регулярные выражения (Regex) - шаблон для поиска соответствующего фрагмента текста.

Регулярные выражения состоят из набора литералов (букв и цифр) и метасимволов

Все Regex инструменты находятся в модуле re, который входит в стандартный дистрибутив Python – достаточно импортировать его в свой проект:

import re

наиболее популярные методы

re.match()

Этот метод ищет по заданному шаблону в начале строки

import re
s='python is the best programming language'
match=re.match(r'py',s)
print(match)
#<re.Match object; span=(0, 2), match='py'>

re.search()

Метод похож на match(), но ищет не только в начале строки.

re.findall()

Возвращает список всех найденных совпадений. У метода findall() нет ограничений на поиск в начале или конце строки

re.split()

re.sub()

re.compile()

Более подробнее можно прочитать в официальной документации

https://docs.python.org/3/library/re.html

Основные метасимволы в Regex

. Один любой символ, кроме новой строки \n.

? 0 или 1 вхождение шаблона слева

+ 1 и более вхождений шаблона слева

* 0 и более вхождений шаблона слева

\w Любая цифра или буква (\W — все, кроме буквы или цифры)

\d Любая цифра [0-9] (\D — все, кроме цифры)

\s Любой пробельный символ (\S — любой непробельный символ)

\b Граница слова

[..] Один из символов в скобках ([^..] — любой символ, кроме тех, что в скобках)

\ Экранирование специальных символов (\. означает точку или \+ — знак «плюс»)

^ и $ Начало и конец строки соответственно

{n,m} От n до m вхождений ({,m} — от 0 до m)

a|b Соответствует a или b

() Группирует выражение и возвращает найденный текст

\t, \n, \r Символ табуляции, новой строки и возврата каретки соответственно

python yellow
давай изучать Python вместе?

python yellow

-2