1,0×
00:00/23:18
Описание
Что такое регулярные выражения (регулярки, regexp)
2 года назад • 228 просмотров12 поставили "Нравится"
По просьбе подписчиков в этом видео совсем немного затронем регулярки. Напишем несколько показательных примеров и подумаем о необходимости их понимания.Плюсы регулярных выражений:
1) Python очень быстро и эффективно работает с регулярками, быстрее многих других ЯП, в том числе компилируемых
2) могут помочь там, где иначе пришлось бы предпринять много лишних действий (разбить текст, вырезать знаки препинания и т.п.)
3) при определенных условиях могут быть короткими и читаемыми
Минусы:
синтаксис! Он не связан с языком программирования, не всегда понятен, для сложных шаблонов может быть большая строка, состоящая из набора разных символов, что не добавляет оптимизма.
Где регулярки выигрывают - там где большой текст или сложный шаблон для поиска. Понятно что фразу из 3 слов проще и быстрее обработать методами строки, но по мере роста объемов текста и сложности шаблона регулярки выходят на первый план и по скорости и по краткости.
Совет из практики: если регулярка(само выражение) большая, то вынесите ее в константы с понятным именем и напишите коммент с примером ее работы.
Каждому питонисту советую прочесть документацию библиотеку re чисто для ознакомления, чтобы было представление о том, что там есть. Тем, кто парсит сайты и работает с текстами -регулярки нужно просто знать!
Полезные ссылки:
Официальная документация
docs.python.org/...ry/re.html
Отличнейший онлайн - инструмент тестирования/изучения регулярок
regex101.com
Книга Яна Гойвертса «Регулярные выражения. Сборник рецептов. 2-е издание» - читать!