493 читали · 1 год назад
Регулярные выражения (Regex). Перестаем бояться начинаем пользоваться.
Регулярные выражения (Regex, от англ. Regular Expressions) — это инструмент для работы с текстом, который используется для поиска, сопоставления и манипулирования строками. Regex применяются в различных задачах вроде валидации ввода, поиска по тексту, замены символов и многим другим. Строки, состоящие из букв и цифр, сопоставляются напрямую. Например, регулярное выражение cat найдет строку "cat" в тексте. Регулярные выражения используют специальные символы для создания более сложных шаблонов: Квантификаторы используются для указания повторений символов или групп: {n} — ровно n повторений...
Что такое RegEx и как оно используется в Машинном обучении?
Регулярное выражение (реджекс, регулярка) – специальное сочетание символов, позволяющее компьютеру отыскивать текст, подходящий заданному набору правил. Регулярки часть используются не только для поиска определенного текста, но и для его обработки. Во время Конструирования признаков (Feature Engineering), то есть выделения определенных данных из исходных и не очень удобных, этот уникальный инструмент часто помогает понять, есть ли в тексте тот или иной смыслонесущий отрезок. При первой попытке понять регулярные выражения многим кажется, что это какой-то инопланетный язык...