Полезные регулярные выражения (regexp). Часть 1
Для многих это, как оказалось, очень сложная тема и темный лес ) Многие их боятся. Но стоит попробовать их использовать и через некоторое время Вы их полюбите. И все же перед дальнейшей практикой настоятельно рекомендую прочитать теорию в справке Датакол: теория, часто используемые выражения. Ну и теперь перейдем к полезностям и советам/рекомендациям по регуляркам: У регулярных выражений есть метасимволы . ^ $ * + ? { } [ ] \ | ( ) Если в Вашем выражении есть какието из этих символов, то его обязательно нужно "экранировать", т...
Что такое RegEx и как оно используется в Машинном обучении?
Регулярное выражение (реджекс, регулярка) – специальное сочетание символов, позволяющее компьютеру отыскивать текст, подходящий заданному набору правил. Регулярки часть используются не только для поиска определенного текста, но и для его обработки. Во время Конструирования признаков (Feature Engineering), то есть выделения определенных данных из исходных и не очень удобных, этот уникальный инструмент часто помогает понять, есть ли в тексте тот или иной смыслонесущий отрезок. При первой попытке понять регулярные выражения многим кажется, что это какой-то инопланетный язык...