Что такое RegEx и как оно используется в Машинном обучении?
Регулярное выражение (реджекс, регулярка) – специальное сочетание символов, позволяющее компьютеру отыскивать текст, подходящий заданному набору правил. Регулярки часть используются не только для поиска определенного текста, но и для его обработки. Во время Конструирования признаков (Feature Engineering), то есть выделения определенных данных из исходных и не очень удобных, этот уникальный инструмент часто помогает понять, есть ли в тексте тот или иной смыслонесущий отрезок. При первой попытке понять регулярные выражения многим кажется, что это какой-то инопланетный язык...
2 года назад
Что такое нерегулярные глаголы: секретное Правило регуляции «нерегулярных»
Тренируя английскому, я заметил… пожалуй, начну издалека. Осваивая английский (любым способом) человек рано или поздно натыкается на три формы глаголов (делать-делал-деланное), которые нужны грамматике. И затем натыкается на «регулярные и нерегулярные глаголы». Регулярные – это такие, где вторая и третья «просто добавь -ед» (прыг-прыгед-прыгед, если дословно… точней, добуквенно) А у негерулярных вторая и третья формы образуются «фиг знает как и это просто надо вызубрить, как таблицу умножения». И бедный ученик вешает на стенку 250 глаголов и – зубрит...