{"draftJsState":{"blocks":[{"data":{"image":{"id":"69f0e7f28fdeab343189a9d5"}},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"atomic:image","key":"fqm3b"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Мне нужно было вытащить email из логов. Открыл ChatGPT: \"дай regex для email на Питоне\". Секунда - получил строчку:\r","type":"unstyled","key":"m7um"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}\r","type":"blockquote","key":"7o7gm"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Скопировал, запустил. Что-то нашло. Окей, вроде работает.\r\n\r\nЧерез день коллега спросил: почему половина адресов пропала из выгрузки? Обычные адреса, ничего странного. Паттерн их просто не увидел.\r\n\r\nЯ уставился на эту строчку. Правильная она? Понятия не имел. Проверить как - тоже. Там проблема и началась.","type":"unstyled","key":"2gvml"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"ЧТО ТАКОЕ REGEX ЗА 30 СЕКУНД\r","type":"header-three","key":"bal4a"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Регулярное выражение - шаблон для поиска в тексте. Пишешь что ищешь, Питон находит.\r","type":"unstyled","key":"1gelk"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"import re\r\n\r\ntext = \"купил хлеб и ещё хлеб\" result = re.findall(\"хлеб\", text) print(result)\r\n\r\nРезультат: ['хлеб', 'хлеб']\r","type":"blockquote","key":"1roii"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Слово \"хлеб\" - уже регулярка. Но regex умеет описывать не только точный текст, а целые классы символов. Цифры вообще, буквы вообще, повторения, позиции.\r\n\r\nРазберём тот паттерн из ChatGPT по кусочкам.","type":"unstyled","key":"46gtn"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"\r\nКВАДРАТНЫЕ СКОБКИ - ЛЮБОЙ ИЗ НАБОРА","type":"header-three","key":"aqlj2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"[abc]","type":"blockquote","key":"fevrl"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Скобки означают: подойдёт любой символ из этого списка. [abc] найдёт a или b или c.","type":"unstyled","key":"f9tbn"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"[a-z]","type":"blockquote","key":"dnted"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Диапазон через дефис. [a-z] - любая строчная буква от a до z. [0-9] - любая цифра.","type":"unstyled","key":"d47n9"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"В паттерне для email первый кусок:","type":"unstyled","key":"87jre"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"[a-zA-Z0-9._%+-]+","type":"blockquote","key":"4ogks"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Что здесь:","type":"unstyled","key":"2pur"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":0,"style":"BOLD"}],"text":"a-z - строчные буквы","type":"unordered-list-item","key":"6tr0c"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":0,"style":"BOLD"}],"text":"A-Z - заглавные","type":"unordered-list-item","key":"7vb0r"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":0,"style":"BOLD"}],"text":"0-9 - цифры","type":"unordered-list-item","key":"a5ces"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":9,"offset":0,"style":"BOLD"}],"text":". _ % + - - эти символы просто как есть","type":"unordered-list-item","key":"c39ej"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Плюс после скобки значит \"один или больше таких подряд\".\n\nВесь блок читается: последовательность букв/цифр/спецсимволов длиной от одного символа. Это часть до собаки в email.","type":"unstyled","key":"frfm3"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"ТОЧКА - ХИТРЫЙ СИМВОЛ\r","type":"header-three","key":"duu93"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":83,"style":"BOLD"},{"length":2,"offset":182,"style":"BOLD"},{"length":1,"offset":216,"style":"BOLD"}],"text":"В обычном тексте точка просто точка. В regex точка означает \"вообще любой символ\". a.c найдёт abc, a5c, a_c - любой символ между a и c.\r\n\r\nХочешь именно точку - ставь обратный слеш: \\.\r\n\r\nВ паттерне email есть кусок . - это именно точка перед доменной зоной. Без слеша он нашёл бы gmail_com так же как gmail.com.","type":"unstyled","key":"5hplh"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"ЖАДНОСТЬ\r","type":"header-three","key":"47g8o"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Квантификаторы + и * жадные. Берут максимум возможного.\r\n\r\nСмотри:\r","type":"unstyled","key":"3irje"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"слово текст ещё\r","type":"blockquote","key":"cv0qe"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":4,"offset":8,"style":"BOLD"}],"text":"Паттерн <.+> - \"открывающая скобка, любые символы, закрывающая\".\r","type":"unstyled","key":"aup6k"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"import re\r\n\r\ntext = \"слово текст ещё\" print(re.findall(\"<.+>\", text))\r","type":"blockquote","key":"4g3lc"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":33,"offset":11,"style":"BOLD"},{"length":1,"offset":68,"style":"BOLD"},{"length":1,"offset":83,"style":"BOLD"},{"length":1,"offset":168,"style":"BOLD"}],"text":"Результат: ['слово текст ещё']\r\n\r\nНашло всё от первой < до последней >. Квантификатор жадный - сожрал сколько влезло.\r\n\r\nДобавляешь вопросительный знак и + становится ленивым:\r","type":"unstyled","key":"5r9np"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"print(re.findall(\"<.+?>\", text))\r","type":"blockquote","key":"3p4dv"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":30,"offset":11,"style":"BOLD"},{"length":1,"offset":81,"style":"BOLD"}],"text":"Результат: ['', '', '', '']\r\n\r\nТеперь останавливается на первой же >. Один символ изменил всё поведение.\r\n\r\nЭто объясняет половину случаев \"почему оно нашло фигню\".","type":"unstyled","key":"fd1jd"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"РЕАЛЬНЫЙ ПРИМЕР: ВЫТАЩИТЬ СУММЫ ИЗ ЖАЛОБ\r","type":"header-three","key":"f5ra2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Работал с отзывами на товары. Надо было найти упоминания денег. \"Заплатил 3000\", \"стоит 1500р\", \"отдал двадцать тысяч\" - форматы разные.\r","type":"unstyled","key":"6atha"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"import re\r","type":"blockquote","key":"6g00d"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"text = \"Заплатил 3000 руб за ерунду. Видел за 1500р - жадность. Отдал 25000₽ вообще\"","type":"blockquote","key":"558lp"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"prices = re.findall(r\"\\d+\\s?(?:руб|р|₽)\", text)","type":"blockquote","key":"9qk7o"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"print(prices)\r","type":"blockquote","key":"fn83v"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":31,"offset":11,"style":"BOLD"}],"text":"Результат: ['3000 руб', '1500р', '25000₽']\r\n\r\nЧто тут:","type":"unstyled","key":"f6530"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":2,"offset":0,"style":"BOLD"}],"text":"\\d - любая цифра","type":"unordered-list-item","key":"cck77"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":0,"style":"BOLD"}],"text":"\\d+ - одна или больше цифр подряд","type":"unordered-list-item","key":"b0es"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":3,"offset":0,"style":"BOLD"}],"text":"\\s? - может быть пробел, может нет (вопросительный знак - ноль или один)","type":"unordered-list-item","key":"b39de"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":7,"offset":0,"style":"BOLD"}],"text":"руб|р|₽ - вертикальная черта означает \"или\"\r\n\r","type":"unordered-list-item","key":"ern0o"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Читается: цифры, возможно пробел, потом руб или р или значок рубля.\r Без regex писал бы split, циклы, if-ы на страницу кода. Тут - всего одна строчка.","type":"unstyled","key":"2us21"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Когда regex лишний","type":"header-three","key":"b7r6v"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[{"length":15,"offset":31,"style":"BOLD"},{"length":26,"offset":93,"style":"BOLD"},{"length":31,"offset":139,"style":"BOLD"},{"length":21,"offset":194,"style":"BOLD"}],"text":"Ищешь точное слово - используй \"слово\" in text. Быстрее и проще.\r Проверяешь начало строки - text.startswith(\"префикс\").\r Простая замена - text.replace(\"старое\", \"новое\").\r Regex хорош там, где структура повторяется, а детали меняются. Даты, номера, коды, извлечение чисел, чистка текста.","type":"unstyled","key":"bljrb"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Как я использую ChatGPT сейчас","type":"header-three","key":"6rcmq"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Нейросети могут галлюцинировать и не всегда давать идеальный ответ, даже если ты написал хороший промт. Я разобрался с regex нормально, перелопатил всю документацию. Иногда проверяю свои паттерны через ИИ, когда он даёт паттерн - я читаю его за секунды. Вижу что он делает, где споткнётся. Правлю под свои данные сразу. Но в основных код пишу сам.\r","type":"unstyled","key":"aq7rg"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Раньше копировал вслепую. Работает - хорошо, сломалось - в гугл. Сейчас контролирую процесс.\r","type":"unstyled","key":"5q3a2"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Вот разница между \"надеюсь сработает\" и \"знаю что будет\".","type":"unstyled","key":"ebm6j"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Всё что показал выше хватит на большинство стандартных задач. Остальное - lookahead/lookbehind, именованные группы, флаги, оптимизация - уже продвинутые штуки.","type":"unstyled","key":"82tic"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"Не так давно я опубликовал курс по regex в Питоне. 72 урока, более 900 тестов и задач с автопроверкой. От базы до сложных конструкций. Текстовый формат: урок 15 минут, задачи, закрыл. Рекомендую всем, кто хочет прокачать свои навыки, пройти любой собес и удивить своих коллег.","type":"unstyled","key":"7lpta"},{"data":{},"depth":0,"entityRanges":[{"key":0,"length":61,"offset":2}],"inlineStyleRanges":[],"text":"\uD83D\uDC49 Регулярные выражения (Regex) в Python: Интерактивный тренажёр","type":"unstyled","key":"9idj1"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"\n\r","type":"unstyled","key":"28ur7"},{"data":{},"depth":0,"entityRanges":[],"inlineStyleRanges":[],"text":"","type":"marker","key":"2BPcJOZdEJNbeYwjAJxl"}],"entityMap":{"0":{"data":{"url":"https://stepik.org/a/271005"},"mutability":"MUTABLE","type":"LINK"}}},"mentions":[]}