1 неделю назад
Как я полюбил ад: C# регулярные выражения для чайников и мазохистов
Вы думаете, программист — это человек, который спокойно пьет кофе и пишет код богов? Нет. Настоящий программист — это археолог, который раскапывает чужой код в 3 часа ночи и находит там регулярное выражение длиной в экран. Добро пожаловать в мир System.Text.RegularExpressions на C#. Место, где дружба заканчивается, а строки превращаются в пыль. Вначале ты думаешь: «Ну, проверить email? Легко! Пишем @"^[^@]+@[^@]+\.[^@]+$"». И оно работает! Ты гений. Ты пьёшь пиво и предвкушаешь, как сейчас всё автоматизируешь...
1 год назад
Введение в Регулярные Выражения и Их Применение для Обработки Текстов
Введение Привет, друзья! Сегодня мы погрузимся в мир регулярных выражений (regex) — мощного инструмента для работы с текстом. Регулярные выражения позволяют искать, извлекать и изменять текстовые данные с высокой точностью и эффективностью. В этой статье мы рассмотрим основы регулярных выражений и примеры их использования для обработки текстов. Готовы? Тогда начнем! 📚🔍 Что такое Регулярные Выражения? Регулярные выражения (regex) — это шаблоны, используемые для сопоставления строк в тексте. Они...
3791 читали · 6 лет назад
Шпаргалка по регулярным выражениям. В примерах
Источник: Nuances of Programming Регулярные выражения (regex или regexp) очень эффективны для извлечения информации из текста. Для этого нужно произвести поиск одного или нескольких совпадений по определённому шаблону (т. е. определённой последовательности символов ASCII или unicode). Области применения regex разнообразны, от валидации до парсинга/замены строк, передачи данных в другие форматы и Web Scraping’а. Одна из любопытных особенностей регулярных выражений в их универсальности, стоит вам...
1 год назад
Переработка текста на Rust с ML, Big Data и хранилищем
t.me/oneRustnoqRust Для чего нужна данная статья? : Реализовать максимально быстрый функционал удаления знаков препинания, приведение к нижнему регистру используя: Сбор данных - Источники данных: социальные сети, статьи, отзывы пользователей. Сохранение данных в распределённое хранилище, например, Hadoop HDFS или Amazon S3. Предобработка текста - Удаление стоп-слов. Лемматизация и стемминг. Токенизация и разбиение на графемы или слова. Определение языка текста. Обработка больших данных - Использование фреймворков, таких как Apache Spark, для распределённой обработки текста. Интеграция с базами данных (например, BigQuery, Cassandra или ClickHouse) для хранения метаданных...