Есть старое правило: «никогда не парсь XML с помощью regex». Его повторяют студенты, опытные разработчики и даже Stack Overflow с фанатичной настойчивостью. Но именно поэтому статья “You can't parse XML with regex. Let's do it anyways” так интересна — она идёт против канона и показывает, что даже в области «запрещённых приёмов» есть место рациональности. Автор блога sdomi.pl подходит к теме не как еретик, а как инженер-экспериментатор. Он признаёт: XML и HTML — слишком сложны, чтобы корректно анализировать их шаблонами. Однако в некоторых сценариях регулярки — не зло, а инструмент быстрого доступа к данным, особенно когда речь идёт о веб-скрапинге или простом поиске фрагментов в полуструктурированных логах. Автор демонстрирует минималистичный парсер на Bash, который эмулирует поведение XML-дерева с помощью стека: открывающие теги — push, закрывающие — pop. Программа анализирует поток символов, отслеживает уровень вложенности и выводит значения по запросу. 🧠 Суть подхода: Да, этот скри
🧩 Парсинг XML с помощью регулярных выражений — безумие, которое иногда работает
5 октября 20255 окт 2025
2 мин