06:44
1,0×
00:00/06:44
698,1 тыс смотрели · 4 года назад
🧩 Парсинг XML с помощью регулярных выражений — безумие, которое иногда работает
Есть старое правило: «никогда не парсь XML с помощью regex». Его повторяют студенты, опытные разработчики и даже Stack Overflow с фанатичной настойчивостью. Но именно поэтому статья “You can't parse XML with regex. Let's do it anyways” так интересна — она идёт против канона и показывает, что даже в области «запрещённых приёмов» есть место рациональности. Автор блога sdomi.pl подходит к теме не как еретик, а как инженер-экспериментатор. Он признаёт: XML и HTML — слишком сложны, чтобы корректно анализировать их шаблонами...
6. Библиотеки Python для анализа и парсинга данных
Парсинг (англ. parsing — разбор) — сбор определённой части информации из участков документов, производящийся парсером — специальной программой или скриптом. Веб-скрейпинг (или скрепинг, или скрапинг← англ. web scraping) — это технология получения веб-данных путем извлечения их со страниц веб-ресурсов. - это бесплатный фреймворк для веб-краулинга находящийся в открытом доступе, который написан на языке программирования Python. Изначально задумывался для веб-скрейпинга (технология получения веб-данных...