Парсинг цен с сайтов аптечных сетей: архитектура решения Недавно я писал, что получил диплом Data Engineer, сегодня хочу рассказать про дипломную работу, в частности про архитектуру моего решения. Ниже распишу пайплайн и выложу частичный код, вы можете переиспользовать его и создать собственное приложение. Тема была: парсинг цен с сайтов аптечных сетей Основная идея - это собирать цены по определённому скоупу номенклатуры предоставляя доступ к данным в дашборде со свободным доступом. Изначально я решил выбрать скю по категории противодиарейных препаратов, как одной из самой крупных АТС-3 групп по объёму продаж. Из аптечных сетей взял топ-10 по продажам: апрель, ригла, планета здоровья….остальных вы сами знаете :) Главным условием была полная автоматизация. Для проекта нам нужно: 1️⃣ Поднять сервер (виртуальную машину: min 8cpu, 24ram, 100gb) 2️⃣ Создать кастомный docker image 3️⃣ Развернуть gitlab через omnibus (как сервис, ибо через докер сжирает овердофига ресурсов) Пайплайн
Парсинг цен с сайтов аптечных сетей: архитектура решения
19 октября 202519 окт 2025
2 мин