Dzen Как парсинг контрактов и нормализация данных превращаются в понятный рейтинг товара Когда речь о тендерах, важнее не объём данных, а их сопоставимость. Поэтому я начал с парсинга уже заключённых контрактов: это факты, а не обещания. Из каждого контракта вытягиваются товары, регионы, кварталы и поставщики. Следующий шаг — нормализация данных: приводим к единым группам и единицам измерения, считаем уверенность распознавания. Пусть это не идеально с первого дня, но уже работает и даёт картину рынка. Результат — дашборд. В нём фильтры по кварталам, регионам и группам. Есть рейтинг товара от 0 до 10 — оценка конкурентности и интересности позиции. Плюс видна доля главного поставщика и тип продаж (одиночно или в наборах). Зачем это всё? Чтобы за минуту понять, куда идти в тендеры, а где лучше подождать. Когда в карточке товара видно суммы по кварталам, минимальную цену, стабильность и разнообразие поставщиков, решение принимается быстрее. Начинайте с малого. В моём MVP — 5498 нормализова