Парсинг (от англ. parsing) — это автоматический сбор данных с открытых источников (сайтов, баз, справочников) с целью их структурирования и дальнейшего анализа или использования. Это может быть:
- сбор контактов потенциальных клиентов (email, телефон, имя);
- мониторинг цен конкурентов;
- выгрузка объявлений с досок (например, Avito, ЦИАН, Юла);
- анализ отзывов и соцсетей;
- сканирование сайтов на предмет бизнес-данных.
Но насколько это законно? Где заканчивается парсинг как "аналитика", и начинается нарушение закона?
Что говорит закон РФ о парсинге?
В России вопросы, связанные с парсингом, регулируются:
- Федеральным законом № 152-ФЗ «О персональных данных»;
- Гражданским кодексом (ст. 128, 152.1, 152.2 — защита информации);
- Федеральным законом № 149-ФЗ «Об информации, информационных технологиях и защите информации»;
- Законом о защите авторских прав (если парсится закрытый контент).
Кроме того, практику регулирует Роскомнадзор — орган, контролирующий оборот персональных данных и соблюдение законодательства в сфере ИТ и телекоммуникаций.
Что можно делать (и не нарушать закон)
1. Парсинг неперсонализированных открытых данных
Можно парсить, если:
- данные не относятся к конкретному человеку (например, цены, категории товаров, названия компаний);
- данные опубликованы на открытом сайте без регистрации;
- данные обезличены и не позволяют идентифицировать человека напрямую.
Примеры:
- Сбор цен на товары с интернет-магазинов;
- Мониторинг вакансий;
- Сбор публичной информации о компаниях (ИНН, ОГРН, адрес) с сайта ФНС или СПАРК.
Заключение: законно. Здесь нет персональных данных и нет авторского контента в закрытом доступе.
2. Парсинг персональных данных из открытых источников
Тут начинается зона риска. Согласно ст. 6 ФЗ-152:
«Обработка персональных данных допускается, если они сделаны общедоступными субъектом персональных данных».
Что это значит?
Если человек сам разместил свой email/телефон/ФИО в открытом доступе — например, в визитке на сайте, в профиле на доске объявлений, или в карточке ИП — это формально допускается при соблюдении ряда условий:
- Вы не должны использовать эти данные для спама или массовых рассылок без согласия;
- Данные нельзя передавать третьим лицам;
- Нужно быть готовым удалить данные по запросу субъекта.
Примеры:
- Парсинг контактов с сайтов «Юла», «Авито», «2ГИС» — рискованно;
- Сбор e-mail с публичных блогов — допустимо только с целью одноразового контакта и без массовой рассылки.
Заключение: можно использовать только единично, с юридическим обоснованием, без перепродажи или рассылок. Массовый парсинг — повод для жалобы в Роскомнадзор.
3. Парсинг баз с авторизацией или за платной подпиской
Если вы получаете доступ к сайту, пройдя регистрацию, авторизацию, или обходите защиту (например, Captcha, платный доступ), то:
- это может быть квалифицировано как неправомерный доступ (ст. 272 УК РФ);
- данные, скорее всего, не являются открытыми, и парсинг будет незаконным.
Примеры:
- Сбор клиентов с CRM-систем конкурентов;
- Взлом платных баз (например, сайтов с платной аналитикой);
- Обход авторизации на форуме или в закрытом чате.
Заключение: незаконно. Может повлечь уголовную или административную ответственность.
Можно ли делать email-рассылки по собранной базе?
Нет — нельзя без согласия. Даже если вы нашли адрес в открытом доступе, вы обязаны иметь доказуемое согласие на рекламную рассылку.
⚠️ Ст. 18 ФЗ «О рекламе»:
Распространение рекламы по электронной почте допускается только при условии предварительного согласия абонента.
Это же правило касается мессенджеров и SMS. Нарушение — до 500 000 руб. штрафа.
Как защититься, если вы парсите данные?
- Используйте только открытые источники, без авторизации и подписки;
- Не собирайте ФИО + телефон/email в связке;
- Не храните и не передавайте парсенные данные без цели;
- Указывайте назначение обработки данных (например: подбор релевантных предложений, единичное касание);
- Удаляйте информацию по требованию пользователя;
- Не используйте базы для массовых рассылок без согласия.
Роскомнадзор и практика проверок
Роскомнадзор за последние 3 года усилил контроль за:
- нелегальными базами телефонов и email;
- продажей парсенных данных;
- ботами, собирающими пользователей соцсетей.
Примеры реальных дел:
- В 2022 г. была заблокирована база с телефонами пользователей Avito, парсенных через API;
- В 2023 г. наказан предприниматель за рассылку рекламы на email, собранные с сайтов без согласия.
Заключение
Парсинг — это мощный инструмент автоматизации, но на тонкой грани закона. Если вы работаете с открытыми данными без персонализации — вы в безопасности. Если же ваша цель — контактировать с людьми, будьте крайне аккуратны: даже одно письмо без согласия может повлечь штраф. Особую осторожность стоит соблюдать при сборе номеров телефонов, email, ФИО и геолокации.
Закон однозначно запрещает:
- массовую рассылку без согласия;
- сбор данных с закрытых источников;
- перепродажу парсенных баз.
Лучший подход — работать прозрачно, с обоснованием целей и соблюдением прав субъектов данных.
В следующей статье разберем насколько эффективно продвижение в соцсетях, кому это будет полезно, а кто впустую потратит бюджет... Подпишись!