Найти в Дзене

ПАРСИНГ - КОГДА ЭТО ЗАКОННО

Оглавление

Текущую статью я хочу посвятить вопросу парсинга.

На своем Телеграм-канале «IP – IT право с нуля» я немного писала про парсинг, в статье хочу остановиться подробнее.

Для тех, кто не сталкивался, определимся сначала, что это за зверь такой.

1. Что такое парсинг

Парсинг – это автоматизированный сбор информации из разного рода источников в Интернете с дальнейшей ее структуризацией и использованием в каких-то своих целях.

Сразу отметим, что парсинг не подразумевает взлом защиты этих источников.

Информация, как правило, общедоступна. Она находится в базах данных, в том числе сайтов, соцсетях и других информационных системах, к которым имеет доступ либо любой пользователь, либо авторизованный.

Как уже отметила, парсинг – это автоматизированный сбор информации. То есть, такую информацию собирают не вручную, а с использованием специальных программ.

Эти программы называют парсерами или скриптами. Программы могут быть обычные, а могут быть на основе ИИ. Парсингом могут заниматься, в том числе ИИ-агенты.

Про ИИ-агентов тоже писала на своем Телеграм-канале "IP - IT право с нуля"

Если "на пальцах", то представьте человека, работающего супербыстро, без выходных и сна, без чувства усталости. Этот «человек», как пользователь, обращается к сайтам, базам данных и т.п. с разными запросами, используя обычный интерфейс. По запросам он получает информацию и далее использует ее в своих интересах. Интересы могут быть разные: от использования полученной информации на своих ресурсах до, например, выбора оптимального варианта при покупке в онлайн магазине.

То же самое делают программы-парсеры.

2. Когда парсинг - это нарушение

При парсинге может извлекаться как существенная часть базы, так и несущественная.

С извлечением существенной части все более менее ясно – без согласия правообладателя нельзя, будет нарушение смежного исключительного права на базу

О смежных правах на базы данных подробнее см. в моем Телеграм-канале «IP – IT право с нуля» , а также мою статью на этом канале "База данных - объект авторских и смежных прав. Проблемы защиты и решения"

А что, если извлекается несущественная часть, но неоднократно.

Здесь все тоньше.

Статья 1335.1 ГК РФ разрешает лицу, правомерно пользующемуся обнародованной базой данных, без разрешения обладателя исключительного права - изготовителя базы данных извлекать из базы материалы и осуществлять их последующее использование.

Но только в следующих целях:

  • в целях, для которых база данных предоставлена пользователю. В договоре может быть наложено ограничение на объем использования;
  • в личных, научных, образовательных целях - в объеме, оправданном указанными целями;
  • в иных целях в объеме, составляющем несущественную часть базы данных.

То есть, запуск вместо себя ИИ-агента для подбора товара в онлайн магазине чем себе не личная цель.

Но и эти вольности могут быть ограничены, поскольку присутствует п. 3 названной статьи 1335.1 ГК РФ.

И положения этого пункта не допускают неоднократное извлечение ИЛИ (прим. автора: запомним этот союз) использование материалов, составляющих несущественную часть базы данных, если такие действия противоречат нормальному использованию базы данных и ущемляют необоснованным образом законные интересы изготовителя базы данных.

Когда же парсинг, при котором неоднократно извлекается и/или используется несущественная часть данных, может ущемлять интересы производителя БД (базы данных)?

Рассмотрим примеры.

Пример 1. (Дело № А40-18827/2017)

Это дело ООО «В Контакте» (та самая соцсеть) против ООО «Дабл» (ответчик).

Дело, фактически, стало классикой, в том числе и по вопросу, нарушает ли парсинг смежное исключительное право на базу.

Суть спора.

Ответчик создал программу для ЭВМ

Программа, используя поисковые системы, находила общедоступные данные пользователей соцсети (карточки пользователя).

Как указано в самом первом решении по данному делу: «Принцип сбора (извлечения) данных Ответчиком из Базы данных Истца заключается в выполнении автоматических сетевых запросов к Социальной сети Истца, анализа содержимого данных о конкретном пользователе (анализ профиля пользователя) и копировании таких данных на информационный носитель».

Далее, по лицензионному соглашению программа для ЭВМ была передана Обществу «Национальное бюро кредитных историй», которое использовало ее по назначению - в целях определения кредитоспособности физических лиц (тоже была привлечена как ответчик).

Казалось бы, что такого. Все законно. Программа легальная, информация выдается через поисковые запросы.

Но администратор соцсети посчитал, что информация о пользователях является частью его базы, при использовании программы незаконно извлекается содержимое базы.

Несмотря на тернистый путь данного дела, в конечном итоге информация о пользователях была признана базой данных и на основании ст. 1335.1 ГК РФ такой парсинг признан неправомерным.

Как он мешал Истцу? Можно настаивать на том, что при каждом использовании (оно было правомерным, никто ничего не взламывал) извлекалась незначительная относительно всей базы информация.

А были нарушены обязательства Истца (соцсеть) перед пользователями сети обеспечить защиту их персональных данных от неправомерного или случайного доступа к ним, копирования, распространения, воспроизведения, сбора, систематизации, хранения, передачи информации из Сети другим лицам в коммерческих целях.

И то, что парсинг третьим лицом не позволяет истцу исполнить принятые на себя обязательства по причинам, не зависящим от него, противоречит нормальному использованию базы данных, ущемляют законные интересы истца.

Нормальное использование базы данных предполагает не только надлежащее техническое ее использование, но и точное юридическое исполнение установленных правил пользования.

То есть, если парсинг не позволяет выполнить юридические обязательства перед пользователями, это нарушает интересы правообладателя.

И теперь посмотрим на другой случай.

Пример 2. Дело Amazon VS Perplexity AI, Inc. («Perplexity»)

Разногласия возникли между онлайн магазином Amazon и Perplexity AI, Inc. («Perplexity»). Амазон требует прекратить использование ИИ-агента Comet или любых других средств с целью скрытого проникновения на его сайты.

Данный ИИ-агент выступает в роли парсера, подыскивает товар для пользователя. Казалось бы, более личной цели не найти.

Но Amazon приводит следующие аргументы против агента Comet AI.

Его использование:

  • ухудшает клиентский опыт на платформе в ущерб клиентам и их отношениям с Amazon.

Агент может выбирать не самые выгодные цены и способы доставки, не учитывать возможности пользователя добиваться лучших условий (например, добавлять товары к существующим заказам для оптимизации доставки). Это снижает качество пользовательского сервиса, доверие клиентов и общее восприятие магазина Amazon.

Например, по мнению Амазон, Comet AI не предлагает возможность добавить товары к существующим заказам, что могло бы ускорить доставку и уменьшить объём отправлений. Comet AI ухудшает пользовательский опыт в Amazon.

  • нарушает безопасность ресурса и возможность адекватно защищать пользовательские аккаунты и данные Amazon.

Утверждается, что тот факт, что в магазине действует именно ИИ-агент, скрывается. Comet замаскирован под обычный браузер Chrome. Это препятствует прозрачности и контролю со стороны Amazon, что само по себе нарушает условия использования и подрывает безопасность, в том числе возможность адекватно защищать пользовательские аккаунты и данные Amazon.

Amazon, как утверждается, неоднократно просил Perplexity открыто идентифицировать Comet AI, однако Perplexity отказался это делать.

  • Amazon несет убытки из-за необходимости расследовать действия ИИ-агента, внедрять меры безопасности и постоянно блокировать несанкционированный доступ.

Насколько убедительны эти аргументы?

Ничего не могу сказать насчет реального нарушения безопасности ресурса при использовании данного ИИ-агента. Упоминается о том, что Comet AI уязвим к атакам через внедрение вредоносных запросов, фишингу, мошенничеству и другим киберугрозам.

Если это так, обеспокоенность Амазон вполне оправдана. Актуальна и проблема убытков в таком случае.

На мой взгляд, Амазон вправе требовать, чтобы действие ИИ-агента было прозрачным. В том числе, для выполнения своих юридических обязательств перед пользователями.

Даже если распределить зоны ответственности в пользовательском соглашении при использовании пользователями ИИ-агентов (ИИ-агент - риск пользователя), у платформы все-равно могут возникать неудобства. При проблемах каждый раз придется разбираться, кто виноват.

По поводу ухудшения клиентского опыта.

Аргумент ли это?

С одной стороны, да. Живой пользователь, работая с платформой, реально может проникнуться к ее возможностям, сервису и по этой причине свои покупки совершать преимущественно через этот сервис. Спрос, соответственно, рождает предложение. Безусловно, работа с живым пользователем платформе выгодна.

С другой стороны, моя реакция как пользователя: «А в компетенции ли это Амазон, говорить (указывать) мне, покупателю, как мне заходить – лично или с использованием ИИ-агента или, например, через посредника-человека? Мое сугубо личное дело.

С третьей стороны, работая с тем или иным Интернет -ресурсом, мы принимаем пользовательское соглашение, как мы обязаны использовать ресурс. Вроде как должны ему следовать. Никто не принуждает.

Казалось бы, вопрос решен. Я, как изготовитель базы данных, имею право разработать ресурс и установить правила его использования, в том числе запрет на использование любых парсеров и даже объяснить это благими намерениями и юридическими обязательствами. Пользователь, в свою очередь, либо принимает условия, либо нет.

Но на сцену выходит антимонопольное законодательство.

Не является ли запрет использования ИИ-агента или любой программы-парсера использованием своего монопольного положения на рынке?

Не лишает ли блокировка парсеров рынок новых инструментов поиска или не снижает ли качество услуги для конечного пользователя?

Может ли платформа произвольно ограничивать использование публично доступных данных только собственными технологиями?

И проблема не надумана, история знает примеры.

Пример 3. (Дело № А40-70134/2020)

Известно как дело правообладателя программного обеспечения по автоматизированному подбору персонала "Робот Вера" (далее - ПО "Робот Вера") в отношении Хедхантера – известного сервиса по подбору персонала.

ПО использовали пользователи, получившие законный доступ к базе данных резюме на сайте hh.ru, а сервис, в свою очередь, осуществлял блокирование таких пользователей.

Правообладатель ПО довел дело до ФАС РФ и антимонопольная служба увидела нарушение антимонопольного законодательства со стороны сервиса по подбору персонала (Решение ФАС РФ от 23.01.2020 по делу № 11/01/10-9/2019).

ФАС посчитал, что действия Хедхантер, занимающего доминирующее положение на рынке услуг по подбору персонала, привели к созданию для правообладателя ПО "Робот Вера" препятствий к доступу на товарный рынок услуг по обеспечению информационного взаимодействия соискателей, работодателей и кадровых агентств в информационно-телекоммуникационной сети "Интернет", что привело к ущемлению его интересов на указанном товарном рынке.

Далее суды, вплоть до Верховного Суда, поддержали позицию ФАС РФ и правообладателя ПО.

Получается, что привлечение антимонопольного законодательства вполне рабочий инструмент.

3. Выводы

Вопрос о законности парсинга даже при несущественном неоднократном извлечении и использовании информации весьма неоднозначен.

Итоговый вывод зависит от множества обстоятельств: кто совершает парсинг, с каких ресурсов, в каких целях, может ли парсинг привести к нарушению обязательств ресурса перед пользователями, возникновению ущерба у правообладателей в связи с необходимостью отслеживать деятельность ИИ-агентов и принимать меры по усилению безопасности ресурса, нарушает ли антимонопольное законодательство запрет на использование парсеров.

Проблема паркинга весьма интересна и требует творческих нестандартных подходов со стороны юристов.

Пишите, если будут вопросы. Связь со мной через Телеграм @NataBeres (в том числе по наставничеству).

➡️Получить больше информации можно из моих статей в подборках:

подборка "Налогообложение в сфере IP/IT".

подборка «Программы для ЭВМ и базы данных»,

подборка "Товарные знаки, изображения, фотографии и др. Как не нарушить права на них",

Отдельно рекомендую ознакомиться со статьями:

«Использование Хеш-суммы в качестве доказательства тождественности файлов (РИДы, закупки и др.)»

«Защита сайта через защиту его дизайна. Сначала проверим, внесена ли творческая компонента»

«SaaS – услуга или лицензия на ПО»,

«БАЗА ДАННЫХ- объект авторских и смежных прав. Проблемы защиты и решения»,

«Искусственный интеллект оставили без прав? Или революция отменяется»

Заходите в Телеграм-канал «IP – IT право с нуля».

Канал особенно полезен для начинающих в сфере IP-IT права юристов и предпринимателей.

©Береснева Н.В. 24.11.2025