Новые клиенты часто спрашивают о законности нашего бизнеса. Это логично. У парсинга не лучшая репутация, ведь он позволяет бизнесу получить преимущество перед конкурентами. Из-за этого им часто злоупотребляют: нарушают авторские права и перегружают трафик сайта-источника.
Чтобы разобраться какой парсинг разрешен, а какой нет — нужно понять: чем вообще является парсинг в юридическом смысле.
Парсинг в юридическом смысле
Парсинг — это автоматизированный сбор данных из интернета без использования API. Поведение парсера напоминает поведение человека: он также переходит по ссылкам веб-сайта и копирует нужные ему данные. Однако он может делать это в тысячи раз быстрее.
Данные интернет-магазинов находятся в открытом доступе и, по идее, парсер не должен вызывать проблем с законом. На практике все сложнее, ведь еще есть конкуренция и бесполезная нагрузка, которую создают боты. Давайте разбираться.
В российском законодательстве нет статьи, где четко написано, что и как можно парсить, а что нельзя. Однако есть нормы по парсингу персональных данные и несколько статей, которые можно отнести к запрету парсинга. Подробно о них мы поговорим чуть позже.
Спорные юридические ситуации при парсинге в целом неизбежны. В России самое известное судебное дело произошло между ООО «Дабл» и ООО «Вконтакте», итогом которого стал запрет парсинга персональных данных в открытом доступе без письменного согласия каждого, кому эти данные принадлежат.
Чтобы избежать блокировок или ненужных судебных тяжб, нужно знать, какие законы могут вообще ограничивать или запрещать парсинг интернет-магазинов.
Законы и ограничения парсинга интернет-магазинов
Их все можно разделить на три правовых блока:
- Правила о гражданско-правовой ответственности и о причинении вреда имуществу.
- Право интеллектуальной собственности.
- Нормы договорного права.
Поговорим о каждом пункте поподробнее.
1. Причинение вреда имуществу
Да, тяжело говорить о порче имущества, когда речь идет о данных в интернете. Однако серверы, которые обрабатывают запросы от пользователей, — вполне реальная вещь, и ей боты могут навредить.
Да, один парсер не может нагрузить современный сервер, но что если их будут тысячи? Даже сервера крупных интернет-магазинов (Amazon и т.п.) без проблем с архитектурой и защитой от парсинга ощущают нагрузку от ботов. Рядовые же веб-сайты под наплывом ботов могут начать обрабатывать запросы пользователя около минуты или вовсе упасть.
Перебои в работе интернет-магазина ведут к потере прибыли. В правом поле это называется упущенная выгода. Если удастся доказать, что, к примеру, интернет-магазин не работал 3 часа из-за ботов физического лица или компании, то владелец интернет-магазина вправе требовать упущенную прибыль с нарушителя.
Однако тут возникают проблемы:
- Нужно доказать, что сервер упал именно из-за парсинга, а не из-за кривой архитектуры и плохой защиты от ботов
- Нужно доказать, что парсинг является правонарушением
- Нужно найти нарушителя, чтобы подать на него в суд. Сделать это непросто, потому что вычислить его самостоятельно практически невозможно без помощи полиции. Однако они будут заниматься таким розыском при нарушении уголовного кодекса, а не гражданского
- Нужно доказать, что вы действительно потеряли такую сумму, которую просите
Во времена, когда сервера обладали куда меньшей вычислительной мощностью (15-20 лет назад), проблема была гораздо актуальнее, чем сейчас. Однако и сейчас аргумент о том, что бот паразитируете на чужом ресурсе, скорее всего будет озвучен в суде. Как в том же деле между компаниями «Вконтакте» и «Дабл».
2. Интеллектуальная собственность
Для интернет-магазина интеллектуальная собственность это, в первую очередь, описания и фотографии товаров, что следует из ст ГК РФ Статья 1259. При торговле через интернет их качество критически важно для продаж.
Крутые интернет-магазины не скупятся вкладывать деньги в свои карточки товаров. Ведь это фишка, которая выделяет их среди конкурентов. Из-за этого они часто перестраховываются на случай плагиата с помощью водяных знаков на фото, сохранения дат создания текста и т.п.
Но не только текст может быть защищен авторским правом. Страницы, дизайн и планировка интернет-магазина тоже могут быть защищены, потому что считаются творческой работой. Поэтому при их копировании или юридически «воспроизведении» правообладатель имеет право обратиться в суд.
Сайты поставщиков-производителей обычно не преследуют тех, кто парсит их сайт, или дают на это письменное разрешение. Дело в том, что перед производителем часто не стоит вопрос, у кого купят его продукцию, потому что только он ее и производит.
3. Договорное право
У интернет-магазинов есть такая штука как условия использования или пользовательское соглашение. Их можно найти в футере почти любого сайта. Их редко читают, но это договор, и он имеет реальную юридическую силу. Если в нем написано, что штраф за парсинг миллион рублей, то владелец интернет-магазина вполне может потребовать его с вас.
Впрочем, чтобы договор имел силу, нужно доказать, что пользователь его прочитал, с ним согласился и как бы «подписал». Есть два типа соглашений: click-wrap и browse-wrap.
Click-wrap — это когда нужно нажать кнопку или поставить галочку «Я согласен с условиями» после ознакомления с условиями использования сайта. Вы соглашаетесь, и с этого момента договор вступает в силу.
Browse-wrap — это когда договор находится на какой-то странице сайта, и вам нужно самому зайти туда и прочитать. При этом от вас не требуют ставить галочки или что-то подобное. Вы соглашаетесь с договором просто тем, что продолжаете использовать сайт.
Доказать, что пользователь действительно согласился с договором browse-wrap и был осведомлен о его содержимом куда сложнее, чем с договором click-wrap. Из-за чего первый почти не используют.
При регистрации на сайте интернет-магазина пользователь, как правило, обязан прочитать и принять пользовательское соглашение. Незарегистрированных же пользователей нельзя идентифицировать и, как следствие, с ним нельзя заключить договор.
Допустимые виды парсинга интернет-магазина
В итоге получается, что парсинг интернет-магазинов законен, если:
- Информация находится в открытом доступе и не защищается законодательством об авторских и смежных правах.
- Автоматизированный сбор информации осуществляется законными способами.
- Автоматизированный сбор информации не приводит к нарушению в работе интернет-магазина в интернете.
- Автоматизированный сбор информации не приводит к ограничению конкуренции.
Из этого следует, что можно выполнять:
- Само-парсинг, т.е. анализ своей продукции. Он используется для отслеживания информации о наполнении сайта: анализ «битых» ссылок, ошибок в описаниях товара, отображения наличия товаров и т.п.
- Мониторинг цен конкурентов
- Парсинг контента, который не является объектом интеллектуальной собственности или, если у вас есть письменное соглашение от владельца контента
- Парсинг любой информации интернет-магазина при письменном соглашении владельца
Морально-этические вопросы
Допустим ваш парсинг интернет-магазина не нарушает законодательство, но он все равно создает неудобство владельцу: бесполезная нагрузка на серверы от бота никуда не делась; контент, даже без защиты авторского права, кому-то принадлежит и существует для живых пользователей, а не для ботов.
Для начала вы всегда можете попросить у владельца интернет-магазина разрешение на парсинг, и проблем не будет. Хотя бизнесмены, которые парсингом не пользовались, часто настроены к этому негативно.
Еще есть одно большое НО — конкуренция. Это не значит, что можно воровать контент или заваливать интернет-магазин запросами от ботов ради прибыли. Но не использовать в рамках закона инструмент, который помогает вам анализировать рынок, экономит сотни человеко-часов — неразумно.
Конкуренты применяют парсинг повсеместно и если вы от него откажитесь только по этическим соображениям, то окажетесь на шаг позади.
Советы при парсинге интернет-магазинов
- Если возможно, то используйте API вместо парсинга
- Не нарушайте условия пользовательского соглашения и правила для ботов в robot.txt
- Не перегружайте сервер запросами от бота. Мы используем 1-2 запроса в секунду
- Проверяйте, имеете ли вы право публиковать данные, которые спарсили
- Если вы сомневаетесь в законности того, что делаете – не делайте это. Спросите совета у юриста или почитайте статьи
Итоги
Итак, мы пришли к выводу, что парсинг интернет-магазинов законен. Однако нужно помнить об ограничениях и нюансах. Иногда они приводят к полному запрету парсинга или создают юридические сложности.
Подвергайте сомнению советы о законности парсинга, которые вы прочитали в интернете (даже те, которые находятся в этой статье). Как минимум законодательство на момент прочтения статьи может измениться, и она станет неактуальной. Рекомендуем консультироваться с юристами.
Правовая практика
В среде парсинга нет четких юридических рамок, поэтому конфликтные ситуации часто решаются через суд. А вот их решения уже используют, чтобы регулировать похожих судебных делах.
В Европе и США парсинг стали использовать раньше, чем в России. В большинстве случаев, суд становился на сторону владельца информации, чем на сторону тех, кто пользовался парсингов. Подробнее об этих случаев читайте в этой статье.
В России же есть только один значимый судебные процесс
Мы не будем вдаваться в судебные тяжбы и давать свою оценку ситуации. Вместо этого вы узнаете, что суть дела, решение суда на момент написания этой статьи и как это влияет на законность парсинга в России в целом.
- Самое известное дело о запрете парсинга данных пользователей «ВКонтакте» между социальной сетью и сколковской компанией ООО «Дабл».
Суть: Дабл собирали данные пользователей социальной сети ВКонтакте . Затем эти данные использовались для предоставления скоринговых услуг банкам.
Решение: МОСКВА, 6 июл. Девятый арбитражный апелляционный суд по иску ООО «ВКонтакте» запретил сколковской компании «Дабл» (бренд Double Data) извлекать из социальной сети и использовать персональную информацию пользователей, следует из информации в картотеке арбитражных дел и подтвердили представители сторон.
Влияние: судебная практика РФ пополнилась решением, которое признает базу данных пользователей, как интеллектуальную собственность
Комментарий: если решение суда не будет обжаловано, то фактически
Сам по себе парсинг — инструмент для автоматического сбора информации с веб-страниц, он не плохой и не хороший. Законность его применения зависит от того, какие данные вы парсите и как потом их используете.