Измерения в экономике авторского права на основе сканирования трафика в сети интернет

Вид материалаАвтореферат

Содержание


Веб-сайт торрент-трекера
Подобный материал:
1   2   3
Глава 2 «Инструменты измерений в цифровой экономике» посвящена разработке собственного инструментария для измерений в экономике авторского права с применением технических средств, математических моделей и традиционных инструментов для социологических измерений (опросов). Принципиальную новизну и эффективность данного инструмента обеспечивает наличие в нем программных средств, обеспечивающих сбор и первичный анализ огромных массивов информации (миллионы транзакций в р2p сетях). Сама возможность сканирования трафика в Интернет является далеко не очевидной, она связана с техническими особенностями конкретных информационных технологий (в данном случае – это торренты), а они быстро меняются. Однако изменение технологий обмена файлами, закрывая одни возможности, обычно открывает другие. Важно также и то, что вся собираемая информация изначально представлена в стандартизованном виде, что связано опять таки с информационными технологиями. Только благодаря этому обработка полученных массивов информации оказывается возможной и по времени, и по количеству затраченных усилий.

Важно отметить, что с помощью прямого сканирования трафика в Интернет удается получить как раз те данные, которые невозможно или очень трудно получить на основе традиционных методов измерений типа опросов, обработки статистических данных и т.п. В любом случае, результаты опросов в какой-то части дают искаженный результат, поскольку нельзя полностью убрать интересы и задающего вопросы, и отвечающего на них. Но это не означает, что данные опросов вообще не используются. Они используются, но только в той части, где искажение информации может быть лишь случайным, мотивы для искажений отсутствуют. Например, к числу таких вопросов можно отнести вопрос: откуда вы берете нелегальные копии фильмов для просмотра? Из Сети или на дисках? Если респондент не хочет говорить, что он использует пиратские копии, то его ответ просто не влияет на результат. Данные полученные прямым сканированием трафика, из справочников и путем опросов с использованием лишь нейтральных вопросов, объединены в рамках простой математической модели.

В разделе 2.1 главы 2 предлагается модель кинотеатральных сборов с учетом параметра информационной асимметрии и на ее основе проводится анализ кинотеатральных сборов. Показано, что статистика сборов по первым двум неделям проката, почти полностью определяет дальнейшие сборы. Тем самым появляется возможность уменьшить промежуток сканирования трафика, т.е. нет необходимости отслеживать весь период показа фильма (достаточно двух первых недель). Этот результат имеет чисто технический характер, поскольку в принципе ни что не мешает отслеживать весь период показа фильма. Возрастает лишь объем обрабатываемых данных.

Далее в 2.2. описана система распространения цифрового контента, дан обзор р2р технологий обмена файлами, приводится статистика российских р2р (пиринговых) сетей и описывается инструментарий для измерения файлообмена. Система распространения цифрового контента (фильмов и музыки) в сети условно разделена на глобальный и локальный уровни. К элементам глобального уровня файлообмена относятся пиринговые сети и иные файлообменные сервисы, к локальному уровню файлообмена можно отнести Samba-серверы, ftp-серверы, DC++ хабы или локальные p2p-сервисы, а также ретрекеры. Ретрекер (retracker, также встречается термин псевдотрекер) — технология оптимизации обмена БитТоррент (bittorrent) трафиком внутри локальных сетей. Ретрекер позволяет установить прямое соединение по протоколу БитТоррент между абонентами одного оператора (или нескольких операторов, имеющих соглашение об обмене локальным трафиком), каждый из которых использует внутренний (локальный) IP-адрес. Развитие второго уровня файлообмена стимулируется провайдерами для расширения или удержания абонентской базы, а также с целью оптимизации расходов и нагрузки на каналы связи (чему также способствуют ретрекеры). В этой связи внимание законодателей заостряется на ответственности провайдеров (Концепция совершенствования Раздела VII Гражданского кодекса Российской Федерации «Права на результаты интеллектуальной деятельности и средства индивидуализации»).

В таблице 2 представлена статистика, доступная на веб-сайтах наиболее популярных русскоязычных торрент-трекеров. Популярнейшим и крупнейшим российским торрент-трекером является rutracker.org (бывший torrents.ru). rutracker.org (ex. torrents.ru) занимает лидирующую позицию среди русскоязычных торрент-трекеров. По количеству пользователей 54% среди крупнейших российских трекеров (включая узкоспециализированные трекеры). По количеству раздач rutracker.org превосходит ближайшего конкурента (nnm-club.info) в 8.4 раза. В общем объеме контента, размещенного на торрент-трекере torrents.ru 12,75% раздач торрент-трекера приходится на раздел «Кино». Результаты сканирования трафика торрент-трекера позволили рассмотреть аудиторию торрент-трекера rutracker.org (torrents.ru). Значительное количество пользователей (около 30%) находится за пределами РФ – в странах ближнего, а также дальнего зарубежья. Объем пиров остальных «крупных» трекеров не превышает 30% от общего объема. Учитывая, что в общем объеме пиров существенную долю составляют кинофильмы, превосходящие по объему занимаемого дискового пространства другие виды контента, объем пиров торрент-трекера характеризует количество фильмов размещаемых на нем.

Таблица 2. Крупнейшие русскоязычные торрент-трекеры

Веб-сайт торрент-трекера

Название

Кол-во польз-ователей

Пиров

Сидов

rutracker.org (torrents.ru)

Национальный BitTorrent трекер TORRENTS.RU

3 810 194

9 557 120

9 557 120

nnm-club.info

Интеллигентный трекер России :: NNM-Club.ru

495 080

258 724

258 724

tfile.ru

tfile.ru - быстрый торрент-трекер

1 290 518

1 645 952

 

streamzone.ru

StreamZone

116 085

47794

44371

RuTor.Org

RuTor.Org :: Коллекция торрент ссылок

1 675

 

 

novafilm.tv

Novafilm.TV - Лучшие сериалы мира!

319 960

 

 

lostfilm.tv

LostFilm.TV - уникальный ресурс о сериалах

1 027 287

1 310 222

 


Для проведения исследования на основании обширных данных было произведено сканирование трафика с использованием созданного специального программного обеспечения. В ходе выполнения работы был решен следующий перечень задач:
  • Разработано программное обеспечение «бегунок» для сканирования торрент-трекера (crawler). Данное программное обеспечение позволило осуществить сбор детальных данных о файлообмене путем прямого сканирования Веб-сайта торрент-трекера rutracker.org (torrents.ru);
  • Произведено сплошное сканирование данных и собрана обширная информация о раздачах и пользователях торрент-трекера rutracker.org (torrents.ru). Информация собиралась с Веб-сайта торрент-трекера на протяжении месяца. Собрана база данных по состоянию на февраль 2009 года.

Бегунок имеет следующий механизм работы:

1) Производится сканирование Веб-сайта торрент-трекера torrents.ru.

2) Собирается информация о местоположении пользователей с использованием библиотеки libtorrent13.

Далее приводится описание модели для расчета натурального показателя, характеризующего объем нарушений исключительных прав на фильмы в результате незаконного оборота их копий в Интернет. На основе этого показателя, рассчитываемого с относительно высокой точностью14 на основе объективных данных, далее может быть построена оценка потерь киноиндустрии от файлообмена и оценка выгод, получаемых теми пользователями Интернет, не имеющими возможности посмотреть фильмы в кинотеатре. В основу модели для оценки ущерба заложена простая идея, всегда используемая в отраслевых исследованиях. А именно, потери индустрии кино в деньгах определяются как произведение средней цены билета на количество потенциальных зрителей, не пришедших в кинотеатры по причине доступности через сеть незаконных копий фильмов, идущих в кинотеатрах. При этом средняя цена билета – показатель, доступный из справочников.15 Аналогично можно оценить выгоды от просмотра в сети для тех, кто не имел возможности посмотреть фильм в кинотеатре. В том и другом случае для начала нужно получить показатель общего числа посмотревших фильм благодаря его распространению через Интернет.

При определении ущерба кинотеатров трудность состоит в определении второго сомножителя – числа потенциальных зрителей, не пришедших в кинотеатры. Измерить его непосредственно невозможно, однако логично предположить, что это число не больше, чем число лиц, посмотревших полученные через Сеть незаконные копии и не посмотревших фильм в кинотеатре при наличии такой возможности. Этот показатель в принципе поддается измерению через сканирование и анализ трафика с учетом возможности дальнейшего распространения через локальную сеть и просмотра одной копии фильма более чем одним лицом.

Было бы крайне наивно предполагать, что каждый просмотр фильма полученного незаконным путем – это потерянный кинотеатрами зритель, который непременно пошел бы в кинотеатр и купил бы билет, если бы не было возможности посмотреть незаконно полученную копию фильма. Разумеется, это не так. Тем не менее, за основу расчетов естественно взять именно число просмотров незаконных копий тех фильмов, которые идут в кинотеатрах, но далее надо учесть целый ряд обстоятельств, а именно:
  1. Часть потребителей скачиваемых фильмов проживают в условиях, делающих посещение кинотеатра ради просмотра фильма практически невозможным. Это относится к лицам, проживающим в странах, где фильмы на русском языке не идут в кинотеатрах, к жителям удаленных населенных пунктов, где нет кинотеатров, людям с ограниченными физическими возможностями и т.д. Кроме того, сюда же могут быть отнесены лица, не имеющие возможности посещать кинотеатр по причине низкого материального достатка. Однако эта категория людей вряд ли имеет необходимую для просмотра технику и доступ к широкополосному Интернету. Скачивание не для них.
  2. Часть потенциальных кинозрителей приобретают и просматривают незаконные копии фильмов исключительно в целях ликвидации информационной асимметрии. Из них лишь часть не придет в кинотеатры, но именно потому, что фильм им не интересен.
  3. Лица, просматривающие незаконно скачанные фильмы из других соображений далеко не всегда отказываются от последующего просмотра фильма в кинотеатре. Копия (а в особенности цифровая) обычно обладает более низким качеством по сравнению с оригиналом или у нее недостает дополнительных элементов, таких как большой экран, качественная звуковая и видеоаппаратура, комфортные сиденья, возможность приобрести дополняющие товары (попкорн, кока-кола и т.д.). Многие кинозрители вообще рассматривают посещение кинотеатра как иной продукт, отличный от просмотра в домашних условиях. Часто посещение кинотеатра входит в комплект похода за покупками.

Чтобы получить приблизительное число всех лиц, просмотревших копии фильмов, изначально скачанные с торрент-трекера, надо учесть альтернативные возможности скачивания, прежде всего, через локальные сети. Для этого используются повышающие коэффициенты. Далее они обозначаются символами Xi, где i – индекс, принимающий значения от 1 до 3. При этом смысловое значение коэффициентов определяется следующим образом:

X1 – масштабирующий коэффициент для перехода от числа скачиваний с конкретного торрент-трекера к общему числу скачиваний со всех российских торрент-трекеров. В качестве приблизительного значения данного коэффициента можно взять величину, обратную доле пользователей данного торрент-трекера от числа всех пользователей российских торрент –трекеров. При необходимости эту величину можно уточнить с учетом специализации торрент-трекеров.

X2 – коэффициент перехода от прямого скачивания с торрент-трекеров к общему числа скачиваний цифровых копий с учетом скачивания через локальные сети (второй круг файлообмена). Этот коэффициент определяется путем опроса пользователей и анализа его результатов.

X3 – среднее число лиц, просматривающих одну нелегальную копию. В это число входит также копирование у друзей.

Так же необходимо вычесть тех потребителей незаконных копий фильма, которые не имеют возможности посмотреть его в кинотеатре, а также тех, кто смотрит копии для предварительного ознакомления с фильмом. Для этого вводятся понижающие коэффициенты K1 и K2, где

K1 – позволяет учесть то, что часть потребителей незаконных копий фильма не имеет доступа к легальному продукту, в том числе проживающих за рубежом или в местах, где нет кинотеатров.

K2 - позволяет учесть то, что часть потребителей пользуется копиями для получения детальной информации о характеристиках продукта и после ознакомления посещает кинотеатр.

В общем виде формула для вычисления количества потенциальных зрителей, а точнее, для его оценки сверху имеет вид:

YQ=K1*K2*(DCCamRip*KCamRip+DCTS*KTS+DCDVDRip*KDVDRip)*X1 *X2 *X3

или в упрощенном виде

YQ ≈ K1*K2 *DCDVDRip*X1 *X2 *X3

Теоретически можно считать, что YQэто число потенциальных зрителей, не пришедших в кинотеатры в силу того, что они посмотрели фильм в копии, скачанной через торрент-трекер. Умножив эту величину на среднюю цену билета P, можно получить некоторую оценку потерь киноиндустрии в деньгах. Эта оценка учитывает основные обстоятельства, упоминаемые выше, кроме наличия рынка пиратских дисков, в том числе, наличие такого рынка в городах, где есть и кинотеатры, и относительно дешевый широкополосный доступ к Сети. С учетом последнего фактора можно с большой долей уверенности утверждать, что число YQ отражает не столько число потенциальных зрителей фильма, не пошедших в кинотеатр, сколько число вытесненных с рынка пиратских дисков с тем же фильмом, что может быть подтверждено отдельным исследованием. На практике имеет место и то, и другое.

В главе 3 «Оценка потерь кинотеатральной отрасли» описаны расчеты входных данных (коэффициентов) для разработанной модели оценки потерь кинотеатральной отрасли. Часть коэффициентов определяется по результатам опроса пользователей Интернет (300 жителей РФ и 250 студентов МФТИ).

В ходе опроса респондентам задавался 31 вопрос четырем разделам: «Социодемографические характеристики», «Кинотеатральный показ», «Потребление кинопродукции на носителях», «Потребление медиаконтента в сети Интернет».

Опрос проводился с целью определения ряда коэффициентов, а так же для проверки гипотез. К набору рабочих гипотез опроса можно отнести следующие:
  • В результате высокой стоимости Интернета в регионах файлообмен происходит на локальном уровне файлообмена (в локальных сетях), в мегаполисах более популярен глобальный уровень файлообмена (пиринговые сети и т.д.);
  • Ряд потребителей использует цифровые копии с целью устранения информационной асимметрии и после ознакомления, если фильм понравился, отправляется в кинотеатр;
  • Кинопроизводители эксплуатируют эффект информационной асимметрии и существенная доля кинофильмов не удовлетворяет потребительских ожиданий;
  • Посещение кинотеатра и просмотр в домашних условиях являются, в некоторой степени, различными продуктами. Публика обладает желанием смотреть качественные и зрелищные кинофильмы в кинотеатре, менее зрелищные в домашних условиях;
  • Для различных категорий потребителей стимулами к посещению кинотеатров могут являться желание провести время с друзьями и близкими, так и желание просмотреть зрелищный фильм на большом экране.


Основные результаты проведенного опроса:
  • Вследствие более высокой стоимости Интернета в регионах файлообмен происходит на локальном уровне файлообмена (в локальных сетях), в мегаполисах более популярен глобальный уровень файлообмена (пиринговые сети и т.д.);
  • Среди опрошенных 13% использует цифровые копии с целью устранения информационной асимметрии и после ознакомления, если фильм понравился, отправляется в кинотеатр;
  • Кинопроизводители прибегают к использованию в своих целях эффекта информационной асимметрии: 22% жителей РФ ответили, что каждый второй просмотренный в кинотеатре фильм не оправдал ожиданий, 33% жителей РФ ответили, что каждый третий просмотренный в кинотеатре фильм не оправдал ожиданий;
  • Желание просмотреть зрелищный фильм на большом экране является главным стимулом к походу в кинотеатр.

Далее для определения общего числа скачиваний используется предложенная модель, включающая понижающие и повышающие коэффициенты. Проводится определение основных коэффициентов модели и проводится расчет потерь кинематографической отрасли на примере кинофильма «Суррогаты» с использованием предложенной модели.

Коэффициент X1 определяется на основании статистики по торрент-трекерам. Торрент-трекер RuTracker.org на момент сбора статистики имел 3,8 млн. чел., при этом совокупное число пользователей российских торрент-трекеров пиринговых сетей составляло 7,8 млн.чел. Таким образом X1 = 7,06 млн./3,8 млн = 1,853.

Коэффициент X2 определяется на основании результатов проведенного опроса. Опрошенным задавался вопрос про источник загрузок копий кинофильмов по видам источников. Среди ответивших 45% указали в качестве источника «Пиринговые сети с торрент-трекерами (rutracker.org, и т.д.)», таким образом X2 = (Локальная сеть+ Файлообменники+Пир.сети)/Пир.сети = 1,98. Среди опрошенных 11% указали, что «копируют у друзей». Таким образом, определим коэффициент X3 (число лиц просмотревших одну копию) равен 1,24. Получим X1*X2 *X3 = 4,56

Значение коэффициента K1 = 0,711 получается из анализа трафика, полученного в результате использования ПО. K1 =0,711. Строго говоря, он несколько завышен, поскольку учтены только пользователи, проживающие в других странах. Не учтены пользователи, не имеющие возможность смотреть фильм в кинотеатре, но их, вероятно, не так уж много, поскольку в российской глубинке широкополосный Интернет не более доступен, чем кинотеатр.

Значение коэффициента K2 = 0,86 получено путем анализа статистических данных, включая результаты опроса потенциальных пользователей. В ходе опроса, на вопрос «Просматриваете ли Вы копии с целью ознакомления (и после просмотра копии отправляетесь в кинотеатр для просмотра оригинала)?» утвердительно ответили 14% опрошенных. Величина коэффициента также завышена, поскольку не учитывается тот факт, что потенциальные зрители могли не посетить кинотеатр не потому, что посмотрели фильм в копии, а по каким-то другим причинам. Помимо цены билета сдерживающими факторами могут быть также неудобное время сеансов или ограниченность свободного времени, необходимость добираться до кинотеатра и много другое.

Параметры DCDVDRip , K1 и X1 определяются на основе объективных показателей, а именно, анализа трафика, количества и состава пользователей торрент-трекера. Это позволяет полностью исключить субъективный фактор при определении этих коэффициентов и рассчитывать их с большой точностью, несмотря на огромные объемы обрабатываемой информации (миллионы транзакций).

Коэффициенты K2 , X2 и X3 определяются путем опроса пользователей и анализа его результатов. Здесь субъективный фактор полностью исключить невозможно. Однако нет оснований считать его сколько-нибудь существенным, поскольку у всех участников опроса отсутствует заинтересованность в искажении результатов. В частности респондент никак не заинтересован в искажении результата, отвечая на вопрос – пользуется ли он для скачивания торрент-трекером или локальной сетью. То же относится к другим вопросам. Поэтому вопрос состоит только в представительности используемой выборки, а его современная техника социологических вопросов позволяет успешно решить. Таким образом, используя прямое сканирование для определения DCDVDRip и стандартную технику для определения коэффициентов, можно получить достаточно точное число потенциальных зрителей, посмотревших копии фильма, скачанные из Сети, и при этом не посмотревших фильм в кинотеатре.

Теоретически можно считать, что YQэто число потенциальных зрителей, не пришедших в кинотеатры в силу того, что они посмотрели фильм в копии, скачанной через торрент-трекер. Умножив эту величину на среднюю цену билета P, получим некоторую оценку потерь киноиндустрии в деньгах. Эта оценка учитывает основные обстоятельства, упоминаемые выше, кроме наличия рынка пиратских дисков, в том числе, наличие такого рынка в городах, где есть и кинотеатры, и относительно дешевый широкополосный доступ к Сети. С учетом последнего фактора можно с большой долей уверенности утверждать, что число YQ отражает не столько число потенциальных зрителей фильма, не пошедших в кинотеатр, сколько число вытесненных с рынка пиратских дисков с тем же фильмом, что может быть подтверждено отдельным исследованием. На практике имеет место и то, и другое.

По мере того, как рынок пиратских дисков будет исчезать, можно будет говорить о том, что величина YQ все более точно отражает количество потерянных зрителей, а величина P * YQ – потери киноиндустрии в деньгах.

В качестве тестового примера определения величины потерь в количественном (число нереализованных билетов) и в денежном выражении проведен расчет на примере кинофильма «Суррогаты». Результаты анализ сканирования трафика приведены в таблице 3, где сопоставлены данные о количестве скачиваний и данных о числе посетителей кинотеатров.