Зосимова Ирина Викторовна построение системы понятий для оценки деятельности операторов связи магистерская диссертация

Вид материалаДиссертация
1.4 Обзор существующих решений и новизна данной работы
Подобный материал:
1   2   3   4   5   6

1.4 Обзор существующих решений и новизна данной работы




Первые статьи о поиске мошенничества со стороны абонентов с помощью построения профилей и методов Data Mining (нейронных сетей) появились еще в середине 90-х годах [10][11].

Вот, например, описание методики, использованной Yves Moreau, Joos Vandewalle:
  • Строится профиль абонента со следующими параметрами: соотношение местных, междугородних и международных вызовов, количество вызовов, трафик и др.
  • На вход нейронной сети подается два вектора (профиля), представляющие “макроповедение” (за длительный период времени) и “микроповедение”(текущее поведение).
  • На выходе получаем вероятность того, что, данное поведение абонента является мошенничеством (точнее, является ли данный профиль мошенническим или нет).

Построение профиля поведения абонента используется в данный момент практически во всех современных коммерческих системах гарантирования доходов: Fraud Management Solution от HP (HP FMS), InsightNet Fraud Detection от Comarch, Fraud Detect от TTI Telecom, Система Обнаружения Мошенничества и Анализа Потерь (далее СОМАП) от IBS.

Подходы различных компаний к анализу профилей поведения абонентов можно разделить по используемым методам:
  • статистические,
  • методы Data Mining;

и по области анализа:
  • изменения профиля во времени,
  • сравнение профиля абонента и профиля группы абонентов.

Большинство компаний – разработчиков систем гарантирования доходов - использует первый подход по используемым методам, и могут поддерживать оба подхода по области анализа.

Так, например, в СОМАП используются только статистические методы: вычисление средних значений и среднеквадратичных отклонений. Абоненты делятся на группы априорно, с использованием фонового знания. Например, для проводного оператора можно выделить две группы абонентов: физические и юридические лица. Для каждой группы подсчитывается средний профиль группы: высчитывается среднее по абонентам значение каждой характеристики. В дальнейшем профили абонентов сравниваются с профилем группы, высчитывается похожесть. Алгоритм вычисления похожести следующий: если значение суммарного трафика за период (количества вызовов, количества уникальных номеров) больше среднего значения трафика профиля группы (количества вызовов, количества уникальных номеров) в 2 раза, тогда похожесть для этого абонента и данной характеристики по данной мере равна 0, иначе высчитывается значение похожести. Затем для каждого абонента выводится количество характеристик, одинаковых с характеристиками в группе, и рассчитывается их суммарная похожесть. На основании данной информации строятся отчеты об абонентах, чей профиль сильно отличается от профиля своей группы, или похож на профиль другой группы.

Также СОМАП поддерживает поиск абонентов, чей профиль сильно меняется во времени. Задаются пороги на количество характеристик, которые могут поменятся в течение данного периода времени.

Стоит выделить системы, которые позволяют строить профиль не только для единственной сущности – абонента, но и выделять другие сущности для анализа. Система Fraud Detection от TTI Telecom в качестве анализируемой сущности позволяет выбрать почти любое поле CDR-файла, вплоть до страны назначения. Мерами для анализа поведения выбранной сущности могут быть суммарная длительность, количество вызовов, средняя длительность, стоимость, количество CDR-файлов. Измерениями (то, что в СОМАП называется характеристикой) могут быть, например, часть дня (утро, день, вечер, ночь) или причина разъединения (успешное соединение, обрыв связи). Профиль анализируется в двух временных интервалах: Wide Window (историческое поведение) и Narrow Window (текущее поведение). Сравниваются профиля исторического поведения и текущего поведения.

Отличие методики анализа профилей абонентов в системе HP FMS от системы СОМАП состоит в том, что значения характеристик профилей для групп абонентов не высчитываются, а задаются оператором изначально, исходя из понимания бизнеса. Профиль группы абонентов представляет собой набор порогов на значения трафика, которые абонент не должен превышать, если он принадлежит данной группе. Затем поведение каждого абонента сравнивается, во-первых, с профилем, заданным для его группы, и, в случае несовпадения, с профилями других групп.

Для оценки поведения операторов обычно используют пороговые методы. В частности, в Системе Обнаружения Мошенничества и Анализа Потерь строятся следующие отчеты:
  • Превышение номерной емкости и трафика для каждого присоединенного мобильного оператора. Кажому присоединенному оператору при договоре с Оператором-Владельцем выделятся определенное количество номеров из диапазона местной нумерации и объем трафика, который он может пропустить через точки подключения Оператора-Владельца. Отслеживается превышение этих параметров. Трафик от абонентов, превышающих выданную емкость на местном уровне, должен маршрутизироваться через точки подключения на АМТС и оплачиваться в соответствии с Договорами о межсетевом взаимодействии.
  • Некорректная маршрутизация трафика:
    1. Пропуск трафика мобильными операторами через проводных операторов.
    2. Пропуск мобильными операторами трафика других мобильных операторов через свои точки подключения на ОПТС
    3. Пропуск мобильными и проводными операторами трафика от операторов других регионов, а также междугородного и международного трафика.

Как правило, один присоединенный оператор не имеет права пропускать через свои точки подключения трафик другого присоединенного оператора. Отследить такие нарушения можно, например, сравнивая оператора, определенного по транку и оператора, опредленного по номеру. В нормальной ситуации эти два параметра должны быть равны.
  • Перекосы входящего и исходящего трафика. Например, если абонент, не имеющий входящего трафика, имеет большой исходящий трафик, то, возможно, этот номер подставляются при некорректной маршрутизации трафика.
  • Подстановка номера: можно выявить, например, в случае большого исходящего трафика с городского номера.

При внедрении системы HP FMS в России для разных операторов связи до недавнего времени анализировались только профили поведения абонентов, но не присоединенных операторов. В одном таком внедрении наряду с абонентом, была введена сущность Контент-Провайдера для поставщиков контента, работающих с оператором связи. Фактически, это было сделано для того, чтобы не анализировать вызовы на каждый короткий номер отдельно, а проводить анализ в совокупности для всех коротких номеров каждого поставщика контента. Но полноценного анализа профилей присоединенных операторов не проводилось.

Таким образом, новизна данной работы заключается в применении методики построение профилей к анализу деятельности присоединенных операторов.