Метода проверки статистических гипотез для выявления pos терминалов, работающих с пластиковыми картами и подозреваемых в выполнении несанкционированных операций

Вид материалаАнализ

Содержание


K3 определяет математическое ожидание значений суммы, характеризующей мошеннические действия. Коэффициент К
Подобный материал:

УДК 004.4(06) Технологии разработки программных систем


Т.М. Болотская, Б.А. Щукин

Московский инженерно-физический институт (государственный университет)


МЕТОД ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

ДЛЯ ВЫЯВЛЕНИЯ «ПОДОЗРИТЕЛЬНЫХ» ТЕРМИНАЛОВ


Анализируется применение метода проверки статистических гипотез для выявления POS терминалов, работающих с пластиковыми картами и подозреваемых в выполнении несанкционированных операций.


Служба безопасности банка, которому принадлежат POS терминалы в некоторой торговой точке, нуждается в методах, которые позволили бы выявлять «подозрительные» терминалы, осуществляющие мошеннические действия при обработке пластиковых карт. Видов мошенничества много, анализируется случай, при котором в каждой транзакции, отправляемой в банк, завышается значение суммы, пробиваемой в чеке. Т.е., если чек покупателя содержит сумму y, то в банк отправляется сумма yk3, где k3 – коэффициент больший 1.

Суммы x и k3x за операционный день имеют распределения, отличающиеся математическим ожиданием. При этом можно выдвинуть гипотезы. Основную – H0: , где – эталон суммы нормальной активности, вычисляемый как среднее арифметическое за все дни l месяцев, и альтернативную – H1: , т.е. задачу обнаружения «подозрительных терминалов» можно свести к задаче проверки статистических параметрических гипотез. В качестве статистики критерия значимости используется статистика , где – выборочное среднее, – математическое ожидание, S – выборочная дисперсия (по выборке из L = 30l дней), n – объем выборки для . Для нашего случая n = 1 используется статистика критерия: . По критерию 2 проверялась гипотеза: F(x) = N (m, ) [1]. Ввиду массовости операций на торговых точках, логично предположить нормальное распределение. Закон распределения статистики критерия Z: T (L - 1), так как , заменялся N (0,1) распределением. С результатами проверки наших гипотез H0 и H1 связаны ошибки -го рода и -го рода. Для нашего случая  представляет собой вероятность принять нормальную активность за мошенническую («ложное срабатывание»), а величина ошибки  – вероятность принять мошенническую активность за нормальную («пропуск цели»), что приводит к более тяжёлым последствиям.

Для выявления «подозрительного» терминала вычисляем:

, т.е. ,

где , , K1 – некоторый коэффициент, определяющий критическую область. Откуда

. (1)

Ошибка 2-го рода : , где , , , где K1, K3 – некоторые коэффициенты,

. (2)

Откуда получаем:

(3)

Коэффициент ^ K3 определяет математическое ожидание значений суммы, характеризующей мошеннические действия. Коэффициент К1 определяет границу критической области, из при достаточно маленькой ошибке , например,  = 0,1 можно оценить K3 из (3), т.е. его зафиксировать.

Программный комплекс, вычисляющий предлагаемые коэффициенты, позволяет службе безопасности банка оценивать результаты мониторинга работы терминалов. Если для службы наиболее значим вариант, связанный с пропуском «цели», т.е. «подозрительного» терминала, то следует уменьшать , хотя при этом неизбежно увеличивается , что приводит к увеличению числа терминалов, подлежащих проверке.


Список литературы

  1. Лемешко Б.Ю. Статистический анализ одномерных наблюдений случайных величин: Программная система / stu.ru/~headrd/applied/sa_rus.htm




ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 11