Метода проверки статистических гипотез для выявления pos терминалов, работающих с пластиковыми картами и подозреваемых в выполнении несанкционированных операций
Вид материала | Анализ |
СодержаниеK3 определяет математическое ожидание значений суммы, характеризующей мошеннические действия. Коэффициент К |
- Лекция Непараметрические методы проверки статистических гипотез, 5.21kb.
- Список условных сокращений и обозначений, 424.88kb.
- «Исследование скорости сходимости распределений статистик критериев проверки статистических, 116.56kb.
- Утверждено Советом Факультета Председатель 2010г. Санкт Петербург 2010 I пояснительная, 231.49kb.
- Задачи обучения по дисциплине : Успешно прошедшие курс студенты должны… знать, 221.2kb.
- «Организация расчетов и банковское кредитование», 28.02kb.
- Русский кардинг, 31.87kb.
- 1. Методология, метод, техника и процедура как понятия социологического исследования, 1391.24kb.
- Private Banking, 225.76kb.
- Темы, которые мы обсуждали на предыдущей лекции: Прообраз=(Тадж Махал)=Неизвестный, 97.53kb.
УДК 004.4(06) Технологии разработки программных систем
Т.М. Болотская, Б.А. Щукин
Московский инженерно-физический институт (государственный университет)
МЕТОД ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
ДЛЯ ВЫЯВЛЕНИЯ «ПОДОЗРИТЕЛЬНЫХ» ТЕРМИНАЛОВ
Анализируется применение метода проверки статистических гипотез для выявления POS терминалов, работающих с пластиковыми картами и подозреваемых в выполнении несанкционированных операций.
Служба безопасности банка, которому принадлежат POS терминалы в некоторой торговой точке, нуждается в методах, которые позволили бы выявлять «подозрительные» терминалы, осуществляющие мошеннические действия при обработке пластиковых карт. Видов мошенничества много, анализируется случай, при котором в каждой транзакции, отправляемой в банк, завышается значение суммы, пробиваемой в чеке. Т.е., если чек покупателя содержит сумму y, то в банк отправляется сумма yk3, где k3 – коэффициент больший 1.
Суммы x и k3x за операционный день имеют распределения, отличающиеся математическим ожиданием. При этом можно выдвинуть гипотезы. Основную – H0: , где – эталон суммы нормальной активности, вычисляемый как среднее арифметическое за все дни l месяцев, и альтернативную – H1: , т.е. задачу обнаружения «подозрительных терминалов» можно свести к задаче проверки статистических параметрических гипотез. В качестве статистики критерия значимости используется статистика , где – выборочное среднее, m – математическое ожидание, S – выборочная дисперсия (по выборке из L = 30l дней), n – объем выборки для . Для нашего случая n = 1 используется статистика критерия: . По критерию 2 проверялась гипотеза: F(x) = N (m, ) [1]. Ввиду массовости операций на торговых точках, логично предположить нормальное распределение. Закон распределения статистики критерия Z: T (L - 1), так как , заменялся N (0,1) распределением. С результатами проверки наших гипотез H0 и H1 связаны ошибки -го рода и -го рода. Для нашего случая представляет собой вероятность принять нормальную активность за мошенническую («ложное срабатывание»), а величина ошибки – вероятность принять мошенническую активность за нормальную («пропуск цели»), что приводит к более тяжёлым последствиям.
Для выявления «подозрительного» терминала вычисляем:
, т.е. ,
где , , K1 – некоторый коэффициент, определяющий критическую область. Откуда
. (1)
Ошибка 2-го рода : , где , , , где K1, K3 – некоторые коэффициенты,
. (2)
Откуда получаем:
(3)
Коэффициент ^ K3 определяет математическое ожидание значений суммы, характеризующей мошеннические действия. Коэффициент К1 определяет границу критической области, из при достаточно маленькой ошибке , например, = 0,1 можно оценить K3 из (3), т.е. его зафиксировать.
Программный комплекс, вычисляющий предлагаемые коэффициенты, позволяет службе безопасности банка оценивать результаты мониторинга работы терминалов. Если для службы наиболее значим вариант, связанный с пропуском «цели», т.е. «подозрительного» терминала, то следует уменьшать , хотя при этом неизбежно увеличивается , что приводит к увеличению числа терминалов, подлежащих проверке.
Список литературы
- Лемешко Б.Ю. Статистический анализ одномерных наблюдений случайных величин: Программная система / stu.ru/~headrd/applied/sa_rus.htm
ISBN 978-5-7262-0883-1. НАУЧНАЯ СЕССИЯ МИФИ-2008. Том 11