ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В БИЗНЕСЕ ОЦЕНКА НЕОБХОДИМОГО РАЗМЕРА СВЁРТКИ БИОМЕТРИЧЕСКОГО ОБРАЗЦА ДЛЯ ОБЕСПЕЧЕНИЯ ЗАДАННЫХ ПАРАМЕТРОВ НАДЕЖНОСТИ БИОМЕТРИЧЕСКОЙ СИСТЕМЫ ИДЕНТИФИКАЦИИ Д.А. Cилантьев,
стажер-консультант Департамента Управленческого Консалтинга, ООО ИБС Экспертиз.
Адрес: 127434, Москва, Дмитровское шоссе, 9Б 141090, e-mail: dsilantev@ibs.ru В работе предложен способ оценки размера свертки биометрического образца. Рассмотрена взаимосвязь размера свертки и вероятностями ошибок ложного доступа и ложного отказа.
Обсуждается возможность биометрической идентификации личности в больших масштабах.
Ключевые слова: биометрический образец, свёртка, размер, биометрическая идентификация, коэффи циент ложного пропуска, коэффициент ложного отказа доступа.
а сегодняшний момент разработано множе- ложного отказа. Они зависят от многих параме ство технологий идентификации человека тров, например, таких как: количество зарегистри Н на основе биометрических характеристик рованных людей в базе, применяемых технических человека (БХЧ). Большинство из них использует средств и алгоритмов, внешних условий при сня одинаковый принцип - полученный биометриче- тии образца и т.д.
ский образец человека (звук, изображение и др.) Процесс идентификации носит вероятностный преобразуется в свёртку по некоторому алгоритму, характер, поэтому многие параметры биометри которая сравнивается с хранимыми в базе данных ческих систем (такие как FAR, FRR, стабильность биометрическими шаблонами (эталонами), полу- биометрической системы - возможность получать ченными в процессе регистрации, с целью опреде- близкие друг к другу биометрические образцы ления его соответствия какому-либо шаблону и со- независимо от номера попытки сканирования ответствующей шаблону личности (так называемая БХЧ) вычисляются опытным путем на основе ста схема лодин ко многим). При этом важнейшими тистики.
характеристиками биометрической системы иден- Сделав некоторые допущения, можно оценить тификации являются FAR Ч вероятность ошибки необходимый размер свёртки для обеспечения тре ложного доступа и FRR Ч вероятность ошибки буемых уровней FAR и FRR, что позволит задать БИЗНЕС-ИНФОРМАТИКА №3(09)Ц2009 г.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В БИЗНЕСЕ требования к объему и качеству информации, из- Ошибка ложного отказа возникает, когда Будем влекаемой из биометрического образца.
.
(x, x ) > m считать, что по близости, Пусть снятие образца БХЧ и обработка при помо- куда может попасть, больше нет ни одной эта x щи алгоритмов биометрической системы приводит лонной свёртки. При этом L к получению свёртки - двоичного числа длиной.
Введем следующую метрику:
, (x, y) :{0,1}L {0,1}L Используя таблицы для нормального распреде ления, заключаем:
x, y {0,1}L где - свёртки биометрических об FRR < 10-3 при, (1) разцов L (x, y) := xi - yi x, y {0,1}L FRR < 10-5 при,, i= FRR < 10-7 при, т.е. кол-во позиций, по которым свёртка x отли чается от y Предположим теперь, что в БД образов находится {xi}Q эталонных свёрток. При фиксированном Q Пусть в БД биометрической системы имеется i= L, максимальное расстояние, на которое могут ока x свёртка (эталон), полученная при регистрации заться разведены свёртки, равно образа БХЧ человека А. При этом производится повторное сканирование той же БХЧ человека А, и L получается новая свёртка x.
max(min ) - очень грубая оценка. (2) Будем говорить, что свёртка x распознается как Q x свёртка, если (x, x ) m, где - Такой вариант реализации эталонных свёрток при граница доверительного интервала (порог распо регистрации биометрических данных является наи знаваемости).
более благоприятным, т.к. в этом случае их легче все Допустим, что при повторном получении образа го отличить друг от друга.
БХЧ, свёртки x, вероятность смены одной из по Используя (1), при условии, что 10-3, и (2) для FRR < p зиций свертки с 0 на 1 или с 1 на 0 равна двух любых свёрток xi, xj : i, j [1,Q], получаем:
и не зависит от позиции свёртки и человека, от ко торого она получена. Вероятность p характеризует (3) стабильность получения биометрических образов и свёрток. Тогда вероятность того, что свёртка x будет удалена от свёртки x, на расстояние k равна:
Следовательно, > p.
Q k p (k) = P((x, x ) = k) = CL pk (1- p)L-k Например, [0,2 10-9 ] при 10- p [ Q = - Из (3) получаем:
Bin(L, p) биномиальное распределение (4) - математическое ожидание (среднее число изменившихся позиций) - дисперсия При (в биометрических технологиях L обычно используется L > 103) в силу центральной предельной теоремы (большие оценки L получились вследствие грубо сти оценки (2) и большого Q).
БИЗНЕС-ИНФОРМАТИКА №3(09)Ц2009 г.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В БИЗНЕСЕ Реальные биометрические системы сейчас ис- Получаем пользуют свёртки величиной в несколько Кбайт.
Задача биометрической идентификации может (5) быть разрешена современными средствами при объеме БД в 1 000 000 записей. Однако увеличе ние БД до 1 000 000 000 записей потребует уве личения точности формирования свёртки на 3 При и подбираем порядка, а также объема каждой свёртки на 3 по.
рядка, что потребует увеличения производитель ности сервера приблизительно на 6 порядков, что При и подбираем недопустимо.
Предположим, что БД образов находится Q.
в {xi}Q эталонных свёрток, и произведено скани i= рование БХЧ незарегистрированного в системе че- При и подбираем ловека.
Ошибка ложного доступа возникает, если.
Q (xi*, x ) < m xi* - одна из эталонных, где свёрток, x - свёртка отснятого для идентифика При и подбираем ции биометрического образца. Допустим, что в x.
может равновероятно реализоваться любая комби Биометрические системы с наименьшим параме нация 0 и 1. Вероятность совпадения x и одного из xi : i [1,Q] по более чем L - m позициям сле- тром p (которые обеспечивают набольшую стабиль дующая: ность и повторяемость собираемых биометрических образов) позволяют достигнуть наибольшей точности L-m и производительности в процессе идентификации за L-m FAR = CL Q. счет применения свёртки наименьшего размера, а также возможности использования узких границ до верительных интервалов (малые параметры ), обе m Для систем с усиленным контролем доступа спечивая при этом низкий уровень ошибок ( FRR < обычно требуется, чтобы FAR находилась на уровне 10-3, FAR < 10-6). Однако современный уровень раз менее 1%, т.е. 10-3. вития биометрических технологий не позволяет до FAR < FARmaz = биваться приемлемой надежности идентификации Получаем: при использовании больших БД (больше 100 000 за писей, а иногда 10 000), что подтверждается экспери ментальными данными. В основном это связано с не достаточным уровнем репрезентативности исходных данных. Следовательно, улучшение характеристик - формула Стирлинга, сканеров БХЧ и алгоритмов распознавания будет оставаться наиболее вероятным направлением разви тия биометрических технологий в ближайшие годы.
Открытым для исследований остается вопрос максимально возможной репрезентативности при. каждой отдельно взятой БХЧ.
Литература 1. Michael E. Schuckers. Test Sample and Size / Encyclopedia of Biometrics, Li, SZ and Elliot SJ (eds).
2. Спиридонов И.Н. Применение биометрических технологий в медико-биологической практике / ID news №2, 2005.
БИЗНЕС-ИНФОРМАТИКА №3(09)Ц2009 г.