Все авторефераты - Беларусь    Архивные справочники

Алгоритмы локализации и классификации лиц для распознавания личности по фотопортрету на основе машин опорных векторов по специальности л05.13.17 - теоретические основы информатики

Автореферат диссертации

 

Учреждение образования

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ

УДК 004.021:004.93'1+004.032.26

ФРОЛОВ Игорь Иванович

Алгоритмы локализации и классификации лиц

для распознавания личности по фотопортрету

на основе машин опорных векторов

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

по специальности 05.13.17 - Теоретические основы информатики

Минск 2011


Работа выполнена в учреждении образования Белорусский государственный университет информатики и радиоэлектроники.


Научный руководитель

Официальные оппоненты:

Оппонирующая организация


Садыхов Рауф Хосровович, д-р техн. наук, профессор, заведующий кафедрой электронных вычислительных машин учреждения образования Белорусский государственный университет информатики и радиоэлектроники

Старовойтов Валерий Васильевич, д-р техн. наук, профессор, главный научный сотрудник ОИПИ НАН Беларуси

Борискевич Анатолий Антонович, канд. техн. наук, доцент, доцент кафедры систем и устройств телекоммуникаций учреждения образования Белорусский государственный университет информатики и радиоэлектроники

Научно-исследовательский институт прикладных физических проблем им. А.Н. Севченко при БГУ


Защита состоится 15 марта 2012 г. в 14.00 на заседании совета по защите диссертаций Д 02.15.04 при учреждении образования Белорусский государственный университет информатики и радиоэлектроники по адресу: 220013, г. Минск, ул. П. Бровки, 6, тел. 293-89-89, e-mail:

С диссертацией можно ознакомиться в библиотеке учреждения образования Белорусский государственный университет информатики и радиоэлектроники.

Автореферат разослан л14 февраля 2012 г.


Ученый секретарь совета по защите диссертаций, д-р техн. наук, доцент


Иванюк А.А.


КРАТКОЕ ВВЕДЕНИЕ

Системы биометрической идентификации, распознавания образов и обработки изображений приобретают все большую популярность и востребованность. В последние годы предъявляются достаточно высокие требования к обеспечению безопасности, а также разработаны соответствующие международные стандарты обработки биометрических данных (фотоизображений лица, отпечатков пальцев), ставшие ориентиром для разработчиков систем идентификации личности.

Достоинствами устройств распознавания личности в системах видеонаблюдения являются их низкая цена, неназойливость, бесконтактность, незаметность.

Уровень точности и границы локализации области лица определяются разработчиками и не имеют строго определенных параметров, так же как и само понятие точность локализации области лица. Используемые фотоизображения могут быть получены с помощью различных технических средств, в различных условиях, что непосредственно влияет на уровень достоверной классификации и требует введения определенных ограничений и требований к обрабатываемым данным. Применяемые алгоритмы предобработки изображений в задачах распознавания по фотопортрету также не определены в общем случае и подбираются часто в зависимости от условий использования системы и обрабатываемых изображений, что говорит об отсутствии универсальных подходов к решению обозначенной задачи. Кроме того, остается открытым вопрос о подготовке обучающей выборки и предобработке тестируемых паттернов. Для решения каждой конкретной задачи распознавания образов применяются различные классификаторы, выбор которых обосновывается либо популярностью использования среди исследователей, либо известными высокими показателями работы, порой без учета реальных потребностей и критериев распознавания.

Кроме того, остается ряд задач, решение которых позволит качественно улучшить и сделать более устойчивой работу системы идентификации: раннее обнаружение опасности, оценка ракурса распознаваемого лица с использованием технологии 3?>-моделирования лица и воспроизведением теней, эмоций, возрастных отличий.

В диссертационной работе разработаны алгоритмы обработки фотоизображений лиц, оценки ракурса лица на изображении, обнаружения и локализации лиц на фотопортрете, классификации для создания автоматизированной системы биометрической идентификации личности в соответствии с международными стандартами, которым должны соответствовать обрабатываемые изображения.

1


ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Связь работы с крупными научными программами, темами

Исследования по теме диссертационной работы проводились в рамках научных программ:

  1. Разработать методы и алгоритмы для построения автоматизированной системы идентификации личности по портрету лица, грант Министерства образования Республики Беларусь для аспирантов, ГБЦ № 10-3107, номер госрегистрации 20101279 от 10.06.2010 г., срок выполнения с 4 января 2010 г. по 31 декабря 2010 г.
  2. Разработка методов и алгоритмов обнаружения и распознавания лиц для систем видеонаблюдения реального времени, договор №Т05К-050 с БРФФИ от 1 апреля 2005 г., ГР №20061065, срок выполнения с 1 апреля 2005 г. по 31 марта 2007 г.

Цель и задачи исследования

Целью диссертационной работы является разработка алгоритмов обработки изображений для систем распознавания личности по цифровому фотопортрету.

Поставленная цель достигается решением следующих задач:

  1. Разработать алгоритм оценки ракурса лица на изображении для определения углов наклона и поворота головы.
  2. Выбрать на изображении область лица, оптимальную для распознавания личности.
  3. Построить математическую модель для описания взаимозависимостей расположения антропометрических точек лица.
  4. Разработать эффективный алгоритм локализации лица на фотопортрете для распознавания личности.
  5. Разработать алгоритм подготовки и расширения обучающей выборки с использованием технологии 3?>-моделирования лица.
  6. Разработать алгоритмы обучения и классификации для распознавания личности по выделенной области лица.

Объектом исследования являются цифровые фотопортреты базы данных FERET. Предметом исследования выступают модели, алгоритмы и методы анализа и обработки цифровых изображений.

2


Положения, выносимые на защиту

  1. Алгоритм оценки ракурса лица для определения углов наклона и поворота головы, основанный на геометрических соотношениях между антропометрическими точками лица и сравнении с шаблонами 3?>-моделей лица, в отличие от известных учитывает эмоциональные выражения, влияющие на точность определения искомых углов (ошибка не более 1 по трем направлениям).
  2. Алгоритм локализации лица по границам надбровных дуг, использующий разработанную математическую модель для описания зависимости расстояний от центров зрачков до боковых и верхней границ области лица при поворотах и наклонах лица до 15, позволяет повысить значение коэффициента распознавания на 16,8 % по сравнению с алгоритмом обнаружения и локализации лица Виолы-Джонса.
  3. Алгоритм итерационного определения параметра штрафа С и параметра у радиально-базисной функции классификатора на основе машин опорных векторов (Support Vector Machines, далее - SVM) для обучения SVM-классификатора, решающий задачу автоматизированного поиска параметров обучения SVM без априорных знаний предметной области, позволяет повысить коэффициент распознавания на 6,2 % по сравнению с методом скользящего контроля.
  4. Декомпозиционный алгоритм классификации для машин опорных векторов, предварительно выполняющий декомпозицию обрабатываемых классов на подмножества и реализующий классификацию в рамках каждого из них, последовательно от уровня к уровню вычисляя класс-победитель, позволяет сократить время вычислений при классификации в 40 раз и повысить процент правильно идентифицированных лиц на 9 % и 7,9 % (на выборке базы FERET) по сравнению с известными алгоритмами (стратегиями) попарного сравнения и лодин против всех соответственно.

ичный вклад соискателя

Основные результаты и положения, выносимые на защиту, получены лично автором. Все алгоритмы, рассмотренные в работе, были разработаны и экспериментально исследованы автором самостоятельно. Научный руководитель д-р техн. наук, профессор Р.Х. Садыхов принимал участие в постановке целей исследования, их предварительном анализе, а также в обсуждении полученных результатов.

3


Апробация результатов диссертации

Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих международных конференциях: Problems of Cybernetics and Informatics: the 2nd International Conference (PCI-2008), г. Баку, Азербайджан, 2008 г.; Информационные системы и технологии: IV Международная конференция, г. Минск, 2008 г.; 5th IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing Systems, (IDAACS-2009), г. Ренде (Косенца), Италия, 2009 г.; Multiconference on Computer Science and Information Technology, (IMCSIT-2009), г. Мрагово, Польша, 2009 г.; Pattern Recognition and Information Processing: the 10th International Conference (PRIP-2009), г. Минск, 2009 г.; Problems of Cybernetics and Informatics: the 3rd International Conference, (PCI-2010), г. Баку, Азербайджан, 2010 г.; International Multiconference on Computer Science and Information Technology, (IMCSIT-2010), г. Висла, Польша, 2010 г.

Опубликованность результатов диссертации

По теме диссертационной работы опубликовано 11 печатных работ. Из них 4 статьи в научно-технических журналах, включенных в перечень научных изданий Республики Беларусь для опубликования результатов диссертационных исследований (1,7 авторского листа), 7 докладов в сборниках материалов международных конференций (2,3 авторского листа).

Структура и объем диссертации

Диссертация состоит из введения, общей характеристики работы, четырех глав, заключения, библиографического списка и приложения. В первой главе рассмотрены задачи анализа и обработки цифровых изображений, распознавания лиц в системах биометрической идентификации личности и существующие методы для их решения. Вторая глава посвящена разработке алгоритмов оценки ракурса лица на изображении, локализации лица на фотопортрете по границам надбровных дуг, применению технологии 3?>-моделирования лица для подготовки обучающей выборки лиц. В третьей главе рассмотрены методы классификации данных и принятия решения, автоматизированного поиска параметров обучения классификатора. В четвертой главе представлены результаты экспериментальной оценки разработанных алгоритмов, структура и модули их программной реализации. Общий объем диссертации составляет 138 страниц, из них 118 страницы основного текста, 57 иллюстраций на 19 страницах, 17 таблиц на 6 страницах, библиографический список из 141 наименования на 12 страницах и 1 приложение на 2 страницах.

4


ОСНОВНОЕ СОДЕРЖАНИЕ

Во введении обоснована актуальность темы диссертационной работы, сформулированы цель и задачи исследования.

В первой главе рассматривается проблема биометрической идентификации личности и распознавания образов при решении прикладных задач в цифровых системах видеонаблюдения и контроля доступа, системах раннего обнаружения опасности. Рассмотрены существующие подходы для решения задач при построении автоматизированной системы идентификации личности по цифровому фотопортрету. Проведенный анализ существующих решений показал отсутствие универсальных подходов при построении каждого модуля системы распознавания. Описаны основные проблемные вопросы при построении систем распознавания лиц и обозначены возможные подходы для их решения.

Область локализации лица влияет на коэффициент распознавания на этапе классификации, а точность локализации лица на фотопортрете зависит от ракурса лица на изображении и учёта углов поворота, наклона и отклонения головы. Предобработка изображений стандартными методами цифровой обработки изображений не дает желаемых результатов, а также не позволяет компенсировать отличия в освещении, эмоциях, наличии очков, усов. Установлен ряд задач, требующих решения при использовании SVM-классификатора: разработка структуры классификатора для решения задачи многоклассовой классификации, поиск параметров обучения, выбор функции-ядра и метода решения задачи оптимизации.

Вторая глава посвящена алгоритмам оценки ракурса и локализации лица на изображении, а также способам подготовки обучающей выборки на основе 3?>-моделей лиц. Установлены основные требования к обрабатываемым алгоритмами изображениям на основании проведенных исследований и изучения международных стандартов (ISO/IEC 19794-5: 2005 Information technology - Biometric data interchange formats - Part 5: Face image data и российский аналог - ГОСТ Р ИСО/МЭК 19794-5-2006 Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 5. Данные изображения лица): допустимые диапазоны наклона/поворота головы были расширены с 5 до 15, разрешение изображения полного фронтального типа должно быть не менее 180 пикселей на горизонтальный размер головы, что соответствует примерно 90 пикселям для расстояния между центрами зрачков. Введено понятие и дана экспериментальная оценка точности локализации области лица, которая определяется мерой близости к области лица,а ограниченной надбровными

5


дугами, необходимой для обеспечения высокого значения коэффициента распознавания (не менее 90 %).

В качестве исходных входных данных, поступающих на вход системы, используются значения яркостей пикселей локализованной области лица, которые далее формируют вектор признаков для каждого фотопортрета человека. Для обработки принимаются как цветные, так и полутоновые изображения; цветные изображения преобразовываются в полутоновые, которые и обрабатываются алгоритмами.

Поступающее для обработки изображение перед выполнением на нем локализации лица проходит следующую подготовку: предварительное обнаружение лица и центров зрачков глаз детектором Виолы-Джонса, вычисление угла отклонения и поворот изображения для приведения исходного изображения к полному фронтальному виду (центры зрачков глаз находятся на одной горизонтальной линии), оценка ракурса фотосъемки и выбор соответствующих коэффициентов kL(коэффициент для расчета левой границы локализации лица), kR(коэффициент для расчета правой границы локализации лица), кир (коэффициент для расчета верхней границы локализации лица) для расчета координат области локализации по линиям надбровных дуг, определение границ области интереса (лица) согласно построенной математической модели.

Оценка эффективности работы алгоритма обнаружения и локализации лица проверяется в разрезе решения задачи распознавания лиц: насколько точно система способна распознать человека по области изображения, которую определил данный алгоритм обнаружения и локализации лица. Также выполнена оценка правильности обнаружения: ошибки типа лицо не обнаружено и лобнаружено нелицо.

Разработан и реализован алгоритм оценки ракурса лица на изображении. В качестве исходных данных используются координаты характерных пяти антропометрических точек лица: внешние углы глаз, кончик носа, углы губ, поиск которых выполняется каскадами слабых хааровских классификаторов.

Шаг 1. Вычисление геометрических соотношений между выбранными антропометрическими точками и определение соответствующих углов поворота аг и наклона а2 для плоскости лица и нормали, т.е. ракурс лица.

Шаг 2. Сравнение изображения лица с соответствующими изображениями 3?>-модели для разных эмоций (улыбка, широкая улыбка, сжатые губы), используя метод главных компонент и SVM.

Шаг 3. Вычисление геометрических соотношений и новых (средних) значений углов a^ewи аЩ6Щ в соответствии с эмоциональным выражением лица и углами cxfD и o^Dдля 3?>-модели лица.

6


Ошибка определения углов поворота и наклона при тестировании не превышала 1 по каждому направлению.

Экспериментально установлены границы области лица по линиям

надбровных дуг (рисунок 1) как наиболее оптимальной для распознавания в

случае, когда вектор признаков формируется из обработанных значений

яркостейаа пикселейаа локализованнойа области.а Установленные

взаимозависимости размеров определенных частей лица для вычисления границ области интереса получены в ходе экспериментов на 500 изображениях разных людей базы FERET.

Рисунок 1 - Границы области интереса по линиям надбровных дуг и расстояния, использованные для расчета границ области лица

Для полного фронтального типа лица коэффициенты, используемые

для расчета координат области локализации лица, принимают значения к = kL= kR= 0,317 и кир = 0,345. Случайная погрешность измерения расстояний и соответствующих вычисленных коэффициентов оценивается по значениям дисперсии о2 = 0,00013 и среднего квадратического отклонения о = 0,01141 для коэффициента к. Для коэффициента кир соответствующие величины равны о2 = 0,00001 и о = 0,00229.

После вычисления требуемых коэффициентов к, кир получаем выражения для вычисления координат левой (можно использовать и правую точку, тогда расчет будет выполняться по координатам центра зрачка правого глаза) верхней точки квадратной области локализации лица (1) и (2), а также для вычисления размеров (ширины и высоты) (3).

AL =AR =k-D = 0,317 Х?>.а (1)

UP = kUP-D= 0,345 Х?>.а (2)

H = W = AL + D+AR.(3)

7


С учетом рассчитанных коэффициентов к = kL= kR= 0,317 и кир = 0,345 получаем

H = W = kL-D + D + kR-D = 1,634 Х D.(4)

Зная координаты центра левого (или правого) зрачка глаза, длины расстояний D, AL, AR, UP, производим вычисление искомой области интереса.

На основании проведенных экспериментов (получены средние значения коэффициентов kLlkR,kUPи оценки погрешностей а и а, таблица 1) и проведенных соответствующих измерений построена математическая модель для описания зависимости расстояний от центров зрачков до боковых и верхней границ области лица при поворотах и наклонах лица до 15.

Таблица 1 - Средние значения коэффициентова kL, kR, киР и соответствующие им оценки случайных погрешностей измерений

Угол поворота

kL

о2

а

kR

а2

а

киР

а2

а

-15

0,2744

0,00010

0,00977

0,3636

0,00017

0,01293

0,3183

0,00002

0,00465

-10

0,2813

0,00006

0,00792

0,3474

0,00007

0,00812

0,3201

0,00001

0,00371

-5

0,2919

0,00004

0,00652

0,3304

0,00013

0,01141

0,3266

0,00003

0,00508

0

0,3097

0,00002

0,00469

0,3097

0,00003

0,00585

0,3348

0,00001

0,00229

5

0,3274

0,00004

0,00639

0,2924

0,00008

0,00886

0,3418

0,00002

0,00422

10

0,3459

0,00006

0,00803

0,2808

0,00006

0,00750

0,3441

0,00001

0,00371

15

0,3627

0,00007

0,00847

0,2735

0,00021

0,01435

0,3503

0,00002

0,00437

При изменении положения головы в кадре и появлении наклона и/или поворота вычисленные антропометрические соотношения (коэффициенты для вычисления расстояний от зрачков до границ области локализации) изменяются и не могут использоваться в первоначальном виде (1), (2).

Для выявления зависимости величин коэффициентов для расчета расстояний от центров зрачков до вертикальных боковых границ области локализации были построены соответствующие графики (см. рисунок 2) и линии аппроксимации для полученных зависимостей, выведены формулы расчета исследуемых коэффициентов, связанные с углом поворота (5), (6).

Влияние угла наклона не учитывалось ввиду малых значений отклонений.

kL= 0,001л:2 + 0,0059* + 0,2637,а (5)

kR = 0,0009л:2 + 0,023л: + 0,388,

Угол поворота головы оказывает минимальное влияние на коэффициент кир для расчета верхней границы области локализации лица по антропометрическим признакам, тогда как наклон головы вверх-вниз вокруг горизонтальной оси является определяющим фактором при расчете кир.

Для графика средних значений построена линия тренда по полиномиальной модели аппроксимации с наибольшим значением величины ?-квадрат, равным 0,98051. Уравнение полиномиальной модели для расчета данного коэффициента представлено ниже:

киР = -0,00001л:2 + 0,00580% + 0,31082. (7)

Алгоритм локализации области лица по границам надбровных дуг с предварительной оценкой ракурса фотосъемки может быть представлен в виде последовательности следующих действий.

Шаг 1. Оценка ракурса фотосъемки для обрабатываемого фотопортрета (рисунок 4). После завершения шага 1 имеем предварительно определенную область лица и углы наклона и поворота лица, изображенного на обрабатываемом фотопортрете.

Оценка ракурса: угол

^

поворота +9, угол наклона +5.

Рисунок 4 - Пример выполнения процедуры оценки ракурса

Шаг 2. Выбор формул разработанной математической модели для расчета коэффициентов kL, kR, киР в соответствии с установленными на шаге 1 алгоритма углами наклона и поворота головы на изображении. Расчет требуемых коэффициентов.

Если при оценке ракурса были получены нулевые значения углов поворота и наклона головы, то используются установленные для фронтального вида лица коэффициенты kL= kR= 0,317 и киР = 0,345.

Шаг 3. Вычисление координат левой верхней и правой верхней опорных точек лица, соответствующих концам горизонтальной линии - верхней границе области локализации лица по линиям надбровных дуг. Вычисление коэффициентов kL,kR,kUPосуществляется в соответствии с полученной математической моделью для расчета границ области лица.

10


Шаг 4. Завершение алгоритма: окончательная локализация области по границам надбровных дуг.

Уровень вероятности достоверной классификации при использовании разработанного алгоритма обнаружения лица по границам надбровных дуг выше на 16,8 %, чем при применении алгоритма обнаружения лица Виолы-Джонса.

Для обеспечения возможности получения и обработки изображений видеопоследовательности представлен модифицированный алгоритм Виолы-Джонса для обнаружения лица с использованием каскадов слабых хааровских классификаторов, обладающий более высокой производительностью и большей точностью распознавания (90,2 % по сравнению с 81,6 %, что на 8,6 % больше) по сравнению с базовой версией алгоритма, что достигается за счет обработки только сегментированных областей движения, обработки уменьшенной копии исходного изображения, увеличения размеров масок поиска. Главная отличительная особенность модифицированного алгоритма - возможность применения системы идентификации личности в режиме реального времени.

Для модифицированного алгоритма Виолы-Джонса для расчета области

интересаа приаа обработкеа видеопоследовательностиа получены

экспериментальным путем корректирующие коэффициенты. Вычисляются смещения относительно левой верхней точки исходной детектированной области. Координаты новой опорной левой верхней точки А(х,у) области интереса рассчитываются по выражениям:

х = хоШ + 0,15 Х Woldt

У = Уош + 0,265 Х Wold>

Н = 0,15 Х Wold,

W= 0,15 Х Wold,

где х, xold- координата х соответственно новой и начальной левой верхней точки области интереса; у,у0ш - координата у соответственно новой и начальной левой верхней точки области интереса; W, Woid- соответственно новый и начальный размер ширины области интереса; Н - новый размер высоты области интереса.

Для решения проблемы обработки и распознавания изображений лица с отличающимися яркостно-контрастными характеристиками, эмоциями, ракурсами разработан алгоритм подготовки и расширения обучающей выборки с использованием технологии 3?>-моделирования лица для воспроизведения отличий в условиях освещения, наличия усов, бороды, эмоциональных выражений лица, возрастных отличий, поворота и/или наклона головы, шумов

11


на изображении при подготовке обучающего набора данных. Основная идея данного подхода заключается в создании 3?>-модели каждого фронтального фотопортрета с вариациями вышеперечисленных параметров (в диссертационной работе дополнительно построено 176 изображений для каждого фотопортрета обучающей выборки).

Основные аспекты разработки классификатора на основе машин опорных векторов для распознавания лиц отражены в третьей главе диссертации.

Для реализации процесса распознавания адаптирована общая структура SVM-классификатора, предназначенного для решения задачи многоклассовой классификации. Установлена зависимость значения коэффициента распознавания от выбранной функции-ядра машин опорных векторов при решении задачи распознавания личности по фотопортрету.


2-й уровень

X

X

1-й уровень


р

+

р

1VI

р

+

р

1VI

р

+

р

1VI


X Ч тестовый

(&-1)-й уровень

р

+

р м

р

+

р м

к-й уровень

Vа *

р

winner

Х^

+ р

м

рЧ>


K=N(N-l)/2аа K=SM(M-l)/2

Рисунок 5 - Схема декомпозиции распознаваемых классов

Разработан декомпозиционный алгоритм классификации для SVM-классификатора (рисунок 5) при решении задачи многоклассовой классификации по стратегии попарного сравнения (при построении бинарных классификаторов машин опорных векторов), выполняющий предварительную декомпозицию распознаваемых классов на подмножества и использующий отдельные бинарные классификаторы, соответствующие

12


классам в рамках каждого подмножества. При разбиении на подмножества (декомпозиции) для каждого подмножества используются М(М Ч1)/2 бинарных классификаторов, обученных на общей выборке; общее количество классификаторов К для 1-го уровня вычисляется по формуле (8) или (9):

Формулы (8) и (9) являются рекуррентными и позволяют вычислять количество классификаторов на каждом уровне классификации, причем N в данном случае является суммарным числом классов для данного уровня (слоя): для первого уровня - это общая обучающая выборка, для каждого последующего - суммарное число классов-победителей, полученных на предыдущем уровне.

Алгоритм позволяет сократить время вычислений при классификации в 40 раз и повысить процент правильно идентифицированных лиц на 9 % и 7,9 % (на выборке базы FERET) по сравнению с известными алгоритмами (стратегиями) попарного сравнения и лодин против всех соответственно.

Разработан алгоритм итерационного определения параметров Сиу для обучения SVM-классификатора на базе радиально-базисной функции, основанный на многократном использовании элементов перекрестной проверки в диапазонах, вычисляемых в процессе выполнения алгоритма, до достижения минимум 90 % достоверной классификации, а также реализующий процедуру нормализации значений векторов признаков по каждому атрибуту, что позволяет снизить несбалансированность данных.

Алгоритм итерационного определения параметра штрафа С и параметра у радиально-базисной функции SVM-классификатора для обучения машин опорных векторов позволяет повысить коэффициент распознавания на 6,2 % по сравнению с методом скользящего контроля.

В четвертой главе описаны структура, порядок применения, режимы использования экспериментальных программных модулей для распознавания личности по фотопортрету; представлены результаты проведенного тестирования разработанных алгоритмов в рамкахаа экспериментального

13


комплекса программ для распознавания лиц, приведены результаты тестирования на базах лиц AT&T(ORL) и FERET.

В рамках экспериментов, проведенных для оценки эффективности разработанных алгоритмов, тестирование проводилось в режиме лидентификации (установление меры близости распознаваемого фотопортрета к своему истинному классу - определение места в рекомендательном списке) и верификации (сравнение с определенным изображением лица).

Результаты тестирования на базе лиц AT&T(ORL) в режиме тестирования представлены в таблице 2.

Таблица 2 - Коэффициент распознавания для тестируемых алгоритмов на базе лиц AT&T(ORL)

Коэффициент распознавания,

%

1 -е место в рекоменд. списке, %

2-е - 5-е место в рекоменд. списке, %

6-е- 10-е место в рекоменд. списке, %

11-е- 15-е место в рекоменд. списке, %

99,16

99,66

2,5

0,84

-

100

98,33

1,67

-

-

98,75

95,83

2,91

0,83

0,43

99,16

94,58

4,58

0,84

-

97,91

94,16

3,75

1,25

0,84

Результаты экспериментов на базе FERET в режиме идентификации представлены в таблице 3.

Таблица 3 - Коэффициент распознавания для тестируемых алгоритмов на базе лиц FERET

Коэффициент распознавания,

%

1 -е место в рекоменд. списке, %

2-е - 5-е место в рекоменд. списке, %

6-е- 10-е место в рекоменд. списке, %

11-е-50-е место в рекоменд. списке, %

50-е-100-е место в рекоменд. списке, %

Не

попали в 100

94,272

80,524

13,748

1,800

2,291

1,146

0,491

93,126

79,051

14,075

1,309

1,964

2,619

2,946

94,435

80,851

13,584

2,291

2,128

0,164

0,982

Таким образом, средний коэффициент распознавания составил 93,944 % для базы FERET, что соответствует известным результатам качественных биометрических систем.

В режиме верификации экспериментальный комплекс алгоритмов протестирован на выборке изображений базы FERET, состоящей из изображенийаа 550аа человек,аа которымаа доступаа разрешен,аа иаа 50аа человек,аа не

14


являющихся членами разрешенного списка и, соответственно, отсутствующих в базе. Таким образом, всего было выполнено 27500 сравнений типа чужой-чужой и 550 сравнений типа свой-свой. Уровень ошибки предоставления доступа неизвестному человеку {FalseAcceptancerate) для оцениваемой выборки составил 0,083 %, а уровень ошибки непредоставления доступа разрешенному пользователю {FalseRejectionrate) составил 5,81 %, что соответствует уровню зарубежных систем распознавания личности по фотопортрету.

В заключении сформулированы основные научные результаты диссертации и рекомендации по их практическому применению.

Приложение содержит акты внедрения результатов диссертации.

ЗАКЛЮЧЕНИЕ Основные научные результаты диссертации

1.а Разработан алгоритм оценки ракурса лица для определения углов

наклона и поворота головы на изображении, основанный на геометрических

соотношениях между пятью характерными антропометрическими точками лица

(внешние углы глаз, кончик носа, внешние углы рта), отличающийся от

известных подходов устойчивостью к эмоциональным выражениям лица, что

достигается применением сравнения с соответствующими шаблонами

3?>-моделей лиц [3-А, 7-А, 8-А].

  1. Разработан алгоритм локализации лица по линиям надбровных дуг, как области оптимальной для распознавания, построенный на полученной математической модели для описания зависимости расстояний от центров зрачков до боковых и верхней границ области локализации лица от ракурса, отличающийся более высоким уровнем вероятности достоверной классификации при использовании в распознавании лиц по сравнению с известным алгоритмом Виолы-Джонса [3-А, 6-А, 9-А, 10-А].
  2. Разработан алгоритм итерационного поиска параметров Сиу функции-ядра (радиально-базисная функция) SVM-классификатора, основанный на многократном использовании элементов перекрестной проверки в диапазонах, вычисляемых в процессе выполнения алгоритма, до достижения минимум 90% достоверной классификации, а также реализующий процедуру нормализации значений векторов признаков по каждому атрибуту, что позволяет снизить несбалансированность данных [3-А, 4-А, 5-А, 11-А]. Алгоритм отличается более высоким процентом (на 6,2 % выше) правильно классифицированных лиц по сравнению с методом скользящего контроля.

15


4. Разработан декомпозиционный алгоритм классификации для SVM-классификатора при решении задачи с большим числом распознаваемых классов, выполняющий предварительную декомпозицию распознаваемых классов на подмножества и использующий отдельные бинарные классификаторы, соответствующие классам в рамках каждого подмножества. Алгоритм обладает более высокой производительностью и уровнем достоверной классификации по сравнению с методами попарного сравнения и лодин против всех соответственно [1-А, 2-А, 10-А, 11-А].

Рекомендации по практическому использованию результатов

Результаты исследований использованы для практической реализации экспериментального программного комплекса для распознавания лиц. Научные и практические результаты использованы в НИР университета, а также в ряде прикладных систем.

Так, алгоритмы локализации лица, предобработки изображений и классификации на базе машин опорных векторов, построенных на основе разработанного декомпозиционного алгоритма, реализованы для работы службы безопасности ООО БАРС Интернешнл (г. Москва) в системе контроля доступа в охраняемые помещения.

Разработанные алгоритмы также применены в системе биометрической идентификации личности по цифровому фотопортрету для учета рабочего времени сотрудников и контроля доступа в помещения в супермаркете На недельку (г. Минск). Ряд результатов использован в учебном процессе учреждения образования Белорусский государственный университет информатики и радиоэлектроники.

СПИСОК ПУБЛИКАЦИЙ СОИСКАТЕЛЯ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи е научных журналах

1-А. Фролов, И.И. Построение классификатора на основе машины опорных векторов / И.И. Фролов, Р.Х. Садыхов // Известия Белорусской инженерной академии. -2006. -№1(21)/2.-С. 149-152.

2-А. Фролов, И.И. Построение классификатора на основе машины опорных векторов для распознавания символов / И.И. Фролов, Р.Х. Садыхов // Доклады БГУИР. - 2008. - №1 (31). - С. 103-108.

3-А. Фролов, И.И.а Особенности проектирования системы

идентификацииа личностиа поа портрету лица /а И.И. Фролов,а Р.Х. Садыхов,

Г.В. Алехнович // Известия Национальной академии наук Беларуси.а Серия

физико-технических наук. - 2011. - №1. - С. 82-89.

16


4-А. Фролов, И.И. Пирамидальный алгоритм кластерной классификации / И.И. Фролов, Р.Х. Садыхов // Известия Национальной академии наук Беларуси. Серия физико-технических наук. - 2011. - №2. - С. 91-96.

Материалыконференций

5-А. Frolov, I. The Technigues for Creation of Face Identification Systems based on SVM and HMM / I. Frolov, R. Sadykhov, N. Pavlyonok // Problems of Cybernetics and Informatics: Proceedings of the 2nd International Conference, Sept. 10-12, 2008, Baku, Azerbaijan. - Baku, 2008. - P. 163-166.

6-A. Фролов, И.И. Экспериментальная система идентификации портретов лиц на базе машин опорных векторов / И.И. Фролов, Р.Х. Садыхов // Информационные системы и технологии: Материалы IV Междунар. конф., Минск, 4-6 нояб. 2008 г. / Белорус, гос. ун-т, НАН Беларуси, Белорус, гос. ун-т информатики и радиоэлектроники, Науч.-техн. ассоциация Инфопарк. -Минск, 2008. - С. 177-183.

7-А. Frolov, I. Face Recognition System Using SVM-Based>

8-A. Frolov, I. The Techniques for Face Recognition with Support Vector Machines / I. Frolov, R. Sadykhov // Proceedings of the International Multiconference on Computer Science and Information Technology, Oct. 12-14, 2009, Mr^gowo, Poland. - Mr^gowo, 2009. - P. 31-36.

9-A. Frolov, I. Experimental Face Identification System Based on Support Vector Machines / I. Frolov, R. Sadykhov // Pattern Recognition and Information Processing: Proceedings of the 10th International Conference, May 19-21, 2009, Minsk, Belarus. - Minsk, 2009. - P. 276-281.

10-A. Frolov, I. The Design Aspects of Face Identification System With SVMs / I. Frolov, R. Sadykhov // Problems of Cybernetics and Informatics: Proceedings of the 3rd International Conference, Sept. 10-12, 2010, Baku, Azerbaijan. - Baku, 2010. -P. 28-31.

11-A. Frolov, I. The Development Features of the Face Recognition System / I. Frolov, R. Sadykhov // Proceedings of the International Multiconference on Computer Science and Information Technology, Oct. 18-20, 2010, Wisla, Poland. -Wisla,2010.-P. 121-128.

17


РЭЗЮМЭ

Фралоу гар ванавч

Алгарытмы лакалзаць класфкаць тварау для распазнавання асобы па фотапартрэту на аснове машын апорных вектарау

Ключавыясловы: распазнаванне вобразау, бяметрьчнья тэхналогп, дзнтьфкацья асобы, знаходжанне твару, перадапрацоука малюнка, рэдуцыраванне прастору дадзеных, машыны апорных вектарау.

Мэтапрацъг. распрацоука алгарытмау апрацоук малюнкау для сстзм распазнання асобы па чбаваму фотапартрэту.

Метадыдаследавання: у рабоце выкарыстаны метады алгарытмы чбавай апрацоук малюнкау, распазнавання вобразау, статыстычнай апрацоук дадзеных.

Атрыманыявьтк х навзна: Для выяулення лакалзаць на малюнку вобласц твару, найболып аптымальнай для распазнання, распрацаваны алгарытмы ацзнк ракурсу асобы лакалзаць вобласц нтарзсу па межах надброуных дуг.

Распрацаваны алгарытм падрьхтоук пашырэння навучальнай вьбарк з выкарыстаннем тэхналогп 3?>-мадэлявання асобы для узнаулення адрозненняу ва умовах асвятлення, эмацыйных выразау асобы, узроставых адрозненняу, павароту нахлу галавы пры падрыхтоуцы навучальнага набору дадзеных.

Прапанаваны мадьфкавань алгарытм Вель-Джонса для выяулення лакалзаць асобы у кадры вдзапаслядоунасц, як мае больш высокую хуткадзейнасць у параунанн з базавым алгарытмам.

Распрацаваны алгарытм аутаматызаванага пошуку параметрау навучання SVM-класфкатара, заснаваны на шматразовым вькарьстанн элементау крыжаванай праверк у дыяпазонах, вьлчаемьх у працэсе выканання алгарытму.

Для рашэння задачы класфкаць распрацаваны дэкампазщыйны алгарытм мнагакласавай класфкаць на базе машын апорных вектарау, як валодае больш высокай хуткадзейнасцю (да 40 разоу) як дазваляе атрымаць больш вьсок казфцьент распазнавання у параунанн з алгарьтмам папарнага параунання ладзн супраць усх, а таксама прадстауляе магчымасць прымяняць працэдуру дадання асобных класау без навучання класфкатара на усм трзнровачньм наборы.

Вобласцъпрымянення: сстзмь бяметрьчнай дзнтьфкаць асобы па фотапартрэту, сстзмь кантролю доступу, бяметрьчнь пашпартны кантроль.

18


РЕЗЮМЕ

Фролов Игорь Иванович

Алгоритмы локализации и классификации лиц для распознавания личности по фотопортрету на основе машин опорных векторов

Ключевые слова: распознавание образов, биометрические технологии, идентификация личности, распознавание лиц, предобработка изображений, редуцирование пространства данных, машины опорных векторов.

Цель работы: разработка алгоритмов обработки изображений для систем распознавания личности по цифровому фотопортрету.

Методы исследования: в работе использованы методы и алгоритмы цифровой обработки изображений, распознавания образов, статистической обработки данных.

Полученные результаты и их новизна. Для обнаружения и локализации на изображении области лица, наиболее оптимальной для распознавания, разработаны алгоритмы оценки ракурса лица и локализации области интереса по границам надбровных дуг.

Разработан алгоритм подготовки и расширения обучающей выборки с использованием технологии 3?>-моделирования лица для воспроизведения отличий в условиях освещения, эмоциональных выражений лица, возрастных отличий, поворота и/или наклона головы при подготовке обучающего набора данных.

Предложен модифицированный алгоритм Виолы-Джонса для обнаружения и локализации лица в кадре видеопоследовательности, имеющий более высокое быстродействие по сравнению с базовым алгоритмом.

Разработан алгоритм автоматизированного поиска параметров обучения SVM-классификатора, основанный на многократном использовании элементов перекрестной проверки в диапазонах, вычисляемых в процессе выполнения алгоритма.

Для решения задачи классификации разработан декомпозиционный алгоритм многоклассовой классификации на базе машин опорных векторов, обладающий более высоким быстродействием (до 40 раз) и позволяющий получить более высокий коэффициент распознавания по сравнению с алгоритмами попарного сравнения и лодин против всех, а также предоставляющий возможность применять процедуру добавления отдельных классов без обучения классификатора на всем тренировочном наборе.

Область применения: системы биометрической идентификации личности по фотопортрету, системы контроля доступа, биометрический паспортный контроль.

19


RESUME

Frolov Igor Ivanovich

Face localization and>

Keywords: pattern recognition, biometrical technologies, identification of personality, face detection, image preprocessing, dimension reduction and feature extraction, support vector machines.

The purpose of this thesis is the development of image processing algorithms for pattern recognition systems by digital photograph.

Research methods: digital image processing, pattern recognition, statistical data manipulation and data mining.

The obtained results and their novelty: The algorithm of face detection and localization along the boundaries of brow is developed for face recognition. Pose estimation algorithm is constructed to determine the yaw angle and the pitch angle of head.

The 3D-modeling of faces for training set allows to emulate the conditions of face brightness, emotions, age, glasses, beard and moustache.

The Viola-Jones algorithm of face detection and localization in a video sequence frame is modified.

The SVM-classifier is developed to retrieve the parameters of training. This approach is based on a multiple use of elements of cross-validation within the ranges calculated.

The decomposition algorithm is developed to solve the task of multiclass>

Field of application: the results of the dissertation can be applied in face biometrical identification systems, access monitoring systems, biometric passport control.

20


Научное издание

Фролов Игорь Иванович

Алгоритмы локализации и классификации лиц

для распознавания личности по фотопортрету

на основе машин опорных векторов

Специальность 05.13.17 - Теоретические основы информатики

Автореферат диссертации на соискание ученой степени кандидата технических наук


Подписано в печать Гарнитура Тайме. Уч.-изд. л.


Формат 60x84 1/16 Отпечатано на ризографе. Тираж 60 экз.


Бумага офсетная. Усл.печ. л. Заказ


Издатель и полиграфическое исполнение: учреждение образования

Белорусский государственный университет

информатики и радиоэлектроники

ЛИ №02330/0494371 от 16.03.2009. ЛП №0233/0494175 от 03.04.2009.

220013, Минск, П. Бровки, 6.

 
   Все авторефераты - Беларусь    Архивные справочники