Белорусский государственный университет применение информационных технологий при анализе и обработке изображений

Вид материалаПрезентация

Содержание


Список обозначений 4
Список литературы 13
Приложение в 17
Список обозначений
Глава 1 (обзор литературы)
Глава 2 (методика исследования)
Рисунок 1 – Принцип задачи классификации
Глава 3 (основные результаты)
Список литературы
ПРИЛОЖЕНИЕ А Предметный указатель к реферату
ПРИЛОЖЕНИЕ Б Интернет-ресурсы в предметной области исследования
ПРИЛОЖЕНИЕ В Действующий личный сайт в www (гиперссылка)
ПРИЛОЖЕНИЕ Г Граф (круг) научных интересов
05.13.18 – математическое моделирование, численные методы и комплексы программ, физ.-мат., техн.
05.13.17 – теоретические основы информатики, физ.-мат., техн.
01.01.01 – вещественный, комплексный и функциональный анализ
01.01.05 – теория вероятностей и математическая статистика
ПРИЛОЖЕНИЕ Д Тестовые вопросы по основам информационных технологий
Подобный материал:

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ ПРИ АНАЛИЗЕ И ОБРАБОТКЕ ИЗОБРАЖЕНИЙ

Выпускная работа по

«Основам информационных технологий»

Магистрант

кафедры компьютерных технологий и систем

Кулинкович Виктория Александровна

Научные руководители:

профессор Краснопрошин Виктор Владимирович

ст. преподаватель Позняков Андрей Михайлович

Минск 2012

ОГЛАВЛЕНИЕ


ОГЛАВЛЕНИЕ 3

СПИСОК ОБОЗНАЧЕНИЙ 4

ВВЕДЕНИЕ 5

ГЛАВА 1 (ОБЗОР ЛИТЕРАТУРЫ) 7

Глава 2 (методика исследования) 9

ГЛАВА 3 (ОСНОВНЫЕ РЕЗУЛЬТАТЫ) 11

ЗАКЛЮЧЕНИЕ 12

СПИСОК ЛИТЕРАТУРЫ 13

ПРИЛОЖЕНИЕ А 14

Предметный указатель к реферату 14

ПРИЛОЖЕНИЕ Б 15

Интернет-ресурсы в предметной области исследования 15

ПРИЛОЖЕНИЕ В 17

Действующий личный сайт в www (гиперссылка) 17

ПРИЛОЖЕНИЕ Г 18

Граф (круг) научных интересов 18

ПРИЛОЖЕНИЕ Д 19

Тестовые вопросы по основам информационных технологий 19

ПРИЛОЖЕНИЕ Е 20

Презентация магистерской диссертации 20



СПИСОК ОБОЗНАЧЕНИЙ


БД – база данных

ИТ – информационные технологии

ЦИ – цифровое изображение

ЭВМ – электронно-вычислительная машина

ВВЕДЕНИЕ


Цифровая обработка изображений является захватывающей темой со многих точек зрения. Человек воспринимает большую часть информации об окружающей среде через зрение. В то время как в течение долгого периода времени изображения можно было получить только с помощью фотографии, сейчас мы находимся на рубеже другой технической революции, которая позволяет получать, обрабатывать и оценивать изображения с помощью компьютера. Компьютеры развиваются поразительными темпами, становясь более мощными и в то же время менее дорогостоящими, так что цифровая обработка изображений получает все более широкое распространение. Таким образом, обработка изображений становится обязательным инструментом при анализе изображений во всех областях естествознания.

Техника передачи изображений достигла в настоящее время высокого уровня. Для передачи изображений используются оптическая, проводная, радио и другие виды связи. Теоретически и экспериментально доказана возможность высококачественной передачи видеоинформации на расстояния в несколько десятков и даже сотен миллионов километров. Технически осуществимой представляется в настоящее время и задача создания глобальной системы связи для передачи изображений.

Объем видеоинформации, перерабатываемой в различных областях деятельности человека, очень вырос и продолжает увеличиваться. Например, в США ежегодно получают около 25 млрд. снимков и несколько сотен миллиардов единиц бумажной продукции, нуждающихся в той или иной обработке. При обычном эксперименте по изучению элементарных частиц в ядерной физике обрабатывается несколько сотен тысяч фотографий и т.д.

Громадные объемы видеоинформации вместе с естественным желанием извлечь из нее как можно больше сведений ведут к необходимости автоматизации процессов ее обработки. Для этого применяются оптико-механические, оптико-электронные, телевизионные и аналоговые вычислительные системы. Особая роль в технике обработки изображений принадлежит ЭВМ, имеющим в своем составе устройства ввода, вывода и отображения зрительной информации и обладающим достаточным быстродействием и объемом памяти.

Без применения информационных технологий трудно представить себе решение любой задачи обработки изображений.

В настоящее время в связи со стремительным развитием цифровой фотографии и цифрового видео очень перспективной является задача распознавания образов на цифровых изображениях.

Последние десять лет в области распознавания образов ведутся активные разработки и предложены различные методы распознавания, использующие такие подходы, как метод главных компонент, методы с использованием гистограмм, нейросети, байесовские сети, классификатор Viola-Jones, статистические методы и т. д (Kanade, Rowley, Schapire, Shneiderman, Viola, Загоруйко, Журавлев). Часть этих подходов распознавания инвариантны по отношению к объекту, другие используют такие априорные знания об объекте, как: форма, цветовая гамма, взаимное расположение частей и др.

Несмотря на то, что в реальном мире существует огромное количество различных объектов, значительный интерес представляет разработка алгоритмов обнаружения более узкого класса объектов - лиц человека. Конкретными практическими применениями алгоритмов распознавания лиц могут быть: системы автоматического учета числа посетителей; системы пропускного контроля в учреждениях, аэропортах и метро; автоматические системы предотвращения несчастных случаев; интеллектуальные интерфейсы "человек-компьютер" и др.

Задача обнаружения лица человека является сложной ввиду нескольких основных причин: высокая вариативность лиц человека, обусловленная анатомическими и фенотипическими особенностями индивидов; различные условия освещенности, определяющиеся типом, количеством и направлением источников света; необходимость обнаружения лиц, находящихся в произвольных положениях и наклонах.


ГЛАВА 1 (ОБЗОР ЛИТЕРАТУРЫ)


В быстро развивающейся области, такой, как цифровая обработка изображений, актуальным является использование новейших исследований. Однако не изменилась проверенная концепция, которая предлагает систематический подход к изучению цифровой обработки изображений с использованием понятий и основных принципов, также применяемых в других областях естествознания. Таким образом, человек с общими знаниями в естественной науке или инженерной дисциплине получает быстрый доступ к сложному предмету обработки изображений.

Одной из ведущих книг в области обработки изображений и распознавания образов является монография "Цифровая обработка изображений" [2], а также монография "Цифровая обработка изображений в среде MATLAB" [3].

Профессор Гонсалес был основателем лаборатории анализа изображений и образов, а также лаборатории роботехники и машинного зрения в университете UTK. Он также основал в 1982 г. компанию Perceptics Corporation, и до 1992 года являлся ее президентом. Последние три года этого периода он также работал в компании Westinghouse Corporation, которая купила Perceptics Corporation в 1989 г. Под руководством Р. Гонсалеса компания Perceptics добилась больших успехов в области обработки изображений, в машинном зрении и в технологии хранения данных на лазерных дисках. Д-р Вудс до работы в компаниях Perceptics и MedData Interactive занимал пост доцента по электронике и вычислительной технике в университете штата Теннеси, а еще раньше он работал инженером по компьютеризации в компании Union Carbide Corporation.

Следует отметить, что к настоящему времени опубликовано весьма мало книг и руководств, которые помогают перекинуть мост через пропасть, разделяющую теорию и конкретные компьютерные приложения на основе развитого программного окружения. Главной целью этих монографий является желание объединить под одной обложкой широкий базис теоретических концепций и знаний, необходимых для внедрения этих концепций в реальные программные продукты, написанные в среде современного пакета обработки изображений.

Также при написании выпускной работы по "Основам информационных технологий" активно использовалась следующая литература.

Электронная копия учебного пособия «Теоретические основы цифровой обработки изображений» [4]. В данном учебном пособии даются основы цифровой обработки изображений, а также основы методов распознавания изображений. Также использовалось учебное пособие для студентов вузов «Распознавание и цифровая обработка изображений» [5].

Также следует отметить, что огромная часть информации, посвященной использованию ИТ при обработке изображений, была представлена Интернет-ресурсами.

Таким образом, методы обработки цифровых изображений и теория распознавания образов в целом достаточно хорошо освещены в существующей литературе. Однако для конкретной рассматриваемой задачи распознавания лиц не существует точного решения, подробно описанного и проанализированного в соответствующих источниках.

Глава 2 (методика исследования)


В настоящее время широкое распространение получили биометрические системы идентификации, которые основываются на уникальных биологических характеристиках человек. Одним из носителей таких характеристик является лицо. Поэтому при реализации биометрической технологии важной является задача поиск лиц на изображении.

На данный момент эта задача далека от разрешения. Применяемые подходы носят, как правило, универсальный характер, имеют высокую алгоритмическую сложность (порядка O(n3), где n – количество пикселей изображения) и не инвариантны к условиям съёмки. Все это делает проблематичным их использования в системах реального времени.

Методы распознавания образов делятся на 2 основные категории: методы, основанные на теории решений, и структурные методы.

В распознавании образов центральную роль играет принцип «обучения» на выборке известных образов.

Выделение наиболее информативных (полезных) признаков при синтезе распознающих систем — одна из важнейших задач теории и практики распознавания. Однако до настоящего времени отсутствует соответствующая формальная постановка этой задачи. В неформальных же постановках задачи определение информативных признаков преследует:

1) уменьшение до минимума количества необходимых для описания классов признаков без существенного увеличения вероятности ошибки распознавания;

2) возможность использования относительно простых алгоритмов распознавания;

3) уменьшение вероятности ошибки распознавания.

С решением этой задачи обычно связаны вопросы упрощения распознающей системы и повышения качества ее работы. К построению эффективной системы признаков может быть два подхода. Первый подход заключается в том, что с самого начала берется установка на отыскание малого числа признаков большой информативности. Однако все используемые при этом методы до сих пор основаны на эвристике и эмпирике, т. е. выбор признаков определяется интуицией, опытом и воображением разработчика. Как бы удачна ни была сконструированная система признаков, нельзя доказать, что она лучше некоторой другой. Второй подход заключается в том, что из большого числа исходных признаков согласно некоторому критерию эффективности признаков отбирается как можно меньшее число наиболее полезных для распознавания признаков.

Общая схема задачи классификации приведена на рисунке 1.

Рисунок 1 – Принцип задачи классификации

Общая сложность классификации связана с тем, что зависимость между интересующими нас параметрами и данными изображения неочевидна. Объекты, которые требуется классифицировать, не связаны непосредственно с определенным диапазоном значений отдельного признака и должны распознаваться по их оптической сигнатуре в изображении.

Что касается научного использования, представляет интерес еще один аспект классификации. Поскольку методы формирования изображений находятся среди движущих сил прогресса в экспериментальных естественных науках, часто происходит так, что на изображениях появляются неизвестные объекты, для которых пока не придумана схема классификации. Одной из целей обработки изображений является определение классов для этих новых объектов. Следовательно, нам нужны методы классификации, которые не требуют каких-либо предварительных данных.

Подводя итог, мы заключаем, что классификация включает две основные задачи:

1. Соотношение между признаками изображения (оптическая сигнатура) и искомыми классами объектов должно исследоваться настолько детально, насколько это возможно. Эта тема частично изложена в публикациях по проблемам соответствующей научной области и частично в работах по теории формирования изображений, т.е. оптике.

2. Из множества возможных признаков изображения мы должны выбрать оптимальный набор, который позволяет однозначно выделять различные классы объектов с минимальными усилиями и настолько незначительным числом ошибок, насколько это возможно с помощью подходящего метода систематизации. Эта задача, известная как классификация.

ГЛАВА 3 (ОСНОВНЫЕ РЕЗУЛЬТАТЫ)


Постановка задачи: на вход поступает изображение, на котором локализовано человеческое лицо (размер изображения может варьироваться); на выходе мы должны получить выборку наиболее «похожих» лиц (в соответствии с выбранной точностью) из имеющейся базы.

Предполагается, что область местонахождения лица на изображении уже детектирована; считаем, что на вход поступает цветное RGB-изображение.
  1. Перевод изображения в оттенки серого; при этом сохраняется информация о цвете некоторых элементов (будем ее использовать в том случае, если признаков 8-битного изображения будет недостаточно для классификации).
  2. Применение эффективного алгоритма выделения контуров (использование алгоритма Канни, но можно его модифицировать с учетом особенностей человеческого лица).
  3. Масштабирование бинарного контурного изображения до нужного формата; масштабирование 8-битного изображения.
  4. Выделение на изображении контрольных точек (в общем случае 4 основных: глаза, нос, рот).
  • Используя усредненную маску для одного глаза (эту маску строится по некоторой обучающей выборке изображений), ищем его на нашем изображении.
  • В определенном секторе (центр совпадает с центром области глаза, угол около 25′) ищем положение второго глаза.
  • По аналогии ищем местонахождения остальных контрольных точек.

Далее выделяем признаки всех контрольных точек (отклонение усредненных яркостей) и переходим к поиску по базе. В качестве меры будем брать обычное эвклидово расстояние, а базу признаков упорядочим, чтобы ускорить поиск.

ЗАКЛЮЧЕНИЕ


В результате исследований:
  • Проведен сравнительный анализ существующих методов распознавания изображений, в частности распознавания человеческого лица на изображении.
  • Предложен специальный алгоритм поиска лица, поступающего на входе, в имеющейся базе.
  • Хранение существующих изображений и предобработка поступающего на вход изображения предполагает выделение ряда информативных признаков, базирующихся на специфических свойствах человеческого лица.
  • В качестве меры «похожести» лиц выбирается евклидово расстояние.

Таким образом, в работе решена задача выделения специфических признаков лица на изображении и дальнейшего поиска по базе данных.

СПИСОК ЛИТЕРАТУРЫ

  1. Анисимов Б.В., Распознавание и цифровая обработка изображений/ Б.В. Анисимов, В.Д. Курганов, В.К. Злобин, М. Высш.шк.: Учебное пособие для студентов вузов. 1983, –295 с.
  2. Гонсалес Р., Цифровая обработка изображений / Р. Гонсалес, Р. Вудс, Москва: Техносфера, 2005. – 1072с.
  3. Гонсалес Р., Цифровая обработка изображений в среде MATLAB/ Р. Гонсалес, Р. Вудс, С. Эддинс, Москва: Техносфера, 2006. – 616с.
  4. Сойфер В.А., Теоретические основы цифровой обработки изображений/ В.А. Сойфер, В.В. Сергеев, С.Б. Попов, В.В. Мясников, Самара: Учебное пособие, Самарский государственный аэрокосмический университет имени академика С.П. Королева, 2000. – 256с.

ПРИЛОЖЕНИЕ А

Предметный указатель к реферату


биометрические системы 9

информационные технологии 4

классификация 10

признаками 10

распознавания образов 5, 6, 7, 9, 18

цифровая обработка 5, 7, 8, 13

Цифровая обработка 7, 13



ПРИЛОЖЕНИЕ Б

Интернет-ресурсы в предметной области исследования

  1. ссылка скрыта

Сайт журнала  CCTV Focus.
  1. ссылка скрыта

Сайт Научно-Учебного Центра «Робототехника» МГТУ им. Н.Э. Баумана. Представлена информация и материалы по распознаванию изображений.
  1. ссылка скрыта

Сайт Высшей Аттестационной Комиссии Республики Беларусь.
  1. ссылка скрыта

Электронные копии статей из различных журналов по информатике.
  1. ссылка скрыта

Интернет-Университет Информационных Технологий, организующий курсы дистанционного обучения.
  1. ссылка скрыта

Бесплатная база изображений.
  1. ссылка скрыта

Научная библиотека избранных естественно-научных изданий.
  1. ссылка скрыта

Программно-аппаратный комплекс, обеспечивающий автоматическое выделение из "живого" видеопотока оптимальное изображение лица для распознавания, сохранения в базе данных и последующей идентификации в режиме реального времени.
  1. ссылка скрыта

Многофункциональный сайт, представляющий собой смешение социальной сети и коллективного блога, созданный для публикации новостей, аналитических статей, мыслей, связанных с высокими технологиями, бизнесом и Интернетом. Аудитория проекта — прогрессивно мыслящие люди, интересующиеся будущим IT-рынка в целом и интернет-экономики в частности.
  1. ссылка скрыта

Свободная общедоступная многоязычная универсальная интернет-энциклопедия, поддерживаемая некоммерческой организацией «Фонд Викимедиа». Может быть полезной самому широкому кругу читателей — от школьников до докторов наук. Пишется и редактируется добровольцами — всеми желающими пользователями всемирной сети интернет на 282 мировых языках, причём без какой бы то ни было премодерации. Соответственно, состоит из 282 языковых разделов.

ПРИЛОЖЕНИЕ В

Действующий личный сайт в www (гиперссылка)


ссылка скрыта


ПРИЛОЖЕНИЕ Г

Граф (круг) научных интересов


Магистрантки Кулинкович Виктории Александровны

Факультет Прикладной Математики и Информатики

Специальность Прикладная математика и информатика

Смежные специальности
  • 05.13.11 – математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
  1. Математическое и программное обеспечение систем искусственного интеллекта, мультимедиа, принятия решений, функционального и логического программирования, баз данных, знаний и экспертных систем.



  • 05.13.18 – математическое моделирование, численные методы и комплексы программ, физ.-мат., техн.
  1. Математические методы моделирования систем, процессов и явлений (физических, химических, технических, экономических и др.).
  2. Эффективные численные методы и алгоритмы, компьютерные средства организации и проведения вычислительного эксперимента по исследованию научных и технических проблем (разработка, обоснование и тестирование).




Основная специальность


05.13.17 – теоретические основы информатики, физ.-мат., техн.
  1. Создание современных баз данных, баз знаний, автоматизированных информационных систем, экспертных систем, систем искусственного интеллекта, включая моделирование поведения и рассуждений различного типа, моделирование образного мышления.
  2. Методы распознавания образов, фильтрации, распознавания и синтеза изображений, решающих правил, моделирование формирования эмпирического знания.
  3. Методы и алгоритмы обработки информации и принятия решения для создания систем компьютерного зрения в различных областях народного хозяйства.




сопутствующие
  • 01.01.01 – вещественный, комплексный и функциональный анализ
  1. Пространства, снабженные топологическими, алгебраическими, порядковыми, дифференциальными и другими структурами. Пространства обобщенных функций.



  • 01.01.05 – теория вероятностей и математическая статистика
  1. Статистические выводы и анализ данных.




ПРИЛОЖЕНИЕ Д

Тестовые вопросы по основам информационных технологий




Сочетание клавиш Ctrl+C в программах пакета Microsoft Office позволяет выполнить следующее действие:



Применение к выделенным символам курсивного начертания .

Отмена последнего действия.

Сохранение документа.

Копирование выделенного текста или объекта в буфер обмена.







Максимальная глубина цвета в растровом формате BPM:



8 бит

16 бит

24 бит

48 бит




ПРИЛОЖЕНИЕ Е

Презентация магистерской диссертации


Презентация_Кулинкович.ppt