Краснопрошин Виктор Владимирович, доцент Кожич Павел Павлович Минск 2009 г. Оглавление Глава Введение. 4 Глава Анализ проблемы и постановка задачи. 5 1 задача
Вид материала | Задача |
- Краснопрошин Виктор Владимирович ст преподаватель Кожич Павел Павлович Минск 2008, 166.87kb.
- Кожич Павел Павлович, доцент Запрудский Сергей Николаевич Минск 2010 г. Оглавление, 202.51kb.
- Степанец Владимир Яковлевич доцент Кожич Павел Павлович Минск 2008 г. Оглавление Оглавление, 228.35kb.
- Забрейко Петр Петрович доцент Кожич Павел Павлович Минск 2007 г. Оглавление Оглавление, 254.67kb.
- Кожич Павел Павлович Минск 2010 г Оглавление Оглавление 2 Применение информационных, 302.47kb.
- Кожич Павел Павлович, профессор Воробьев Василий Петрович Минск 2010 г. Оглавление, 247.09kb.
- Сидорская Ирина Владимировна старший преподаватель Кожич Павел Павлович Минск 2010, 900.44kb.
- Коледа Виктор Антонович, ст преподаватель Пол Кожич Минск 2010 г. Оглавление Оглавление, 340.48kb.
- А. А. Самопознание и Субъективная психология. Содержание введение Раздел I постановка, 5204.65kb.
- Русская доктрина андрей Кобяков Виталий Аверьянов Владимир Кучеренко (Максим Калашников), 11986.64kb.
Глава 4. Описание программной системы.4.1 Общая архитектура и состав системы.Созданная система состоит из 3 основных компонент:
Компоненты представляют собой программные модули, написанные на языке программирования C# (платформа .NET). Для хранения нейронных сетей также может быть использована база данных (как альтернатива хранению в файлах). Компоненты 2 и 3 являются независимыми и могут использоваться по отдельности. Для их работы необходим компонента 1. Для работы также необходимо наличие установленного фреймворка .NET 3.5 на ЭВМ. Рассмотрим подробнее структуру и функциональность каждого компонента системы. 4.2 Программная реализация базового алгоритма.При создании программной реализации основными целями было обеспечение наиболее возможной гибкости и модифицируемости. Поэтому было принято решение реализовать в ней абстрактный алгоритм функционирования свёрточной сети без привязки к конкретной задаче. При этом была обеспечена возможность конфигурации параметров и конфигурации сети при её использовании. В результате был получен программный модуль, который может быть использован любым приложением, написанным на платформе .NET. Главной сущностью этого модуля является свёрточная нейронная сеть, предоставляющая следующие возможные операции:
Этот набор операций позволяет полностью контролировать процесс создания, обучения и использования нейронной сети для решения конкретных задач. Алгоритм, реализованный в этом модуле, является описанным базовым алгоритмом, модифицированным при помощи добавления нормализации входных весов, задания порога торможения нейрона и введения обратных связей на основе анализа статистики. 4.3 Средства настройки.Для проведения экспериментов, анализа результатов, а также упрощения настройки нейронной сети для конкретной задачи был создан графический интерфейс для тестирования. Он является стандартным Windows-приложением, работающим в оконном режиме. Главной частью является меню, предоставляющее возможность сохранения, загрузки, инициализации нейронной сети. Также доступно обучение сети и тестирование результатов её работы на тестовой выборке. В качестве изображений для тестирования и обучения могут быть использованы файлы основных графических форматов. При этом необходимо предварительно структурировать их расположение в файловой системе в соответствии с принадлежностью к классам. Главное преимущество данной программы – визуальный показ весов нейронов сети и результатов её промежуточной работы. Для этого используется монохромная картинка, где более светлым участкам соответствуют большие значения весов (признаков). При этом предварительно эти значения нормализуются для большей наглядности. Рис. 4.1 Веса нейронов и результаты работы сети на разных слоях. Таким образом, пользователь может посмотреть значения любого веса нейрона или признака для данного изображения. Более того, эта информация может быть использована для лучшей настройки параметров сети в случае конкретной задачи. Для этого визуально оценивается скорость изменения весов при обучении, разнообразие выделяемых признаков. Для прикладного использования был разработана третья компонента. Данный модуль схож с тестирующим, однако акцент в функциональности сделан в сторону управления существующими сетями и наборами изображений. Графический интерфейс даёт возможность создавать новые сети, обучать их, управлять обучающими наборами изображений. При этом пользователь имеет возможность настройки всех основных параметров архитектуры сети (Рис. 4.2). Также он предоставляет возможность распознавания единичных изображений для проверки корректной работы после настройки сети. Рис. 4.2 Создание новой свёрточной сети Модуль предоставляет внешним программам интерфейс для распознавания изображений. Изображения передаются в виде набора пикселей или указывается имя файла. Таким образом, система может работать с некой программой, управляющей устройством для получения изображений. Глава 5. Эксперименты.5.1 Результаты.Созданная система была протестирована для широкого спектра параметров настройки нейронной сети и вариаций её структуры. Большая часть экспериментов была проведена для базы ORL. Эта база является стандартной тестовой базой для алгоритмов распознавания и содержит средние по сложности изображения (Рис.5.1). Полученные результаты можно назвать удовлетворительными. Рис. 5.1 Набор 10 изображений из одного класса. Наиболее важными являются оценка степени улучшения точности алгоритма в результате модификаций. В результате тестирования было установлено, что наибольший прирост точности предоставляет добавление нормализации на первом свёрточном слое. Нейроны первого слоя начинают реагировать на геометрические признаки изображения, что повышает точность (для некоторых сетей удалось достигнуть точности 95-97% для базы ORL). Введение порога торможения для нейронов также положительно сказывается на результате. Маловажные признаки отбрасываются, что позволяет увеличить точность. Однако негативным моментом является искажение степеней уверенности в принадлежности изображения классам (иными словами, альтернативные варианты распознавания заглушаются). Наконец, введение упрощённых обратных связей даёт весьма неоднозначный результат. Эффект зависит от конкретного набора изображений, и в некоторых случаях является негативным. Также эта модификация имеет тот же недостаток, что и предыдущая. Поэтому в конечной версии программы использование этих связей является опциональным и настраивается пользователем. 5.2 Выводы.Модицированный алгоритм имеет хорошую точность распознавания (96-99% для базы ORL), причём скорость работы алгоритма позволяет использовать его в режиме реального времени. Высокая скорость позволяет использовать в качестве устройства ввода информации не только фото- но и видеокамеру, что даёт сильное увеличение точности распознавания (операция распознавания производится несколько раз, а затем принимается взвешенное решение). Это даёт широкую почву для дальнейших исследований в этой области, в частности, использование видеоряда не только при работе, но и при обучении нейронной сети. Глава 6. Заключение.В данной работе были проанализированы различные методы распознавания человека по изображению лица. С помощью реализации наиболее перспективных алгоритмов и их тестирования в качестве базового метода для решения поставленной задачи был выбран алгоритм свёрточной нейронной сети с вейвлетной предобработкой изображения. По результатам тестирования этот алгоритм показал высокую (но не стопроцентную) точность. Путём анализа значений весов и выходов нейронов для обученной сети были выделены основные причины ошибок – неполная инвариантность алгоритма к степени яркости изображения и местоположению лица на изображении. Для решения этих проблем были предложены различные пути решения. Была доказана польза нормализации входов первого свёрточного слоя нейронов и введение порогового значения для нейронов. В качестве способа коренного улучшения работы алгоритма было предложено введение обратных связей в свёрточную нейронную сеть. После полноценного тестирования предложенных изменений первые два были оценены как эффективные. На основе полученного модифицированного алгоритма была создана система распознавания человека по изображению лица, состоящая из трёх компонент, включающая в себе программу для тестирования алгоритма и графический интерфейс для прикладного использования. В дальнейших исследованиях, мы планируем обратить внимание на использовании видеоинформации вместо фотографической, более глубокое внедрение обратных связей в архитектуру нейронной сети, а также испытать ассамблеи нейронных сетей для получения более надёжного алгоритма. Предметный указатель к рефератуА Адаптивный шаг обучения 16 В Вейвлетное преобразование 15 Г Гиперболический тангенс 11 М Многослойный персептрон 12 Н Нейронная сеть 11 Нормализация 18 С Свёрточный слой 13 Интернет ресурсы в предметной области исследования.
Действующий личный сайт в WWW.ссылка скрыта Граф научных интересов.Магистранта Тарасюка А.Е. Факультет прикладной математики и информатики Специальность «Прикладная математика и информатика»
Презентация магистерской диссертации.ссылка скрыта Тестовые вопросы по Основам информационных технологийВопрос 1. Каким тегом оформляется упорядоченный список:
|