Разработка автоматизированной системы классификации товаров по изображениям

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



ть классификации товаров варьируется от 66 до 89%. Точность классификации напрямую зависит от количества образов, которое было дано сети для обучения. Максимальная точность была достигнута для сети с 4867 образами. Соответствие категорий их идентификаторам приведено в таблице 1.

Таблица 1

Наименование категорииИдентификаторНожи65655Фонари68548Цифровые зеркальные камеры70303Роликовые коньки72009Дефлекторы72010Палатки72011Фаркопы72012Гири72013Гантели72014Мячи72015Материнские платы75149Шахматы105062iPhone105353iPhone 3GS105354iPhone 3GS White105355iPhone 4S105356iPhone 4S White105357USB флешки106445Металлоискатели108909

Нейронные сети в основе системы были выбраны потому, что немаловажным аспектом работы программы является её быстродействие, далее будет осуществлено тестирование скорости работы приложения.

Тестовая конфигурация аппаратного обеспечения приведена в таблице 2.

Таблица 2

Процессор AMD FX-8120 4600 MHzОперативная памятьKingston HyperX T1 16Gb 1866 MHzЖесткий дискOCZ Vertex Turbo 30Gb, 2xWD Caviar Green 1Tb Raid1Блок питанияEnermax Revolution85+ 920W

Результаты тестирования производительности будут представлены в порядке последовательного выполнения всех узлов программы: от парса категорий до непосредственной работы нейронных сетей. Всего на сайте представлено 5116 категорий, общее время парса всех категорий составляет 36-38 секунд.

Время парсинга категорий

На графике, изображенном на рисунке 17, представлены произвольные 11 категорий, максимальное время парса составляет 0,0204 сек, минимальное - 0,0058 сек, среднее - 0,0122 сек.

Теперь будет приведён тест производительности при парсинге товаров. Товары на сайте представлены страницами по 25 товаров на каждой странице. Максимальное время парса страницы - 2,8057 сек, минимальное - 1,6170 сек, среднее - 2,1116 сек.

Время парсинга товаров

На рисунке 18 изображен график, на котором представлены 50 случайных товаров и время их парсинга. Минимальное время составляет 0,0003 сек, максимальное - 0,0023 сек, среднее время - 0,0007 сек.

Время сохранения изображений на диск

На данном графике (рис. 19) представлен результат тестирования производительности сохранения 250 случайных изображений на диск. Минимальное время равно 0,0662 сек, максимальное составляет 0,3213 сек, среднее - 0,0996 сек.

Ранее упоминалось, что общее число изображений для тестирования составляет 19863. Приведём тестирование производительности на этапе подготовки образов для дальнейшего обучения нейронных сетей. Образы обрабатывались для подготовки различным нейронным сетям. Максимальное время обработки - 0,03217 сек, минимальное - 0,01103 сек, среднее - 0,02054. График, наглядно отображающий время, затраченное на обработку каждого набора изображений, представлен на рисунке 20.

Время подготовки данных для обучения нейронных сетей

После того, как данные подготовлены, можно приступить к обучению нейронных сетей.

Время обучения нейронных сетей

На рисунке 21 представлен график, на котором отображено время обучения нейронных сетей. Максимальное время составляет 0, 2057 сек, минимальное - 0,1054 сек, среднее - 0,0932 сек.

После того, как обучение нейронных сетей завершено, необходимо сохранить конфигурационные файлы сетей на диск. На рисунке 22 представлено тестирование производительности при сохранении файлов на диск.

Время сохранения файлов конфигурации нейронных сетей на диск

Как видно из графиков, представленных на рисунке 22, максимальное время сохранения конфигурационного файла сети составляет 5,68 сек, минимальное - 5,52 сек, среднее - 5,60 сек.

Для классификации изображений нейронные сети должны быть проинициализированы. Далее будет представлен результат тестирования производительности на этапе инициализации нейронных сетей.

Время инициализации нейронных сетей

Из графиков, представленных на рисунке 23, видно, что максимальное время инициализации нейронной сети равно 6,12 сек, минимальное - 5,95 сек, среднее - 6,00 сек.

Последним и самым значимым в плане производительности этапом работы программы является непосредственно работа нейронных сетей.

Время работы нейронных сетей

Изучив графики с рисунка 24 можно сделать вывод, что максимальное время работы одиночной нейронной сети составляет 0,01046 сек, минимальное - 0,00860 сек, среднее - 0,00915 сек.

Из проведенной апробации видно, что время работы программы в целом невелико, а самым главным достоинством является то, что удалось достичь довольно высокой точности классификации при очень небольшом времени обучения и работы нейронных сетей. Время, которое затрачивается на извлечение данных из одной категории, может сильно отличаться, в зависимости от количества товарных позиций, представленных в данной категории, но в среднем для категорий, содержащих не более 2000 товаров, время обработки составляет 2 минуты.

Заключение

Основным результатом данной дипломной работы является разработка программного обеспечения для классификации товаров по их изображениям.

Также был проведен анализ объекта исследования и привлекаемых для решения поставленной задачи методов.

Алгоритм классификации товаров по их изображениям был реализован на языке C#. Работоспособность данного алгоритма проверялась с помощью данного программного продукта.

Апробация методики проводилась на фактических данных из нескольких случайных категорий веб-ресурса molotok.ru.

Разработанная си