Разработка автоматизированной системы классификации товаров по их изображениям

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

Владимирский государственный университет

имени Александра Григорьевича и Николая Григорьевича Столетовых

Факультета прикладной математики и физики

Специальности 010501 - прикладная математика и информатика

ДИПЛОМНАЯ РАБОТА

Тема: Разработка автоматизированной системы классификации товаров по их изображениям

Студента Богданова Ильи Дмитриевича

Руководитель работы: Павлова О.Н.

2012

Аннотация

В данной работе разработана автоматизированная система классификации товаров по изображениям. При разработке системы используются многослойные полносвязные нейронные сети с обучением методом обратного распространения ошибки.

Ключевой частью работы является получение достаточно объёмной базы классифицированных товаров для обучения нейронных сетей. В качестве источника исходных данных взят один из крупных интернет-аукционов (molotok.ru).

Оглавление

Введение

Глава 1. Обзор объекта и методов исследования

.1 Описание объекта исследования

.2 Описание привлекаемых методов

.2.1 Искусственные нейронные сети

.2.2 Метод обратного распространения ошибки

.3 Среда разработки и причины ее выбора

Глава 2. Методика

.1 Способ получения информации с веб-ресурсов

.2 Методика классификации товаров

.3 Алгоритм классификации товаров

.4 Принцип хранения данных о товарах

Глава 3. Программная реализация. Апробация методики

.1 Описание программного обеспечения

.2 Апробация методики

Заключение

Список использованной литературы

Приложение

Введение

В наше время коммерческая деятельность в сети интернет стала неотъемлемой частью жизни. Ключевым звеном коммерческой деятельности являются интернет-магазины. Как правило, управляющему таким магазином достаточно заказать товар по оптимальной цене и предоставить информацию о товаре на своем сайте, являясь посредником между конечным покупателем и настоящим продавцом. Информация должна быть хорошо структурирована, понятна покупателю, если покупатель не сможет легко найти интересующий его товар, он просто найдёт альтернативный магазин.

В связи с этим, при увеличении оборота товаров и их ассортимента возникает потребность в автоматизированной системе классификации товаров.

Целью дипломной работы является разработка программного обеспечения для получения исходных данных для обучения нейронных сетей и классификации товаров с их помощью.

Глава 1.Обзор объекта и методов исследования

.1Описание объекта исследования

Молоток.ру - один из крупнейших интернет аукционов в России. На сайте представлено порядка 5 000 000 уникальных лотов, все они хорошо структурированы и находятся более чем в 5000 категорий.

Рассмотрим принцип работы интернет-аукциона. Продавец выставляет товар на продажу и заявляет начальную цену. Вариантов приобретения товара может быть два: по блиц-цене и по принципу аукциона. В первом случае ожидать окончания торгов не нужно. Можно сразу оплатить товар и договориться с продавцом о доставке, как это происходит в интернет-магазинах. Во втором - товар достается тому, кто сделал продавцу наиболее выгодное предложение.

Далее будут рассмотрены особенности работы сайта, которых необходимо учесть, для получения информации о товарах. Практически все страницы сайта, которые потребуются для извлечения информации о товарах, генерируются при помощи JavaScript. Статической страницей является только карта категорий, на которой представлены все имеющиеся на сайте категории товаров. Категории имеют древовидную структуру, максимальный уровень вложенности четыре. В каждой категории представлен набор страниц, каждая из которых содержит в себе некоторое количество товаров. Необходимую информацию о товаре можно извлечь, не открывая веб-страницу с самим товаром.

.2Описание привлекаемых методов

1.2.1Искусственные нейронные сети

Искусственные нейронные сети (ИНС) - математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей - сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. Первой такой попыткой были нейронные сети Маккалока и Питтса. Впоследствии, после разработки алгоритмов обучения, получаемые модели стали использовать в практических целях: в задачах прогнозирования, для распознавания образов, в задачах управления и др.

Рис. 1.Схема трехслойной нейронной сети

ИНС представляют собой систему соединённых и взаимодействующих между собой простых процессоров (искусственных нейронов) (рис. 1). Такие процессоры обычно довольно просты, особенно в сравнении с процессорами, используемыми в персональных компьютерах. Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. Тем не менее, будучи соединёнными в достаточно большую сеть с управляемым взаи