Разработка автоматизированной веб-ориентированной системы составления каталога товаров при поиске по изображениям

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



нить настройки поиска, развернув соответствующую панель "Настройки".

Здесь можно выбрать:

точность при поточечном сравнении, т.е. максимальную разность особых точек, при которой они считаются одинаковыми.

Процент удачного сравнения, т.е. минимальны коэффициент соответствия 2х изображений, при котором они считаются одинаковыми.

Количество потоков, т.е. в сколько изображений одновременно будет сравниваться с искомым. Данный параметр прямо пропорционально влияет на скорость производимого поиска.

Далее нужно выбрать изображение, дубликаты которого мы будем искать в базе. Его можно выбрать, нажав кнопку "Обзор" и выбрав соответствующий файл в открывшемся окне OpenFileDialog.

Выбранное изображение отобразится на экране.

Затем следует выбрать категорию или несколько категорий, в которых будет производиться поиск дубликатов.

При нажатии на кнопку поиск программа составит дескрипторы особых точек выбранного изображения, а затем произведет, используя их, поиск в базе и найдет товары с похожими изображениями.

Для уменьшения времени, поиск можно производить в несколько потоков.

Процесс поиска отображается элементов ProgressBar, который появляется на время поиска.

Поиск можно остановить в любой момент времени, нажав на кнопку "Стоп".

В таблице снизу появляются товары, чьё изображение похоже на введенное пользователем. Сбоку от этой таблицы можно увидеть изображение выбранного товара.

Апробация методики

Для осуществления тестирования методики была произведена выборка магазинов имеющих как одинаковые, так и разные товарные позиции.

Парс магазинов осуществлялся в 5 потоков. На парс каждой товарной позиции уходило около 6и секунд. В итоге на парс ушло полтора часа. Все магазины распарсились успешно. Было выявлено 875 товарных позиций.

Составление дескрипторов изображения осуществлялось в 4 потока, т.е. одновременно обрабатывалось 4 изображения по 1,1 секунды каждая.

В результате были сформированы группы одинаковых товаров.

Качество группировки, т.е. количество ошибок, совершаемых программой при формировании групп одинаковых товаров, сильно зависит от настроек точности сравнения и процента удачного сравнения.

По этой причине было произведен ряд опытов, в ходе которых были выявлены оптимальные настройки для формирования групп.

Опыты производились на группе изображений, имеющих разный процент сходства и разное количество шумов. В группу так же были добавлены изображения другого товара.

При увеличении точности сравнений дескрипторов особых точек в группу одинаковости попадали только те изображения, которые были идентичны или имели низкий уровень шумов, что не может удовлетворять запросам т.к. в каждом магазине на изображение товара накладывается логотип магазина и другие дополнительные знаки.

При её чрезмерном уменьшении в группу начинали попадать товары совершенно непохожие на эталонные. В результате была найдена оптимальная точность для сравнения дескрипторов, равная 0.4, что и отображено на диаграмме.

Подобное поведение, что предсказуемо, наблюдалось и в отношении параметра "процент удачного сравнения". Его оптимальной величиной является 0.7, что также видно на диаграмме.

Заключение

Основным результатом данной дипломной работы является разработка программного обеспечения для составления каталога товаров электронных магазинов и выявления групп одинаковых товаров iелью получения максимальной выгоды.

Также был проведен анализ объекта исследования и привлекаемых для решения поставленной задачи методов.

Алгоритм получения каталога товаров был реализован на языке C#. Работоспособность данного алгоритма проверялась с помощью данного программного продукта.

Апробация методики проводилась на фактических данных нескольких электронных магазинов этой сети.

Список использованной литературы

1.Пименов В.Ю. Вычислительно-эффективный метод поиска нечетких дубликатов в коллекции изображений. 2009-19с.

2.Википедия Гессиан функции

.Хабрахабр Интегральное представление изображений

.Хабрахабр Обнаружение устойчивых признаков изображения: метод SURF

5.Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van Gool Speeded-Up Robust Features (SURF) 2008 - 14с

6.Лабор В.В. Си Шарп: Создание приложений для Windows - Ми.: Харвест, 2003. - 384с.

.Фролов А.В., Фролов Г.В. Язык С# Самоучитель, 2003. - 557с.

.Эндрю Троелсен Язык программирования C# 2010 и платформа.net 4.0 5е издание. 2011. - 1392с.