Разработка автоматизированной веб-ориентированной системы составления каталога товаров при поиске по изображениям

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



ВЛАДИМИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ДИПЛОМНАЯ РАБОТА

Тема работы: "Разработка автоматизированной веб-ориентированной системы составления каталога товаров при поиске по изображениям"

студента Троепольского Алексея Сергеевича

Аннотация

В данной работе разработан и программно реализован алгоритм составления каталога товаров из сети электронных магазинов с выявлением одинаковых, используя сравнение по изображениям.

Ключевой частью работы является построение алгоритма сравнения товаров по их изображениям. В основе алгоритма лежит SURF - метод, в ходе которого производится поиск особых точек на изображении и составляются их дескрипторы.

Апробация алгоритма проведена по данным нескольких магазинов.

Оглавление

Введение

1. Обзор объекта и методов исследования

1.1 Описание объекта исследования

1.2 Описание привлекаемых методов

Метод SURF

Интегральное представление изображения

Вычисление матрицы Гессе

Достижение инвариантности относительно масштаба

Нахождение локального максимума гессиана

Нахождение ориентации особой точки

Вычисление дескриптора особой точки

Среда разработки и причины ее выбора

2. Методика

2.1 Методика получения информации с электронных ресурсов

2.2 Сравнительный анализ метода SURF

3. Программная реализация. Апробация методики

3.1 Описание программного обеспечения

Заключение

Введение

В настоящее время коммерческая деятельность бурно развивается на просторах интернета. "адение информацией становится здесь ключевым моментом. Во многих случаях предпринимателю достаточно знать где можно достать товар по оптимальной цене и выложить информацию о данных товарах уже на своем сайте, являясь посредником между конечным покупателем и настоящим продавцом. Существует множество сетей электронных магазинов с низкими ценами, о которых мало кто знает из конечных покупателей. Единственной проблемой является извлечение информации из этой сети с последующим отбором наилучших позиций.

В связи с этим, при развитии бизнеса до некоторого критического масштаба возникает потребность в автоматизированной системе по извлечению товарных позиций и поиска наилучшей по цене позиции.

Целью данной дипломной работы является разработка программного обеспечения для извлечения товарных позиций из сети электронных магазинов и составления перечня одинаковых позиций для выбора из них наилучшей по цене и отзывам покупателей.

В качестве объекта исследования рассматривается сеть магазинов aliexpress.

В качестве результата исследования необходимо получить методику и программное обеспечение извлечения товарных позиций, сохранение их в базу данных и составление на основе их групп одинаковых.

1. Обзор объекта и методов исследования

1.1 Описание объекта исследования

Спецификой работы является объект исследования - сеть магазинов aliexpress. Здесь исходными данными являются товарные позиции. Среди исходных данных основными являются название товара, изображение товара, его цена, цена доставки и отзывы российских покупателей.

На данном сайте не существует разделения на группы одинаковых товаров изза большого их количества. В помощь пользователям существует лишь классификация товаров по категориям. А так же поиск по названиям, в котором однако не существует сортировки по цене.

Сайт aliexpress представляет собой, по сути, сеть электронных магазинов. Однако следующей проблемой являет отсутствие их списка. Поэтому в ходе моей работы стоит задача его определения путем перебора id этих магазинов. Ссылки на магазины имеют определенный вид, поэтому достаточно подставлять согласно этому правилу значения и проверять существует ли магазин с таким id или нет.

Следующей проблемой является то, что названия для товаров придумывает владелец магазина и у каждого магазина одинаковые товарные позиции могут иметь либо сильно отличающиеся, либо совершенно разные названия. Однако при этом изображения самих товарных позиций зачастую одинаковы либо, отличаются логотипом магазинов. В связи с этим для определения одинаковости целесообразнее использовать метод сравнения по изображениям, при чем метод не должен обращать большого внимания на мелкие различия в изображениях.

алгоритм дескриптор изображение программный

1.2 Описание привлекаемых методов

Метод SURF

SURF решает две задачи - поиск особых точек изображения и создание их дескрипторов, инвариантных к масштабу и вращению. Это значит, что описание ключевой точки будет одинаково, даже если образец изменит размер и будет повернут (здесь и далее мы будем говорить только о вращении в плоскости изображения). Кроме того, сам поиск ключевых точек тоже должен обладать инвариантностью. Так, что бы повернутый объект iены имел тот же набор ключевых точек, что и образец.

Метод ищет особые точки с помощью матрицы Гессе. Детерминант матрицы Гессе (т. н. гессиан) достигает экстремума в точках максимального изменения градиента яркости. Он хорошо детектирует пятна, углы и края линий.

Гессиан инвариантен относительно вращения. Но не инвариантен масштабу. Поэтому SURF использует разномасштабные фильтр