Слайд 1 (титульный слайд)

Вид материалаДокументы
Подобный материал:
Слайд 1 (титульный слайд)

Защищается студент 256 группы Олейников Игорь Сергеевич. Тема работы – разработка информационно-аналитической системы для исследования биоразнообразия залива Петра Великого. Научный руководитель – зав. лаб. анализа океанологической информации ТОИ ДВО РАН Фищенко Виталий Константинович.

Слайд 2 (актуальность задачи, биобезопасность)

В последние годы значительно обострилась проблема сохранения исторически сложившегося естественного баланса экосистем дальневосточных морей. Одной из основных причин является сброс балластных вод судами, пришедшими из различных районов мирового океана. Местные биологические виды не обладают выработанными системами защиты от “видов-вселенцев”и могут быть ими уничтожены.

Слайд 3 (Grid портал ЦКП ББ)

В связи с этим в 2007 году в ДВО РАН была инициирована Целевая комплексная программа “Биологическая безопасность дальневосточных морей России” – ЦКП ББ.
В программе участвуют 6 институтов ДВО РАН и МГУ им. Ломоносова. Для координации работ всех участников, интеграции данных и аналитических методик специалистами ТОИ ДВО РАН была разработана GRID система.

Она реализована в виде GRID портала и взаимодействует с участниками ЦКП с помощью организационных и проблемно-ориентированных портлетов.

Слайд 4 (Залив Петра Великого)

Одной из ключевых задач ЦКП является задача организации контроля состояния биоразнообразия залива Петра Великого в различных районах в разные периоды времени. Для этого с 2003 года с помощью водолазов, а с 2006 с помощью автономных подводных аппаратов начала проводится систематическая фотосъемка морского дня на нескольких полигонах.( о. Русский, залив Восток, и п-ов. Б. Пелис). К настоящему времени имеется около 7000 фотографий, в ближайшие годы их число существенно возрастет.

Слайд 5(Пример фотоизображения)

ПО фотографиям опытными биологами-экспертами могут быть составлены биоописания запечатленных подводных сцен, в которых перечислены все объекты, с указанием их биологического вида и ряда морфометрических характеристик. Обобщая такие биоописания по сериям изображений можно оценивать интегральные характеристики состояния биоразнообразия в интересующих регионах в различные временные интервалы, своевременно обнаруживать опасные аномалии в распределении биологических видов

Слайд 6 (Цель дипломной работы)

Целью дипломной работы является разработка и интеграция в GRID портал ЦКП информационно-аналитической системы для изучения состояния морского биологического разнообразия залива Петра Великого по данным подводной фотосъемки.

Слайд 7 (Задачи)

Для достижения поставленной цели необходимо было решить следующие задачи.

Слайд 8 (Архитектура РИАС)

При решении первой задачи были сформулированы функциональные требования к системе и с учетом этого спроектирована архитектура РИАС. Сейчас не буду на этом останавливаться более подробно

Слайд 9 (Выбор средств реализации)

Основным языком программирования была выбрана Java для интеграции портлета в GRID портал, некоторые модули были написаны на Си с поддержкой библиотеки OpenCV и для запуска приложения в системе кондор

Слайд 10 (Биоописание изображения)

Следующей поставленной задачей было разработать модель биоописания изображения. Биоописание это перечень всех объектов, встречающихся на изображении (показывать все это указкой) с указанием видов и морфометрических характеристик, очень хорошо эти характеристики можно описать эллипсом.

Слайд 11 (работа эксперта-биолога, предобработка)

Третья задача состояла в разработке интерфейса для пользователей-экспертов, которые должны составлять биоописание фотоизображений. Выбрав изображение из базы данных, эксперт может применить различные процедуры обработки для улучшения зрительного восприятия объектов.

Слайд 12 (работа эксперта-биолога, ручное описание)

Сам процесс биоописания осуществляется следующим образом. Распознав визуально объект, эксперт с помощью мыши описывает его эллипсом. И указывает биологический вид объекта из таблицы видов. При этом положение и морфометрические характеристики рассчитываются автоматически и заносятся в базу данных. Процедура очень удобна и позволяет провести за 20-30 секунд полное описание всего снимка. Поскольку система допускает одновременную работу нескольких экспертов то все вместе они способны составить описания большого числа изображений.

Слайд 13 (Задача автоматического биоописания, template matching)

Тем не менее, в перспективе актуальна задача автоматизации процесса биоописания изображений. Поэтому в рамках четвертой задачи необходимо было исследовать возможности некоторых алгоритмов автоматического распознавания. Первым алгоритмом был template matching, основанный на поиске максимума кросскорреляционной функции изображения и эталонов объектов. На слайде представлен пример работы данного алгоритма. В целом эффективность алгоритма признана недостаточной.

Слайд 14 (Задача автоматического биоописания, цветовая сегментация)

Для видов явно отличающихся по цвету от фона мной был разработан алгоритм цветовой сегментации. В тексте диплома приведено его подробное описание, здесь же показан пример его работы при распознавании асцидии пурпурной. В целом он неплохо работает для распознавания объектов четырех видов: Амурской морской звезды, Асцидии пурпурной, серого морского ежа и гребешковой патирии.

Слайд 15 (Задача автоматического биоописания, Виола-Джонс)

Третьим исследованным алгоритмом был алгоритм на основе Виола-Джонса. С некоторыми модификациями признакового пространства. Он представляет собой обученный каскадный распознаватель. На слайде цифрами 1 2 3 обозначены классификаторы. На вход каскада подаются участки исследуемого изображения, в процессе классификации участки, на которых нет искомых объектов отбрасываются, а участки прошедшие каскад считаются классифицированными как объект заданного вида.

Слайд 16 (Пример работы алгоритма)

Пример работы этого алгоритма представлен на слайде. Здесь синими прямоугольниками представлены области интереса алгоритма, а эллипсами обведены распознанные гребешковые патирии. Особенностью этого алгоритма является длительный процесс обучения, так например при обучающей выборке в 160 объектов время обучения на одном компьютере составило двое суток. В связи с этим, была разработана и встроена в РИАС версия данного алгоритма для работы в системе высокопроизводительных вычислений CONDOR. Она необходима для распознавания объектов на больших группах снимков.

Слайд 17 (работа пользователя ЦКП, фильтр)

Следующей задачей было создание интерфейса для обычного пользователя. Ему предоставляется возможность запрашивать нужные данные из общей базы данных, указывая временные, пространственные и биологические фильтры.

Слайд 18 (работа пользователя ЦКП, просмотр изображения)

После этого он может просмотреть подробное биоописание каждого снимка, либо получить интегральные характеристики по выбранной совокупности данных.

Слайд 19 (Интегральные характеристики биоописания)

В рамках шестой задачи необходимо было провести апробацию системы. Для этого были зарегистрированы 5 пользователей с правами биолога-эксперта (3 специалиста из ИБМ и 2 из ТОИ) и 3 пользователя с правами “обычный пользователь”. В частности экспертами было составлено биоописание по выборке из 245 изображений полученных на полигоне вблизи о-ва Б. Пелис в 2006 году. На слайде представлены интегральные характеристики биоописания.

Слайд 20 (Заключение)

В результате работы все поставленные задачи были решены. Разработана и встроена в GRID портал РИАС “Биоразнообразие”. Разработана модель биоописания подводной сцены, создан интерфейс для проведения биоописания экспертами-биологами, исследованы и реализованы несколько алгоритмов автоматического распознавания объектов, создан интерфейс для работы с системой участников ЦКП, Проведена апробация системы на ограниченном массиве данных. Система используется при выполнении работ по ЦКП.

Спасибо за внимание