Авторефераты по всем темам  >>  Авторефераты по разным специальностям


На правах рукописи

ДОЛГИЙ АЛЕКСАНДР ИГОРЕВИЧ

ИНТЕЛЛЕКТУАЛЬНЫЕ МОДЕЛИ И КОМПЛЕКСЫ ПРОГРАММ ОБРАБОТКИ ТЕМПОРАЛЬНОЙ ИНФОРМАЦИИ В БАЗАХ

ДАННЫХ ГЕОДИАГНОСТИЧЕСКИХ СИСТЕМ НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ

Специальности: 05.13.06 - Автоматизация и управление технологическими

процессами и производствами (на транспорте)

05.13.17 - Теоретические основы информатики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Ростов-на-Дону

2008

Работа выполнена в государственном образовательном учреждении высшего профессионального образования Ростовский государственный университет путей сообщения (РГУПС)

Научный руководитель: доктор технических наук, профессор

Ковалев Сергей Михайлович

Официальные оппоненты: доктор технических наук, профессор

Лябах Николай Николаевич

кандидат технических наук, профессор

Тарасов Валерий Борисович

Ведущая организация: Таганрогский технологический институт

Южного федерального университета

(ТТИ ЮФУ), г. Таганрог

Защита диссертации состоится 24 сентября 2008 г. в 15.00 на заседании диссертационного совета Д 218.010.03 при Ростовском государственном университете путей сообщения по адресу: 344038, г. Ростов-на-Дону, пл. Ростовского Стрелкового Полка Народного Ополчения, 2, конференц-зал.

С диссертацией можно ознакомиться в библиотеке Ростовского государственного университета путей сообщения по адресу: 344038, г.Ростов-на-Дону, пл. Ростовского Стрелкового Полка Народного Ополчения, 2.

Автореферат разослан л августа 2008 г.

Ученый секретарь

диссертационного совета Д 218.010.03

доктор технических наук, доцент Бутакова М.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. В последние годы на железных дорогах Российской Федерации наблюдается постоянный рост грузовых и пассажирских перевозок, что влечет за собой усиление требований к стабильности земляного полотна железнодорожного пути. В этом плане определяющую роль играют оперативные диагностические мероприятия, прямым образом влияющие на реализацию превентивных мер по предотвращению деформаций рельсовой линии и достижению требуемой работоспособности железнодорожного пути.

Диагностирование состояния земляного полотна железнодорожного пути включает массу мероприятий, основанных на геофизических методах, многие из которых базируются на традиционных технологиях сбора и обработки данных, что заметно ограничивает их возможности. Повышение требований к оперативности, производительности, достоверности и качеству принимаемых решений обусловили перевод диагностических систем на новую информационную основу. В частности, это касается развития методов диагностирования состояния земляного полотна железнодорожного пути на основе использования технологий георадиолокационного неразрушающего зондирования.

На сегодняшний день такой подход удовлетворяет большинству предложенных требований, но главным его достоинством является наличие потенциальных возможностей интеллектуализации. Под интеллектуализацией понимается извлечение полезных знаний из сырых георадиолокационных данных и автоматический вывод заключений о состоянии зондируемой среды, представленных в форме лингвистических экспертных оценок. Процесс выявления знаний подразумевает анализ данных с целью получения знания, представленного в виде новых, полезных, доступных для понимания и пригодных для автоматической интерпретации образов в данных.

Многие проблемы, связанные с анализом данных, включают в себя темпоральные аспекты. Наиболее распространенный вид темпоральных данных - временные процессы и ряды, в которых повторяющиеся наблюдения признаков порождают схожие по структуре последовательности данных. Особый класс временных процессов образуют слабо формализованные процессы, порожденные отраженными электромагнитными сигналами, распространяемыми в нелинейных средах. Одной из ключевых проблем, возникающих при разработке систем выявления знаний, автоматической интерпретации и архивирования информации в системах диагностики, базирующихся на таких принципах, является проблема представления данных в информационных базах экспертно-диагностических систем.

Развитие новых подходов к представлению информации в базах данных временных рядов (БД ВР), ориентированных на использование в геодиагностических системах, является необходимым условием на пути к автоматизации процессов мониторинга и диагностики железнодорожных объектов.

Большой вклад в развитие интеллектуальных технологий и теоретических основ информатики внесли такие ученые как А.Н. Аверкин, И.З. Батыршин, Л.С. Берштейн, Г.И. Белявский, В.Н. Вагин, А.Н. Гуда, А.П. Еремеев, В.В. Емельянов, А.Н. Каркищенко, С.М. Ковалев, В.М. Курейчик, Н.Н. Лябах, Г.С. Осипов, Э.В. Попов, Д.А. Поспелов, В.Б.Тарасов, В.К. Финн, В.И. Финаев, И.Б. Фоминых, Н.Г. Ярушкина и др.

Большой вклад в развитие теории и практики георадиолокационной диагностики на железнодорожном пути и автомобильных дорогах внесли отечественные ученые Е.С. Ашпиз, В.И. Грицык, А.Г. Круглый, В.В Помозов, Н.П. Семейкин, В.А. Явна и др.

Цель работы. Целью диссертационной работы является исследование и разработка новых методов формализации, выявления и представления знаний в базах данных временных рядов, с последующим их использованием при выявлении и текстовом резюмировании аномалий в базах данных геодиагностических систем.

Для достижения поставленной цели требуется решить следующие задачи:

  1. На основе комплексного анализа современных методов и средств извлечения знаний в БД ВР определить концепцию совершенствования средств автоматической обработки диагностической информации.
  2. Разработать методологию представления нечетко-определенных знаний в темпоральных базах данных, ориентированную на поддержку процессов текстового резюмирования в подсистемах лингвистического обеспечения АСУ ТП.
  3. Сформировать методологию оценки интерпретационной пригодности и эффективности работы моделей представления и текстового резюмирования нечетких темпоральных знаний в БД ВР.
  4. Адаптировать статические алгоритмы выявления знаний к процедурам поиска нечетких темпоральных знаний, представленных в форме текстовых резюме.
  5. Разработать методы извлечения и текстового резюмирования знаний в БД геодиагностических систем с целью автоматизации процесса интерпретации георадиолокационной информации.

Методы исследования. Для решения поставленных задач использовались следующие методы исследований: элементы темпоральной логики, методы теории множеств и нечетких множеств, методы теории графов, элементы теории эволюционного моделирования, методы цифровой обработки временных сигналов.

Научная новизна. Научная новизна диссертационной работы заключается в следующем:

  1. На основе общесистемных принципов организации человеческого мышления и речевой коммуникации впервые разработана формализованная методология оценки адекватности и интерпретационной пригодности моделей представления нечетких темпоральных знаний в базах данных интеллектуальных информационно-диагностических систем.
  2. На основе предложенной методологии оценки эффективности представления знаний разработана иерархическая модель представления нечетко-определенных знаний в темпоральных базах данных, удовлетворяющая критериям интерпретационной пригодности и ориентированная на поддержку процессов текстового резюмирования в подсистемах лингвистического обеспечения специализированных АСУ ТП.
  3. Разработаны алгоритмы и программы поиска нечетких темпоральных знаний в базах данных временных рядов, основанные на концепциях эволюционного моделирования и лаприори-поиска, позволяющие выявлять элементы знаний в текстовой форме, пригодной для непосредственного использования в подсистемах лингвистического обеспечения автоматизированных информационно-диагностических систем.
  4. Разработан комплекс алгоритмов и программ для автоматического поиска темпоральных знаний в темпоральных базах данных геодиагностических систем и их лингвистической интерпретации в организационно-технологической системе диагностирования состояния земляного полотна железнодорожного пути.

Практическая ценность. Практическая ценность диссертационной работы заключается в следующем:

  1. Разработанная иерархическая модель представления нечетких темпоральных знаний в БД ВР, ориентирована на использование в различных поисковых системах, системах архивации данных, подсистемах лингвистического обеспечения и текстового резюмирования данных.
  2. Разработана методология оценки эффективности моделей представления нечетких темпоральных знаний в БД ВР, нашедшая применение при разработке широкого класса систем интеллектуального анализа темпоральной информации.
  3. Формализованы темпоральные признаки, выступающие в качестве базовых примитивов экспертного инструментария при создании программных средств автоматической интерпретации георадиолокационной информации.
  4. Реализован программный комплекс автоматического профилирования и интерпретации георадиолокационных данных GeoRailway+, позволяющий формировать подробное и наглядное заключение о состоянии балластного слоя и в разы сокращающий время обработки информации в БД геодиагностических систем (ГДС).

Достоверность и обоснованность. Достоверность и обоснованность научных положений, выводов и результатов, сформулированных в диссертации, подтверждается доказательством утверждений, результатами вычислительных экспериментов на практических и модельных задачах, публикациями и докладами на научно-практических конференциях, а также актами внедрения результатов работы.

Реализация результатов работы. Предложенные алгоритмы выявления нечетких темпоральных признаков и представления знаний в БД ГДС были реализованы в программном комплексе автоматического профилирования и интерпретации георадиолокационных данных GeoRailway+, разработанного согласно плану НИОКР Департамента пути и сооружений ОАО РЖД на тему Разработка технологии и программно-технического комплекса для скоростной диагностики состояния балластной призмы методом георадиолокации, в 2007-2008 гг.

Апробация. Апробация основных теоретических и практических результатов работы проводилась на научных семинарах кафедр Автоматика и телемеханика на железнодорожном транспорте и Физика (с 2005 по 2008 гг., РГУПС), Шестом всероссийском симпозиуме по прикладной математике в 2005 г., международных научно-практических конференциях Инженерная геофизика 2006, Инженерная и рудная геофизика 2007, Инженерная и рудная геофизика 2008 (Геленджик, 2006-2008 гг.).

Публикации. По теме диссертационной работы опубликовано 11апечатных работ, в том числе 7 работ опубликованы в изданиях, входящих в перечень ведущих рецензируемых научных журналов и изданий ВАК.

Структура и объем работы. Диссертация состоит из введения, четырех глав, общих выводов и списка литературы и приложения. Общий объем работы составляет 192 страницы машинописного текста, 54 рисунка, 11атаблиц. Список литературы включает 103 наименования отечественных и зарубежных авторов.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сформулированы цели, дано общее описание выполненной работы.

В первой главе выполнен комплексный анализ объекта исследования - баз данных временных рядов, включая хранилища геодиагностических данных, методы и модели поддержки извлечения знаний из баз данных.

В процессе анализа произведена комплексная классификация различных принципов построения современных БД, определены основные проблемы, стоящие перед разработчиками современных программных средств СУБД, а именно: постоянно растущие объемы БД и необходимость совершенствования существующих технологий извлечения знаний и адаптации их к решению частных задач. Рассмотрены основные задачи, фазы и этапы процесса Knowledge Discovery in Databases (КDD), описана типовая архитектура его программной реализации, а также приведены примеры существующих систем KDD, базирующихся на различных вычислительных инструментариях.

Руководствуясь интересами автора в области геодиагностики, обоснована необходимость интеллектуализации процесса анализа получаемых диагностических данных. Определена базовая концепция формирования экспертных заключений о состоянии объектов диагностирования по средствам текстовых резюме. На основании этого описана методика формирования баз знаний (БЗ) ГДС основываясь на лингвистических описаниях отраженных электромагнитных сигналов на примере гранулирования осей направления временных рядов и степени выпуклости-вогнутости функций.

Во второй главе предложена новая иерархическая модель представления нечетко-темпоральных знаний, опирающаяся на адекватное обобщение существующих методов формализации темпоральных отношений.

Разработанная иерархическая модель представления нечетких темпоральных образов включает три уровня, позволяющих представить в модели все основные темпорально-логические концепты данных. Первый, нижний уровень представлен темпоральными образами нечетких событий и отражает темпорально-логический концепт нечеткой продолжительности. Второй уровень представлен нечеткими темпоральными отношениями и отражает два основных темпоральных концепта одновременности и очередности, описывающих координацию нечетких событий во времени. Третий, верхний уровень модели представлен нечетко-темпоральными структурами, объединяющими образы событий и отношений в единый нечетко-темпоральный образ.

Предложен подход к формализации нечетких темпоральных признаков в виде семиотических кортежей-двоек, обеспечивающий возможность унификации систем нечетких темпоральных признаков, а также их алгоритмическую, синтаксическую и семантическую поддержку в процессе выявления знаний. Для описания синтаксиса образов используется конечное множество меток, а для описания семантики - множество нечетких характеристических функций, где - конечное множество всех временных интервалов на дискретной временной шкале T.

Первый уровень модели представлен образом нечеткого темпорального ПРИЗНАКА (НТП):

,

где - метка, обеспечивающая текстовое описание образа, - характеристическая функция выраженности признака на данном временном интервале.

Второй уровень представлен образом ОТНОШЕНИЯ, в основу определения которого положено обобщение темпоральных отношений Алена на случай нечетких событий.

Нечетким темпоральным образом ОТНОШЕНИЯ называется двойка




   Авторефераты по всем темам  >>  Авторефераты по разным специальностям