На правах рукописи
Чижова Ирина Александровна
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАЗРАБОТКИ ГИБРИДНЫХ ЭКСПЕРТНЫХ СИСТЕМ ДЛЯ ПРОГНОЗА И ОЦЕНКИ РУДНЫХ МЕСТОРОЖДЕНИЙ
Специальность 25.00.35 - Геоинформатика
Автореферат диссертации на соискание ученой степени доктора геолого-минералогических наук
Москва, 2010
Работа выполнена в Учреждении Российской академии наук Институте геологии рудных месторождений, петрографии, минералогии и геохимии РАН (ИГЕМ РАН) Научный консультант академик Лаверов Николай Павлович
Официальные оппоненты: академик Рундквист Дмитрий Васильевич Государственный геологический музей им. В.И.Вернадского РАН академик Арский Юрий Михайлович Всероссийский институт научной и технической информации РАН член-корреспондент РАН Гвишиани Алексей Джерменович Геофизический центр РАН
Ведущая организация:
Государственный научный центр Российской Федерации Всероссийский научно-исследовательский институт геологических, геофизических и геохимических систем (ГН - РФ ВНИИгеосистем)
Защита состоится 27 октября 2010 года в 11:00 на заседании диссертационного совета Д 002.122.02 при Учреждении Российской академии наук Институте геологии рудных месторождений, петрографии, минералогии и геохимии РАН (ИГЕМ РАН) по адресу:
119017 Москва, Старомонетный пер., д. 35.
С диссертацией можно ознакомиться в библиотеке ИГЕМ РАН.
Автореферат разослан л сентября 2010 г.
Ученый секретарь диссертационного совета кандидат геолого-минералогических наук Н.Н.Тарасов
Общая характеристика работы
Анализируя тенденции развития информационных технологий в геологии, можно отметить следующее: сначала наиболее бурно шел процесс перевода всех геологических данных в цифровой вид, сейчас эта задача становится неотъемлемой и обязательной частью внедрения компьютерных технологий, и на передний план выходят задачи анализа имеющихся данных, решение которых напрямую связаны с использованием информационных технологий. Это потребовало значительных работ по структуризации и стандартизации исходных данных [Гвишиани, 1995; Арский и др., 1998, 2007; Чесалов, 2005;
Чесалов и др., 2006; Лаверов и др., 2008 и др.]. Унификация систем описания позволяет проводить сопоставление исследуемых объектов.
Первые шаги информационных технологий в геологии были связаны с задачей автоматизации рутинных операций, которая в настоящее время практически решена. Широкое распространение получили ГИС-системы [Рундквист и др., 1996; Наумова, 2004;
Черемисина, Никитин, 2006; Черемисина, Суханов, 2008 и др.], что позволило производить анализ пространственного размещения геологических объектов и изучать распределение пространственной изменчивости наблюдаемых величин путем построения карт.
Следующим кардинальным скачком стало использование систем извлечения знаний (Data mining), нацеленных на поиск закономерностей в огромном наборе фактических данных. Эти методы позволили перейти от данных (совокупности сведений) к знаниям (закономерностям, значимым для пользователя-геолога). Ряд исследователей разрабатывали специальные методы для решения геологических задач [Дмитриев и др., 1966; Куклин, 1967; Константинов, 1973; Дмитриев, Красавчиков, 1977; Лбов, 1981; Бекжанов и др., 1987; Гвишиани, Гурвич, 1992; Воронин и др., 1996; Агаян и др., 2005; Тюпкин и др., 2006;
Гвишиани и др., 2008 и др.]. Применение полученных научных результатов способствовало повышению эффективности этих решений, ускоряя процесс их принятия, и достоверности выводов.
Актуальность темы Изучение рудных месторождений является одним из стратегических направлений геологических исследований, обеспечивающих развитие наук о Земле. Проблема прогноза и оценки рудных месторождений является актуальной, поскольку напрямую связана с расширением минерально-сырьевой базы, обеспечивающей экономическое развитие страны. Для решения этой проблемы необходимо использование современных геоинформационных технологий для повышения эффективности, точности и достоверности прогноза и оценки.
В настоящее время актуален переход от систем, оперирующих с данными с целью получения знаний, к системам, использующим знания для решения геологических задач. Назрела необходимость создания идеологии и методологии разработки экспертных систем современного уровня, целями которых являются совершенствование процедур анализа геологических ситуаций и повышение эффективности принятия решения пользователями в условиях неопределенностей.
В этой связи актуальна и важна проблема разработки информационных технологий для прогноза и оценки рудных месторождений на базе экспертных систем. Применение в этой области компьютерных технологий позволяет значительно упростить задачу исследователя и ускорить ее выполнение.
Цель работы Основной целью работы является создание теоретических основ разработки гибридных экспертных систем для прогноза и оценки рудных месторождений.
Задачи работы Для достижения этой цели решались следующие основные задачи:
1. Исследование принципов и методов создания экспертных систем.
2. Обоснование оптимальности гибридных экспертных систем для решения прогнозных задач.
3. Разработка технологии создания гибридных экспертных систем для решения прогнозных задач.
4. Разработка методов анализа геологической информации с целью извлечения знаний и построения математических моделей изучаемых объектов, исследования и описания их свойств.
5. Разработка компонентов программного и информационного обеспечения для реализации предложенной технологии с дружественным интерфейсом по отношению к пользователю.
6. Апробация предложенной технологии при создании экспертных систем для прогноза и оценки рудных месторождений.
Защищаемые положения 1. Разработаны научно-методические основы использования гибридных экспертных систем для решения задач прогноза и оценки рудных месторождений, в которых предусмотрено сочетание различных способов представления научных знаний (знаний экспертов;
закономерностей, получаемых в результате обработки имеющейся базы данных). Гибридные экспертные системы, основанные на комплексных базах знаний, обеспечивают непосредственное использование научных знаний в решении поставленных задач и являются инновационной информационной технологией.
2. Гибридные экспертные системы для прогноза и оценки рудных месторождений основываются на методологии теории распознавания образов. В зависимости от выбранного подхода: принципа общности свойств или перечисления объектов - предложены алгоритмы представления имеющихся знаний об объекте исследования и системы принятия решений.
3. Разработаны обобщенные логико-информационные методы анализа рудных объектов для изучения их многофакторных моделей. Они обеспечивают получение надежных результатов при идентификации объектов на основе многомерной оценки информативности разнотипных признаков и автоматизируют процесс построения элементов комплексной базы знаний гибридной экспертной системы.
Разработан программный комплекс АСТРА, реализующий данные методы.
4. На базе теоретических основ разработки гибридных экспертных систем созданы специализированные экспертные системы АСТРА для прогноза и оценки золото-серебряных месторождений ОхотскоЧукотского вулканогенного пояса, месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России, и система АНАЛОГ для оценки золоторудных месторождений на основе выбора ближайшего аналога среди эталонных золоторудных месторождений мира.
Методы исследования Для разработки гибридных экспертных систем использованы методы создания баз данных, баз знаний, методы углубленного анализа данных (data mining), линейного программирования, системный анализ, многомерные статистические методы, моделирование, методы создания программного обеспечения.
ичный вклад в разработку проблемы и фактический материал Многолетний опыт автора в области формализации геологических данных, применения и разработки математических методов и компьютерных технологий позволил создать базовую основу для настоящей работы.
Диссертация основана на теоретических исследованиях и результатах математического анализа данных, выполненных автором.
Соответствующее программное обеспечение разработано автором.
Для апробации технологии разработки гибридных экспертных систем использовались материалы высококвалифицированных экспертов-геологов, принимавших участие в создании баз знаний соответствующих специализированных экспертных систем. База данных по золото-серебряным полям Охотско-Чукотского вулканогенного пояса подготовлена д.г.-м.н. М.М.Константиновым и С.Ф.Стружковым. База данных по рудным объектам золото-кварцевой и золоторедкометалльно-кварцевой формации Северо-Востока России составлена под руководством к.г.-м.н. Г.М.Курбанаева. База данных по золоторудным месторождениям мира подготовлена под руководством д.г.-м.н. М.М.Константинова.
Формализация, структуризация, и представление знаний в разработанных гибридных экспертных системах проведены совместно с экспертами-геологами. Программное обеспечение для функционирования экспертных систем разработано совместно с Хмелевой Н.А., Поляковым Р.С., Покровским Д.А.
Научная новизна работы Х Теоретически обоснована технология разработки гибридных экспертных систем для прогноза и оценки рудных месторождений.
Х Создана методика решения прогнозных задач на основе предложенной технологии разработки гибридных экспертных систем.
Х Впервые разработаны обобщенные логико-информационные методы анализа геологической информации, обеспечивающие извлечение знаний для решения прогнозных задач.
Х Предложены оптимальные процедуры хранения разнотипной геологической информации.
Х Созданы специализированные экспертные системы для прогноза и оценки рудных объектов.
Х В качестве информационной основы для характеристики эталонных объектов при выборе ближайшего аналога в экспертных системах предложено использовать помимо фактографической и графическую (включающую когнитивную графику) базы данных.
Практическая ценность Теоретическое обоснование создания гибридных экспертных систем является научно-технической основой для разработки экспрессных технологий оценки прогнозных ресурсов и выявления перспективных площадей, позволяющих на самых ранних стадиях геоло гических работ дать заключение о металлогенической специализации района, массива или месторождения и его перспективности.
Использование специализированных экспертных систем, разработанных на основе предложенной технологии, обеспечивает достоверность и надежность решения задач стратегической оценки территории России в отношении распределения площадей, перспективных на обнаружение различных генетических типов стратегических видов полезных ископаемых, и тем самым способствует минимизации финансовых затрат на проведение прогнозных и оценочных работ.
Полная апробация технологии проведена на материале по золоторудным объектам.
Созданы специализированные экспертные системы АСТРА для прогноза и оценки золото-серебряных месторождений ОхотскоЧукотского вулканогенного пояса и месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России.
Создана информационно-аналитическая экспертная система АНАЛОГ для оценки золоторудных месторождений на основе выбора ближайшего аналога среди эталонных золоторудных месторождений мира, информационной основой которой являются две базы данных:
фактографическая - позволяющая хранить и анализировать количественную и качественную информацию об эталонных и экспертируемых объектах, и графическая - содержащая визуализированную информацию об эталонных месторождениях.
Апробация работы Основные положения и результаты исследований докладывались и обсуждались на следующих международных и отечественных симпозиумах, форумах, конференциях, семинарах, совещаниях: Научнопрактические конференции УНаучно-технические достижения ЦНИГРИ в 1991 г.Ф, УНТД-92-ЦНИГРИФ, УНТД-96-ЦНИГРИФ (Москва, ЦНИГРИ, 1991, 1993, 1997); IX Всесоюзное совещание по геологии россыпей (Бишкек, 1991); Всесоюзное совещание УТеоретические основы выявления новых источников рудного сырьяФ (Москва, 1991); Международный форум информатизации-93 (Москва, Международная Академия информатизации, 1993); Симпозиум УРудноформационный анализ - состояние и перспективыФ (Москва, 1996); Конференция УМировая минеральносырьевая база алмазов, благородных и цветных металлов на рубеже веков - перспективы использования и воспроизводстваФ (Москва, ЦНИГРИ, 1998); 3-я Всероссийская научно-практическая конференция УГеоинформатика в нефтегазовой и горной отрасляхФ (Москва, РАГС, 2000); Годичное собрание минералогического общества при РАН и Школе УГеологические и минералогические критерии крупных и уникальных месторожденийФ (Санкт-Петербург, 1994); Годичная сессия МО ВМО УМинералогия на пороге XXI векаФ (Москва, 1996, 2005); IX съезд ВМО УМинералогическое общество и минералогическая наука на пороге XXI векаФ (Санкт-Петербург, 1999); ХII Международное совещание УПриродные и техногенные россыпи и месторождения кор выветривания на рубеже тысячелетийФ (Москва, ИГЕМ РАН, 2000);
Международный семинар по дискретной математике и ее приложениям (Москва, МГУ, 1993, 1995, 2001); XIV международная конференция УПроблемы теоретической кибернетикиФ (Пенза, 2005); IX международной конференции "Интеллектуальные системы и компьютерные науки". (Москва, МГУ, 2006); Конференция, посвященная 10-летию РФФИ (Москва, ИГЕМ РАН, 2002); Международный симпозиум, посвященный 100-летию со дня рождения А.Г.Бетехтина УОсновные проблемы в учении о магматогенных рудных месторожденияхУ (Москва, 1997); 4-я, 6-я, 9-я и 10-я Международные конференции УФизикохимические и петрофизические исследования в науках о ЗемлеФ (Москва, ИГЕМ РАН, ОИФЗ РАН, 2003, 2005, 2008, 2009); V Международный конгресс по математическому моделированию (V ICMM) (Дубна, JINR, 2002); 30-й - 33-й Международные геологические конгрессы (Пекин, Китай, 1996; Рио де Жанеро, Бразилия, 2000;
Флоренция, Италия, 2004; Осло, Норвегия, 2008); 1-й, 3-й - 6-й Европейские конгрессы по региональной геологической картографии и информационным системам (Болонья, Италия, 1994; Мюнхен, Германия, 2000; Болонья, Италия, 2003, Барселона, Испания, 2006; Мюнхен, Германия, 2009); Ежегодные конференции Международного общества по математической геологии (Барселона, Испания, 1997; Неаполь, Италия, 1998; Берлин, Германия, 2002; Портсмут, Великобритания, 2003;
Торонто, Канада, 2005; Льеж, Бельгия, 2006); Симпозиумы ассоциации генезиса рудных месторождений (IAGOD) (Пекин, Китай, 1994; Москва, 2006); V и VI Международные Симпозиумы по применению математических методов и компьютеров в геологии, горном деле и металлургии (Дубна, Россия, ВНИИГеосистем, 1996; Прага, Чехия, 1997); Международная конференция УComputerized modeling of sedimentary systemsФ (Густров, Германия, 1996); Генеральная ассамблея Европейского геологического союза (Вена, Австрия, 2008); Совещание УКомпьютерные технологии ведения геологоразведочных, рудничных и экологических работФ (Москва, ВНИИХТ, 1998); IX рабочее совещание по созданию Государственного банка цифровой геологической информации (ГБЦГИ) (Москва, ГлавНИВЦ, 1995); Рабочий семинар УИнформационные технологии при производстве геологоразведочных работ. Современное состояние и перспективы развитияФ (Москва, Геоинформсистем, 2007);
Международная конференция, посвященная 250-летию Государственного геологического музея имени В.И.Вернадского РАН Геология: история, теория, практика (Москва, 2009).
Публикации По теме диссертации опубликовано 153 работы, 27 из которых - в реферируемых журналах, 2 - в международных журналах, 44 - в сборниках материалов международных конференций.
Структура и объем работы Диссертация состоит из введения, 6 глав, заключения и содержит 297 страниц текста, 53 рисунка, 18 таблиц. Список литературы включает 214 наименований.
Благодарности Автор выражает особую благодарность академику Н.П.Лаверову, члену-корреспонденту РАН Ю.Г.Сафонову, проф. Е.Н.Черемисиной, доктору геол.-мин. наук М.М.Константинову за постоянную помощь и обсуждение результатов; проф. В.Б.Кудрявцеву, по совету которого мои исследования были направлены на создание экспертных систем.
Светлая и благодарная память Р.М.Константинову - моему учителю в течение первых десяти лет моей научной деятельности;
Д.Г.Ажгирею и Г.М.Курбанаеву - с которыми были разработаны первые автоматизированные системы прогнозно-поисковых комплексов - прообразы сегодняшних экспертных систем; С.Ф.Стружкову - с которым на протяжении 20 лет создавались специализированные экспертные системы; Н.Г.Патык-Кара - с которой долгие годы проводились совместные работы по анализу россыпных месторождений.
Искреннюю признательность автор выражает академику В.И.Коваленко, А.В.Веселовскому, Н.Г.Демидовой, В.И.Казанскому, И.Б.Флерову, за советы, полученные в ходе работы над темой;
И.Ф.Мигачеву, А.И.Кривцову за поддержку при проведении тематических работ ЦНИГРИ по созданию экспертных систем;
.А.Николаевой, С.В.Яблоковой; В.В.Кузнецову, Е.В.Матвеевой, Ю.И.Гольдфарбу за непосредственное участие в создании экспертных систем; Н.А.Хмелевой, Р.С.Полякову, Д.А.Покровскому за помощь при подготовке программных реализаций систем; А.Г.Горелову, Т.Н.Косовец, А.А.Пэку, К.В.Лобанову, В.И.Мальковскому, А.В.Волкову, А.В.Жарикову, В.В.Дистлеру, И.Т.Расс за советы и дружескую поддержку.
СОДЕРЖАНИЕ РАБОТЫ
ВВЕДЕНИЕ Во введении автором обосновывается актуальность темы диссертации, определяются основные задачи и цели работы и приводится перечень фактических материалов, которые положены в основу разработанных гибридных экспертных систем.
ГЛАВА 1. Экспертные системы - путь к решению прогнозных задач В Главе 1 дана общая постановка проблемы разработки экспертных систем и их возможностей для решения задач при прогнозно-металлогенических исследованиях. Обоснована необходимость использования гибридных экспертных систем при решении задач прогноза и оценки рудных месторождений.
В настоящее время интенсивно разрабатываются и находят практическое применение для решения прикладных задач в области геологии экспертные системы (ЭС). Под экспертной системой понимается компьютерная программа, использующая знания и логику рассуждений эксперта с целью выработки рекомендаций или решения проблем. ЭС способствуют получению обоснованной оценки перспективных площадей и переоценки ранее открытых месторождений, обычно проводящейся при учете прироста запасов.
Использование ЭС весьма удобно для геолога. Пользователь работает с системой в режиме диалога и, в случае необходимости, может получить нужные ему пояснения о ходе логического вывода.
Наиболее эффективными в этом направлении являются гибридные экспертные системы, база знаний которых включает не только знания экспертов, но и закономерности, получаемые в результате анализа имеющихся баз данных.
Впервые понятие гибридных экспертных систем было введено Г.С.Поспеловым в 1977 г. [www.ccas.ru]. Гибридные экспертные системы позволяют использовать преимущества традиционных средств и методов искусственного интеллекта, более эффективно соединять формализуемые и неформализуемые знания за счет интеграции традиционных средств искусственного интеллекта.
Использование знаний квалифицированных экспертов позволяет распространить их среди менее квалифицированных специалистов, обеспечивая получение обоснованных решений, рекомендуемых экспертной системой. Последовательность этапов процесса принятия решения может быть прослежена в ходе анализа работы блока принятия решения системы.
Прогнозная задача была первой среди геологических задач, для решения которой использовалась технология экспертных систем. В этом случае основой прогнозирующей системы являются многофакторные модели рудных объектов, в том виде, как они представляются геологам.
Согласно принципу последовательной детализации в качестве основных пространственных прогнозно-металлогенических таксонов, как объектов исследования, выделяются металлогеническая зона, рудный район, рудный узел, рудное поле, месторождение.
Экспертная система позволяет на основе использования разнообразных методов и методик решать ряд разнообразных задач в процессе реализации общей технологической схемы решения прогнозных задач. В качестве основных задач прогноза и оценки рудных месторождений выделяются: определение рудно-формационного типа месторождений и оценка их масштабности. Правила проведения прогнозной оценки перспективной территории формулируются экспертом-геологом или рассчитываются по эталонным объектам базы данных, что повышает объективность результата.
В базу знаний ЭС помещается вся геологическая информация, характеризующая объекты исследования. ЭС имитирует процесс принятия прогнозных решений специалистом-геологом, давая по ходу решения необходимые пояснения.
Методика получения знаний от экспертов представляет собой совокупность следующих процедур:
Х сбор первичной информации, на основе данных диагностических методов, получивших положительную оценку эксперта в результате практической деятельности;
Х использование опыта и знаний экспертов для совместной разработки и создания ситуационной модели, а также определение правил исследования;
Х совместная оценка полученных результатов исследования и целесообразности развития и использования системы принятия решений.
Подход к построению системы на основе приобретения знаний от экспертов содержит такие этапы как идентификация, концептуализация, формализация, реализация, тестирование.
Индивидуальность подхода заключается в принципах, которые реализуются на каждом из перечисленных этапов.
На этапе идентификации для разработки ситуационной модели определяются задачи, которые подлежат решению. Выявляются цели разработки, состоящие в получении системы принятия решений для анализа и оценки ситуаций в поставленной задаче. Определяются вычислительные ресурсы и группы экспертов по решаемой задаче.
На этапе концептуализации производится анализ проблемной области с участием экспертов, создается ситуационная модель;
определяется метод решения задач, проектируется структура баз данных для хранения имеющейся информации.
На этапе формализации создается модель анализа и оценки ситуаций, база данных, алгоритмы, которые обеспечивают необходимые расчеты.
На этапе реализации выбирается программная среда для разработки приложения, происходит преобразование формальных знаний в работающие программы по анализу и оценке ситуаций, а также по работе с используемыми структурами данных. Осуществляется наполнение базы знаний системы.
На этапе тестирования проводится совместная с экспертом проверка работы созданного варианта системы на конкретных задачах.
В процессе тестирования анализируются возможные источники ошибок.
В ходе сбора данных, предназначенных для решения задач, происходит процесс их преобразования в знания, необходимые для получения результата (рис. 1). От качества базы знаний целиком зависит успех в решении задач, поставленных перед экспертной системой.
Направление по созданию экспертных систем в геологии развивается сравнительно давно.
Среди ЭС, успешно применяемых в геологии, следует отметить ЭС для решения прогнозных задач:
1. PROSPECTOR - для оценки перспективности района на различные виды полезных ископаемых [Duda et al., 1979];
2. DRILLING ADVISOR - при бурении геологических разведочных скважин [Hollander, Iwasaki, 1983].
3. ГЕНЕЗИС - для автоматизации технологии построения и использования прогнознопоисковых комплексов (ППК) [Бугаец и др., 1986; Вострокнутов 1999, 2006];
Рис. 1. Схема процесса 4. SERGE - для классификации преобразования данныегеохимических аномалий при поисках информация-знаниятвердых полезных ископаемых решения (по [Попов и др., [Bonnefoy et al., 1989];
1996], с дополнениями) 5. ГЕО - для регионального прогноза свинцово-цинковых месторождений Болгарии [Гитис и др., 1989];
6. ОЛОВО - для оценки оловянных месторождений [Родионов, Сыркин, 1995];
7. Экспертная система для статистического прогнозирования средних и крупных месторождений [Zhao et al., 1996].
8. Прогнозный блок системы ГИС-INTEGRO [Черемисина, Финкельштейн, 1999];
9. Экспертная система для оценки масштабов вольфрамового оруденения [Митрофанов и др., 2008].
Все упомянутые выше экспертные системы опирались на базу знаний, построенную на основе получения знаний от эксперта и дальнейшего их структурирования, что является достаточно разработанной процедурой [Васильев и др., 2007; Арский, Финн, 2008 и др.].
В 1991 г. при создании автоматизированных прогнозно-поисковых комплексов автором впервые была применена технология построения гибридных экспертных систем, использующих базы знаний, включающие не только знания экспертов, но и закономерности, получаемые в результате анализа имеющихся баз данных по исследуемым геологическим объектам [Чижова, 1991; Чижова и др., 1991].
Использование экспертных систем достигло определенных результатов. Например, с помощью ЭС PROSPECTOR открыто месторождение молибдена, оцениваемое примерно в 100 млн. долл. Но некоторые исследователи отмечали и недостатки [Король, Сопель, 1988]. Например, большинство ЭС рассчитано на использование новичками, а если пользователь является квалифицированным специалистом, его знания играют пассивную роль или игнорируются.
В консультирующих и обучающих системах это оправдано, в других такая возможность активизации знаний специалистов используется.
Например, в разработанной автором системе АНАЛОГ [Чижова и др., 2009] возможен поиск аналога по любому набору признаков, выбранному в ходе экспертизы, что позволяет пользователю проверять сформулированные им различные гипотезы и сравнивать эффективность различных критериев. Современные технологии обеспечивают построение дружелюбного интерфейса.
Таким образом, выбирая соответствующую технологию разработки экспертных систем, в каждом конкретном случае можно в итоге получить оптимальную систему.
Разработанные обобщенные логико-информационные методы для решения прогнозно-металлогенических задач [Чижова, 1991, 2010] обеспечивают построение процедуры получения методического (расчет разделяющих весов признаков, получение модели типов эталонных объектов) и теоретического (расчет информационного веса экспертируемого объекта по рассчитанным весам признаков) знаний.
Полученные знания дополняют имеющиеся интуитивные (эвристические) и фактические знания об объекте исследования.
Интуитивное знание (и), систематизированные научные факты (ф), разработка методов создания, проверки и фиксации знания (м) и теоретические конструкции (т) учитывают множество элементов научного знания [Шарапов, 1995]. Поэтому с позиций системного анализа база знаний систем, включающая в себя все типы знаний, является наиболее развитой.
Учет знаний экспертов и закономерностей, полученных в результате математической обработки данных, обеспечивает построение надежных комплексных баз знаний об объекте исследования, способных решать сложные задачи прогноза и оценки.
Гибридные экспертные системы, основанные на комплексных базах знаний, могут быть рассмотрены как связующее инновационное звено между наукой и практикой, поскольку фундаментальные знания, содержащиеся в базах знаний ЭС, принимают непосредственное участие в процессе принятия решения. Поэтапность процесса принятия решения может быть прослежена в ходе анализа работы блока принятия решения системы.
Принципиальным преимуществом использования методологии ЭС является возможность представления реальных профессиональных знаний в виде многофакторных моделей. ЭС позволяют использовать всю сумму геологических знаний о размещении месторождений полезных ископаемых конкретного типа, накопленных в металлогенической теории, что позволяет существенно увеличить эффективность прогноза, повысить его точность и надежность.
Процесс актуализации (периодического обновления) баз данных, используемых для извлечения знаний, обеспечивает получение более полных и точных баз знаний.
Важнейшей чертой ЭС является переход от математических методов обработки информации к логическим.
Анализ имеющихся подходов к созданию методологических основ поиска и разведки месторождений с позиции выделения и типизации задач, решаемых на отдельных этапах и стадиях поисково-разведочного процесса, а также эффективного применения математических методов и ЭВМ показал, что наиболее конструктивен подход [Воронин, 1983], в котором основными теоретическими элементами являются схема разбиения на стадии и этапы, а также используемые на отдельных этапах и стадиях приемы описания геологических объектов, способы их классифицирования, районирования, сравнения, упорядочения. Именно этот подход и рекомендуется при создании дерева решений экспертных систем для прогноза и оценки рудных месторождений.
ГЛАВА 2. Технология проектирования экспертных систем В Главе 2 сформулированы основные принципы построения экспертных систем, обосновано, что тип гибридных экспертных систем наилучшим образом соответствует решению прогнозных геологических задач, поскольку дают возможность использовать знания квалифицированных экспертов-геологов и объективные закономерности, полученные в результате математического анализа имеющегося фактического геологического материала по объектам исследования на различных иерархических уровнях. Предложены 2 пути построения гибридных экспертных систем: на принципе общности свойств (АСТРА) и перечислении объектов (АНАЛОГ).
Основными принципами для построения распознающих систем являются принцип общности свойств (тип 1) и принцип перечисления (тип 2) [Ту, Гонсалес, 1978; Уотерман, 1989]. В первом случае, опираясь на принцип общности свойств, основанный на предположении, что объекты, образующие один класс, обладают свойством подобия, отраженного в их характеристиках, необходимо выделить системы информативных признаков, описывающих группу объектов в целом (отождествляющие признаки) и каждый тип в отдельности (делящие признаки), и на их основе построить решающее правило для отнесения экспертируемого объекта к одному из выделенных типов объектов. Во втором случае используется некоторая мера сходства для определения степени близости экспертируемого объекта к одному из эталонов. При этом возможен выбор ближайшего аналога экспертируемого объекта из эталонных объектов, содержащихся в базе данных, по любому набору признаков, что дает возможность пользователю проверять различные гипотезы и сравнивать эффективность работы выбранных критериев.
Экспертная система предназначена для помощи эксперту в оценке потенциала перспективных площадей. Автором разработаны технологии построения экспертных систем, базирующиеся на принципе общности свойств (АСТРА) и принципе перечисления объектов (АНАЛОГ) [Чижова, 2009]. В первом случае используются расчетно-логические решающие правила, полученные обобщенными логико-информационными методами, во втором случае используется некоторая мера сходства [Чижова, 2004], с помощью которой выбирается объект-аналог для оценки свойств экспертируемого объекта.
Особенности построения баз знаний при использовании этих подходов представлены на рис. 2. Различия заключаются в выборе способов описания объектов исследования и их типов, вида расчетных функций и решающих правил.
Механизм вывода решений использует правила типа "И", "ИЛИ", "Байеса" и решающие правила на основе весовых коэффициентов.
Рис. 2. Особенности структуры базы знаний экспертной системы при использовании различных принципов ее построения Любые сложные правила должны быть понятными - это позволяет избежать опасных ошибок. Правила формулируются экспертом или представляются в виде линейной функции.
Различие заключается лишь в том, что в первом случае все весовые характеристики (информативность признаков, истинность, логическая необходимость, логическая достаточность) задаются экспертом, а во втором - они рассчитываются исходя из анализа описаний эталонных объектов, имеющихся в базе данных.
При этом используется следующая технология:
1. Формируется конкретная цель (например, оценить масштабность оруденения);
2. На основании схемы решения целевой задачи экспертом формируется матрица переходов логических блоков, отражающих последовательность решения задачи;
3. Для каждого блока формируется эталонная выборка объектов, характеризующая все возможные их состояния (например, рудопроявления, мелкие, средние, крупные месторождения);
4. Для каждого логического блока формируется устойчивая система информативных признаков (полный и сокращенный вариант) с оценкой их значимости и набор простых и надежных решающих правил (обеспечивающих также и обработку ответов типа "не знаю") перехода системы в следующий логический блок.
В блок формирования результатов и оценки их достоверности целесообразно помимо результатов решения задачи ввести оценку степени изученности объекта исследования, а в случае его недоизученности дать рекомендации по рациональному комплексу методов проведения геологоразведочных работ.
С использованием технологии АСТРА создано несколько специализированных гибридных экспертных систем. Среди них специализированная экспертная система для прогноза и оценки золотосеребряных месторождений Охотско-Чукотского вулканогенного пояса (С.Ф.Стружков, М.М.Константинов, И.А.Чижова), специализированная экспертная система для прогноза и оценки месторождений золотокварцевой и золото-редкометалльно-кварцевой формации СевероВостока России (Г.М.Курбанаев, И.А.Чижова, Н.А.Бакшеев, Ю.И.Лебедев), описанные в главах 4 и 5 диссертационной работы, а также УАвтоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Магаданской области" (Е.В.Матвеева, Ю.И.Гольдфарб, А.В.Стефанский, И.А.Чижова, Н.А.Хмелева), УАвтоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Юго-Восточной части Алданского щита" (Е.В.Матвеева, И.А.Чижова, Н.А.Хмелева).
Технология АНАЛОГ апробирована при создании информационноаналитической системы для поиска ближайшего аналога золоторудных объектов среди золоторудных месторождений мира и решения прогнозно-металлогенических задач по методу аналогий (М.М.Константинов, И.А.Чижова, С.Ф.Стружков, Д.А.Покровский).
Система описана в главе 6 диссертационной работы.
ГЛАВА 3. Логико-информационное моделирование при прогнознометаллогеническом анализе перспективных площадей Глава 3 посвящена описанию обобщенных логикоинформационных методов, специально разработанных для решения прогнозных задач. Результаты применения методов легко структурируются, что облегчает их использование в базах знаний.
Достоинством логико-информационных методов является то, что они специально разработаны для исследования сложных объектов со слабо формализованными признаками, имеющими неясную иерархию.
Они позволяют получать определенные выводы даже при небольших объемах исходных данных, поскольку учитывают информацию, полученную не только по каждому признаку, но и по их сочетаниям, что является их преимуществом при обработке информации, являющейся, в основном, бинарного типа (т.е. признаки принимают значения 0 (нет) или 1 (да)). Одна из важных задач, решаемых с их помощью, - определение комплекса существенных (связанных с поставленной задачей) признаков. Впервые решение такой задачи для случая бинарной информации при одинаковом числе эталонов в классах без оценки надежности предложенного способа было предложено Р.М.Константиновым [1973] и С.В.Сиротинской [1975]. Область применимости предложенных алгоритмов была ограничена: обучение проводилось на бинарной информации на таблицах, содержащих одинаковое число эталонных объектов в каждом классе.
Поэтому возник вопрос о дальнейшем развитии логикоинформационных методов с целью возможности их использования при анализе не только бинарной, но и качественной (бальной) и количественной информации, описывающей объекты исследования, получением оценки надежности построенных решающих правил, простой интерпретируемости результатов, моделирования описаний еще не открытых объектов исследования с заданными целевыми свойствами. В настоящей работе предложено дальнейшее развитие в рамках комбинаторно-логического подхода способа выявления системы существенных признаков, отличительной особенностью которого является одновременный учет информации о максимальном различии объектов из разных классов, сходстве объектов в пределах класса, упорядоченности классов, взаимосвязи признаков, постоянстве их связи с изменением целевого свойства.
огико-информационные методы специально разработаны для решения задач распознавания образов, в котором классы объектов упорядочены по некоторому монотонно-изменяющемуся целевому свойству. Они позволяют: (1) среди многих предполагаемых рудоконтролирующих факторов выбирать те, которые связаны с изучаемым свойством объектов; (2) количественно оценить степень влияния каждого из них на это свойство; (3) определять среди них постоянные и переменные факторы. Как методы исследования многофакторных геологических систем, логико-информационные методы позволяют по-новому подойти к изучению факторов, связанных с особенностями рудных месторождений.
Прогнозно-металлогенические исследования основываются на изучении геолого-структурных, магматических и иных металлогенических факторов, физико-механических и химических свойств вмещающих пород, а также многих других особенностей рудной минерализации.
Использование этих факторов при прогнозах требует систематизации и сопоставления огромного количества различных наблюдений, объем которых по мере развития геологических исследований и совершенствования их методов непрерывно увеличивается.
Смысл моделирования заключается в том, что по результатам опытов на модели судят о явлениях, происходящих в природе.
Основные принципы моделирования, направленного на решение задач геологоразведочного производства, сводятся к следующему [Константинов, 2005]:
1. Моделирование имеет целевой характер. Иначе говоря, необходима четкая постановка задачи, под которую должна создаваться соответствующая модель.
2. Моделирование имеет многоуровневый характер.
Необходимо создание системы моделей, отвечающей задачам прогнозирования, поисков и оценки. Система разноранговых или разноуровневых моделей работает не только как метод последовательных приближений, но и от частного к общему.
3. Моделирование должно быть многофакторным, т.е. модель должна включать максимально возможное количество элементов, для того чтобы иметь возможность заменять те или иные методы, необходимые для опознания объекта исследования.
4. Месторождения моделируются не по элементам (золото, свинец и т.п.), а по конкретным рудно-формационным и геологопромышленным типам. Общепринятое понятие рудной формации, как группы месторождений со сходными минеральными ассоциациями и близкими геологическими обстановками нахождения, позволяет с научной точки зрения корректно осуществлять анализ перспектив новых, слабоизученных территорий.
Несомненно, созданная система моделей должна постоянно адаптироваться как к возможностям новых аналитических и поисковых методов и технологий, так и к локализации и уточнению задач, возникающих в практической геологии.
Поскольку реальный механизм взаимодействия рудоконтролирующих факторов во многом неясен, поиски решения возникшей проблемы целесообразно проводить путем построения и исследования самых общих кибернетических моделей, в которых различается "вход", "преобразователь" ("черный ящик") и "выход". Такие модели позволяют перейти от тождества функций рассматриваемых объектов к тождеству определенных соотношений в структурах объектов и оценить роль отдельных элементов в этих структурах.
Кибернетическая модель предполагает, что признаки, входящие в систему описания объекта исследования, косвенно связаны с целевым свойством, и надо лишь выделить среди них существенные и оценить их важность для решения прогнозной задачи.
Для построения модели можно выделить следующую последовательность действий:
1. Составление шкалы признаков для описания объектов исследования. Шкала признаков разрабатывается в соответствии с существующими геологическими представлениями об объекте исследования и должна учесть все факторы, влияющие на изучаемое свойство объектов. Естественно, что эта шкала должна отвечать масштабу исследований, уровню изученности прогнозируемых объектов.
2. Cоставление основной таблицы типа Уобъект-свойствоФ для эталонных и контрольных объектов. В таблицу сводятся в соответствии с принятой шкалой характеристики исследуемых геологических объектов. Такие таблицы являются информационной базой для дальнейших исследований.
3. Выделение из таблицы эталонных объектов и изучение их вариационных рядов. Изучаются закономерности изменения значений признаков у разных классов эталонных объектов, выделенных по значениям целевого свойства.
4. Оценка значения моделируемого свойства экспертируемого объекта на основе полученных расчетов. Правильность решения поставленной задачи подтверждается, если информационный вес объектов (сумма разделяющих весов признаков для характеристики эталонных и контрольных объектов) изменяется в том же порядке, что и исследуемое целевое свойство. Если такая закономерность установлена, то найденные разделяющие веса признаков могут использоваться для прогнозной оценки соответствующих геологических объектов.
Кибернетическое моделирование позволяет выбрать такую геологическую информацию, которая действительно необходима для прогнозов, а затем дать ей содержательную и количественную оценку.
Анализ разработанных ранее способов оценки информативности признаков в задачах распознавания, предложенных разными авторами (А.Н.Дмитриевым, Ю.И.Журавлевым, Ф.П.Кренделевым, Р.М.Константиновым, С.В.Сиротинской, Ю.А.Васильевым, В.О.Красавчиковым и др.), позволил сформулировать основные предположения, на которых базируется предлагаемый способ оценки информативности признака относительно изменения степени проявления целевого свойства:
1. Если направленному изменению целевого свойства соответствует такое же направленное изменение геологических характеристик, то это свидетельствует об их связи, причем отсутствие признака несет не менее полезную информацию, чем его наличие.
Впервые такое представление было использовано в методе вариационных рядов Р.М.Константиновым [1973].
2. Принцип общности свойств: образы, принадлежащие одному и тому же классу, обладают рядом общих свойств или признаков, отражающих подобие таких образов.
На основе вариационных рядов и принципа общности свойств предлагаются функции для оценки информативности признака, характеризующие степень его близости к признакам, описывающим соответственно однородность выборки (тип О), специфичность классов (тип К), степень изменения целевого свойства (тип М). Выделенные типы признаков представляют интерес для исследователей в процессе решения прогнозной задачи.
Выделение существенных (информативных) признаков (алгоритм MYVES). Для выделения общих свойств классов (тип О) предлагается следующая функция информативности признака:
M M P = D (i, )- D (i, ), jO j i j i i=1 i=где (1,2,...,М ) = (1,1,...,1); - отрицание значения .
i i Dj(i,i) - доля объектов в классе i, принимающих значение признака j, равное ;
i M - число классов;
PjO - характеризует однородность всей выборки в целом.
Для выделения признаков, описывающих специфичность классов (тип К), используется функция:
M M P = D (i, )- D (i, ), jk j i j i i=1 i=где (1,2,..., ) = (0,0,...,1,...,0) (единица на k -том месте);
M Dj(i,i) - доля объектов в классе i, принимающих значение признака j, равное i ;
Pjk - характеризует информативность признака j для выделения объектов класса K.
Для выделения признаков, описывающих изменение целевого свойства (тип М), используется функция:
K 1 M PjM = (-1) D (i, ) j i K =0 l=1,,..., = K 2 l-,,..., = 1- K l l-2 M D (i, ) - доля объектов в классе i, принимающих значение j i признака j, равное ;
i PjM - характеризует информативность признака j относительно изменения целевого свойства.
Все указанные функции рассчитываются для бинарных признаков и имеют диапазон изменения [-1,+1], принимая экстремальные значения при проявлении соответственно О, К, М - свойств. Введенные функции позволяют ранжировать признаки относительно проявления у них полезных свойств и выявлять тенденцию этой связи (положительную или отрицательную).
Минимизация системы информативных признаков проводится за счет выбора порога информативности. Используется следующее правило выбора информативных признаков: если P , то признак j информативен; если P < , то признак отбрасывается. Значение порога j определяется априорно. Чем ближе значение функции к 1, тем сильнее у признака проявлены, соответственно, О, К, М - свойства.
Перекодировка количественной информации в бинарную (алгоритм VIBOR). Если имеется как количественная информация, так и качественная, то ее можно свести к одному типу - бинарному (со значениями 0 или 1) с минимальной потерей информации относительно решаемой задачи (отбора информативных признаков относительно О, К или М - свойств). Предлагается алгоритм перекодировки, который преследует цель: выделение из области изменения признака j некоторого характерного интервала (интервал-индикатор признака j).
Этот интервал обладает свойством: при перекодировке значений из этого интервала в 1, а значений, не входящих в этот интервал, в 0, получаем максимальное значение соответствующей информативной функции Pj по отношению к любым другим интервалам из области изменения признака j.
Алгоритмы построения решающих правил. Вычисление разделяющих весов информативных признаков и информационных весов объектов (алгоритм GOLOS). Предлагается вид функции k, характеризующей степень принадлежности объекта к одному из выделенных классов объектов: T1,T2,...,TM, к=1,2,Е,М, N - число информативных признаков:
N N k(X) = P xj - P (1- xj ), jk jk j=1 j=Pjk>0 Pjk<где X = (x1, x2,..., xN ); xi принимают значения 0 или 1, 0 k (X ) 1.
Построенные для каждого класса характеристические функции 1,2,...,M используются для формирования решающего правила:
объект относится к тому классу, для которого характеристическая функция k принимает максимальное значение.
В качестве разделяющего веса признака для класса предлагается брать:
Pjk Pjk =, N Pjk j=где N - число информативных признаков.
По величине Pjk можно ранжировать все изучаемые признаки.
Признаки, получившие положительные веса Pjk, следует интерпретировать как благоприятные для формирования объектов класса Tk.
Признаки, получившие отрицательные веса Pjk, следует интерпретировать как неблагоприятные для формирования объектов класса Tk.
Чем большим количеством благоприятных или меньшим количеством неблагоприятных для класса Тk признаков обладает объект, тем выше значение характеристической функции k.
Таким образом, алгоритм позволяет:
1. Выделять признаки, делящие объекты на классы;
2. Строить УцентровыеФ объекты классов (модели типичного объекта класса и типичного объекта выборки);
3. Уточнять разбиение объектов на классы.
Алгоритм GOLOS позволяет оценить и отождествляющие способности признаков. Для этого в качестве отождествляющих весов признаков следует брать величины:
P jO P =, jO N P jO i=а в качестве функции принадлежности объекта всему множеству рассматривать:
N N (X ) = P x - P (1- x ).
O jO j jO j j=1 j=PjO >0 PjO <Алгоритм GOLOS позволяет оценивать коррелируемость признаков с изменением целевого свойства. Для этого в качестве разделяющих весов признаков следует брать величины:
PjM PjM =, N PjM j=а в качестве функции принадлежности объекта множеству рассматривать:
N N M (X )= PjM x - PjM (1 - x ).
j j j=1 j=PjM >0 PjM <Алгоритм построения распознающих комплексов признаков и идентификации объектов (алгоритм МУ). Распознающим комплексом признаков Y = (yr1, yr2,..., yrk ) называется подсистема признаков Y, для которой существуют такие величины H > 0, Pi(i =1,k):
k P = 1, signPi = signPri,M, i i=и для любых объектов X и Z из соседних классов l и (l +1):
(Z)- (X ) > H ; l = 1,2,..., M -1;
X = (x1, x2,..., xrk ); Z = (zr1, zr2,..., zrk ), N N где (X )= Pi xri P (1 - xri ) ;
i i=1 i=Pi >0 Pi М - число классов объектов. H - называется коэффициентом отделимости классов по комплексу Y. Задача распознавания объектов с учетом упорядоченности классов T1,T2,...,TM, (к=1,2,Е,М) по исследуемому свойству сводится к следующей. Требуется выделить распознающий комплекс признаков с максимальным коэффициентом отделимости. Построенная на его основе функция (X ) позволяет наилучшим образом распознавать на обучающей (эталонной) выборке степень проявления исследуемого целевого свойства (масштабность оруденения и т.п.). Величина (X ) (вес объекта) изменяется в диапазоне [0,1], что позволяет быстро оценивать степень проявления целевого свойства для любого объекта: для этого лишь надо сравнить значение (X ) с величинами, которые достигались у объектов эталонной выборки. Для объектов из класса T1, обладающего низкими значениями целевого признака, эта величина близка к 0; для объектов из класса T эта M величина близка к 1. Для каждого последующего класса веса объектов больше, чем у предыдущего класса объектов. Таким образом, распознающий комплекс признаков позволяет строить некоторую функцию (вес объекта), которая может служить индикатором для оценки значений целевого признака. Задача поиска распознающего комплекса признаков может быть сведена к задаче линейного программирования, поскольку показатель качества разделения объектов по выделенному комплексу признаков представляет собой линейную функцию от элементов решения, ограничительные условия, налагаемые на выделенные решения, имеют вид линейных равенств или неравенств. Эта задача была решена с помощью симплексного метода. Оценка устойчивости системы информативных признаков, качества и надежности решающих правил. Качество построенного решающего правила проверяется на таблице обучения из базы данных: + K КРП = 100%, S где S - число эталонных объектов в таблице обучения; + K - число эталонных объектов, отнесенных к своему классу. Качество определения класса Ti : + К i КРП = 100%, i S i где Ki+ - число эталонных объектов класса Ti, отнесенных к своему классу; Si - число объектов в классе Ti. О формировании обучающих выборок при построении распознающих систем. При построении распознающих систем важную роль играют задачи выбора системы эталонов и системы информативных признаков. Для правильного их решения необходим анализ устойчивости системы информативных признаков при изменении системы эталонных объектов. Результаты этого анализа позволяют сформировать такую систему эталонов, которая порождала бы наиболее устойчивую систему информативных признаков. Пусть V = {Zi} - множество эталонных объектов, описанных в системе N признаков; Z = (zi1, zi2,..., zik ) - система эталонов, полученная путем случайного отбора из множества V ; P - некоторое правило отбора системы информативных признаков по системе эталонов: P(Z) = , где = (1,,..., ), 2 N =1, если признак отобран в систему информативных признаков; j =0, в противном случае: j =1,Е,N. j n0 - вектор относительных частот появления признаков в системе информативных признаков при n0 испытаниях (различных систем эталонов): n0 = (1n0, 2n0,..., Nn0 ). Рассматривается задача оценки устойчивости системы информативных признаков, построенной по правилу P, описанному выше, при изменении системы эталонных объектов. Она может быть сведена к оценке относительных частот появления признаков в системе информативных признаков при использовании правила P. Если определить событие A следующим образом: признак j является информативным для цели исследования, то справедливы следующие утверждения: Утверждение 1. Для любых ,,(0 < , < 1) с вероятностью 1 - можно утверждать, что на обучающей выборке длиной n,n > n0, где: ln N - ln n0 =, 2 относительные частоты появления признаков в системе информативных признаков ( j =1,2,..., N) будут уклоняться от вероятности P(Aj ) на j величину меньше . Утверждение 2. В случае произвольного числа испытаний при изучении N признаков с вероятностью 1- (0 < 1)можно утверждать, что максимальное уклонение частоты от вероятности будет равно: ln N - ln =. 2n Из утверждения 1 следует, что при решении практических задач можно оценивать количество испытаний, достаточное для получения устойчивой системы информативных признаков с заданной точностью. Из утверждения 2 следует, что в случае произвольного числа испытаний при изучении N признаков можно оценивать точность полученных мер устойчивости (относительных частот появления j признаков в системе информативных признаков). Доказательство утверждений проводится аналогично тому, как это делалось в работе [Вапник, Червоненкис, 1974] при оценке точности решающих правил [Чижова, 1991, 2010]. Задача поиска достаточной системы эталонов, порождающей систему эталонных признаков J, обладающую максимальной устойчивостью, сводится к нахождению бинарного вектора , приводящего к минимуму функционал (J, n0 ): (J, n ) = - ; 0 n - случайное число на отрезке [0, 1]; = (1,2,...,N ); - двоичный вектор; j = 1, если признак входит в систему информативных признаков, порожденную эталонной выборкой, соответствующей случайному числу ; j = 0, в противном случае. Система эталонов Z, на которой этот минимум достигается, и будет искомой. В практических задачах она характеризует представительную выборку из полного объема информации V. Все описанные выше алгоритмы составляют комплекс алгоритмов: систему прогнозирования АСТРА, реализующий обобщенные логикоинформационные методы. Многомерная оценка информативности признака при решении прогнозных задач. В системе прогнозирования АСТРА проводится двухступенчатый анализ системы информативности признаков. Сначала указываются первые по информативности (по выбранному порогу информативности) N признаков, а затем проводится их анализ с учетом взаимосвязи, что приводит к сокращенным вариантам систем информативных признаков (алгоритм MY ). Таким образом, разработана процедура многомерной оценки информативности признака при решении прогнозных задач. Каждый признак характеризуется: а) характером связи с целевым свойством (положительным, способствующим накоплению свойства или отрицательным - препятствующим накоплению свойства); б) силой связи с исследуемым свойством; в) устойчивостью связи с исследуемым свойством (постоянной или переменной). Кроме того, найденные распознающие комплексы признаков характеризуются коэффициентом отделимости, который показывает эффективность его использования при решении задач распознавания, а комплексные веса признаков показывают, какую долю информации о различии классов несет признак, входящий в распознающий комплекс. Оценка надежности используемого решающего правила. В качестве решающих правил обычно выбираются наиболее простые, поддающиеся логическому объяснению правила, позволяющие реализовывать несложные оптимизационные процедуры его поиска. Именно поэтому наиболее широкое применение получили линейные решающие правила. Автору [Чижова, 1991, 2010] удалось теоретически доказать следующие результаты, позволяющие оценивать надежность решающих правил, построенных по распознающим комплексам признаков. Справедливы следующие утверждения. Утверждение 3. Пусть Z - множество эталонных объектов, содержащее S элементов, описанных в системе K бинарных признаков. R - решающее правило для распознавания M классов, построенное по распознающему комплексу признаков Y = (yi1, yi2,..., yik ) с коэффициентом отделимости классов H и функции (X ). Тогда с вероятностью 1- (0 < 1) можно утверждать, что доля ошибочно распознанных объектов не будет превосходить , если длина обучающей выборки S не менее: ln(M -1) + K - ln L = (M -1)2. 2 Утверждение 4. Пусть Z - множество эталонных объектов, содержащее S элементов, описанных в системе бинарных признаков. R - решающее правило, построенное по распознающему комплексу признаков Y = (yi1, yi2,..., yik ) с коэффициентом отделимости классов H и функции (X ). Тогда с вероятностью 1- (0 < 1) можно утверждать, что доля ошибочно распознанных объектов не будет превосходить , где: = (M -1) (ln(M -1)+ K - ln) 2S. Из утверждения 3 следует, что можно определить минимальную длину обучающей выборки, при которой доля ошибочно распознанных объектов не превышает заданной величины. Из утверждения 4 следует, что можно определить максимальную величину доли неправильно распознанных объектов, если решающее правило построено по выборке фиксированной длины. Например: при = 0.1, = 0.5, M = 3, K = 3, L = 95. Из теоретических результатов следует, что ошибка распознавания (отнесения объекта из одного класса в другой) уменьшается при увеличении числа эталонов и уменьшении числа классов и числа информативных признаков. Результаты И.А.Мулагулова [1988] свидетельствуют, что эти тенденции прослеживаются и при использовании других решающих правил - использовании алгоритма суммы одномерных нелинейностей. Особенности решения прогнозной задачи в системе прогнозирования АСТРА. Дальнейший способ решения прогнозной задачи зависит от того, какими сведениями относительно прогнозируемого параметра мы обладаем: знаем точно его значение или знаем только диапазон его изменения. В первом случае возможно построение уравнений, описывающих интересующую нас зависимость (задача количественного прогноза). Во втором случае эти зависимости можно проследить на основе изучения вариационных рядов объектов (задача качественного прогноза). Построение зависимостей прогнозируемых параметров от геологических факторов, гарантирующих точность локального прогноза. Если значение целевого свойства точно известно, то прогнозную задачу можно решить методом моделирования. Предположив, что целевое свойство Y (масштаб оруденения) зависит от факторов x1, x2,..., xN, можно построить зависимость: Y = F(x1, x2,..., xN ). Поскольку точный вид функции F неизвестен, можно построить некоторое ее приближение в классе многочленов m -го порядка от N переменных: N N F(x, x,..., x )= A + A x + A x x +.... 1 2 N oo ok k kj k j k=1 k, j=Задача сводится к вычислению значений Akj (k, j = 0,1,..., N) на основе эталонной выборки объектов. Обычно ограничиваются многочленами первого (линейными) или второго (квадратными) порядка. Общепринятым методом поиска зависимостей на основе таких моделей является линейный или нелинейный регрессионный анализ, основанный на методе наименьших квадратов. Качество приближения при этом определяется по значению среднего квадратичного отклонения: n - Yi ) (Yi i= =, n где Yi - расчетное значение; Yi - наблюденное значение на объекте i ; n - число наблюдений. Если полученные отклонения (Yi - Yi ) подчиняются нормальному закону распределения, ошибка определения будет в пределах 3 на основе построенной модели. При оценке прогнозных ресурсов принят другой критерий качества построенной модели: удовлетворительной считается модель, в которой -100% < 50% (завышение или занижение расчетных значений не более, чем в 2 раза), Y -Y i i где = 100% Y i Y H i или - H <1- < 0 < H < 1 (1) Y i Чем меньше H, тем лучше построенная модель. Была поставлена задача поиска коэффициентов Akj (k, j = 0,1,2,...) при условиях (1), обеспечивающих минимальное значение H. Она была сведена к задаче математического программирования, решение которой симплекс-методом [Вентцель, 1972] позволило построить требуемую модель. Таким образом, разработан принципиально новый метод построения зависимостей прогнозируемых параметров от факторов, влияющих на них, гарантирующий точность локального прогноза в каждой точке наблюдений в заданном диапазоне. Для реализации предложенного метода разработана программа ZPN. В отличие от регрессионного метода, дающего среднюю ошибку при моделировании, данный алгоритм обеспечивает результат приближения расчетных значений к фактическим в заданном диапазоне. Построение зависимостей, отражающих степень проявления у объектов целевого свойства. Если точные значения целевого признака, описывающего степень проявления целевого свойства (масштабности оруденения и т.п.), неизвестны, то можно выделить классы объектов по степени проявления этого свойства, считая, что объекты в пределах одного класса обладают одним и тем же диапазоном изменения целевого признака, а классы упорядочены по степени проявления у объектов целевого свойства. Анализ разработанных ранее способов оценки информативности признаков в задачах распознавания, предложенных разными авторами (вычисление тесторных весов признаков, предложенное А.Н.Дмитриевым, Ю.И.Журавлевым, Ф.П.Кренделевым [Дмитриев и др., 1966], разделяющих весов признаков на основе модифицированного треугольника Паскаля и тесторных весов, предложенное Р.М.Константиновым, С.В.Сиротинской [Константинов, 1973; Сиротинская, 1986], вычисление важности признаков в методе вычисления оценок, предложенном Ю.И.Журавлевым [Журавлев и др., 1971] и др.), показал, что: а) необходимо проводить предварительную селекцию признаков; б) необходимо проводить оценку важности выбранных признаков для решения прогнозной задачи. В этом случае используют алгоритм для выделения систем информативных признаков типа М (MYVES), для оценки коррелируемости признаков с изменением целевого свойства (GOLOS - M ), алгоритмы построения распознающих комплексов признаков (достаточной системы признаков) и идентификации на их основе объектов (MY). Система алгоритмов АСТРА разработана как реализация обобщенных логико-информационных методов для анализа многофакторных моделей геологических объектов с целью решения прогнозных задач на базе теории распознавания образов. На их основе разработан программный комплекс АСТРА (Автоматизированная Система на основе Теории Распознавания). Система позволяет путем анализа эталонных объектов из базы данных: а) выделять системы информативных признаков; б) проводить идентификацию объектов (отнесение объектов к одному из выделенных классов); в) строить простейшие модели накопления целевого свойства, по которому выделяются классы объектов; г) оценивать качество полученных решающих правил. В основе выделения информативных признаков лежит принцип общности свойств и анализ вариационных рядов геологических объектов. В качестве целевого свойства могут рассматриваться масштабность оруденения, соотношение полезных компонентов в рудах и т.п. Полученные закономерности можно использовать в качестве знаний об объектах исследования при разработке экспертных систем. Схема функционирования программного комплекса АСТРА представлена на рис. 3. В работе использовались разработанные автором обобщенные логико-информационные методы, преимуществом которых является возможность получать обоснованные выводы даже при небольших объемах исходных данных, поскольку в их основе лежит комбинаторно-логический подход к анализу изменчивости значений признаков, описывающих изучаемые объекты, учитывающий информацию, полученную не только по каждому признаку, но и по их сочетаниям, а также метод вариационных рядов и принцип общности свойств объектов, входящих в одну группу (класс). Методы позволяют получать системы информативных признаков для выделения объектов из разных групп (получать описание групп), оценивать их важность и проводить идентификацию любых объектов, описанных в данной системе признаков, с целью определения их сходства с объектами изученных групп. Для этого по интервалам-индикаторам и разделяющим весам признаков, полученным для каждой группы объектов, (модели группы), вычисляется значение функции принадлежности к каждой группе. Используется следующее решающее правило: объект относится к той группе, для которой функция принадлежности принимает максимальное значение. Чем ближе вычисленное значение к 1, тем больше сходство объекта с моделью группы. Если получено значение функции принадлежности, близкое к 0, то это свидетельствует о том, что объект не обладает свойствами изученной группы. Если получены значения функции Рис. 3. Схема функционирования программного комплекса АСТРА принадлежности, близкие к 0, для всех изученных групп, то возможно, это свидетельствует о том, что объект образует новую группу объектов. Таким образом, обобщенные логико-информационные методы позволяют уточнять разбиение выборки на группы и определять представителей новых групп. Возможность обработки по единой схеме разнотипной информации без необходимости проверки соответствия законам распределения значений признаков по выборке, делает их универсальными в использовании. Данный комплекс методов обеспечивает решение основных типов формализованных задач прогноза и оценки рудных месторождений: Х построение модели типичных представителей групп объектов (различных рудно-формационных типов); Х построение модели объектов с различными значениями монотонно-изменяющегося целевого свойства (масштабами оруденения). Разработанные методы использовались при решении различных геологических задач, что отражено в публикациях автора. В работе приведены примеры их использования. ГЛАВА 4. Экспертная система для прогноза и оценки золотосеребряных месторождений Охотско-Чукотского вулканогенного пояса Глава 4 посвящена описанию разработанной на основе предложенной технологии АСТРА специализированной гибридной экспертной системы для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса. Оценка рудных объектов наиболее сложна на ранних стадиях изучения (до бурения), когда отсутствует информация по главному прямому признаку (есть ли в пределах объекта промышленное месторождение?). Как правило, в этом случае не удается выявить даже и небольшое (1-2) количество косвенных признаков, которые были бы жестко пропорционально связаны с главным прямым признаком. Возникает необходимость учета большого количества косвенных признаков, то есть встает задача распознавания образов. Одним из подходов к подобной оценке может служить формирование автоматизированного прогнозно-поискового комплекса [Кривцов, Нарсеев, 1983] или компьютеризированной экспертной системы [Поспелов, 1988; Уотерман, 1989]. Совместно с д.г.-м.н. М.М.Константиновым и С.Ф.Стружковым была разработана экспертная система, позволяющая с помощью современного персонального компьютера провести экспрессную оценку новых и переоценку известных перспективных площадей (по косвенным признакам и критериям на ранней стадии изучения). Система предназначена для оказания помощи экспертам в оценке перспективности рудоносных площадей различного ранга и определения методики работ на перспективных участках. Экспертная система состоит из следующих пяти уровней: 1. Региональное геологическое изучение масштабов 1:1000000 - 1:500000. Объектом оценки является потенциальный рудный район. 2. Геолого-геофизические и геолого-съемочные (ревизионнопоисковые) работы в масштабе 1:200000. Объектом оценки является потенциальный рудный узел. 3. Геолого-съемочные работы с общими поисками масштаба 1:50000. Объектом оценки является потенциальное рудное поле. 4. Поисковые работы масштаба 1:10000. Объектом оценки является рудоносный участок (потенциальное месторождение). 5. Поисково-оценочные работы масштаба 1:2000. Объектами оценки являются потенциальные рудные тела и рудные столбы. Каждый уровень включает вопросы к эксперту, необходимые для оценки площади, и варианты заключения об объекте прогноза. На каждом уровне предусмотрена группа вопросов, позволяющая оценить степень изученности перспективной площади. В каждом вопросе возможны три варианта ответов (лда, нет, не знаю). Все варианты охарактеризованы различными положительными или отрицательными информационными весами. После ввода информации по оцениваемому объекту вычисляется алгебраическая сумма информационных весов выбранных экспертом вариантов ответов. Затем эта сумма сравнивается с пороговым значением, позволяющим отнести объект прогноза к тому или иному типу и оценить его перспективность. Возможны три основных варианта заключения об объекте прогноза: положительное, отрицательное и вывод о недостаточной изученности. В случае положительного заключения указывается список рекомендуемых видов работ и перечень итоговых документов, согласно ранее разработанному прогнознопоисковому комплексу ОЧВП [Константинов и др., 1989]. При отрицательном заключении рекомендуется прекращение работ. В случае недостаточной изученности приводится список материалов, которые необходимо получить дополнительно для проведения экспертной оценки. Первый, второй, четвертый и пятый уровни экспертной системы были построены с учетом факторов оценки и локализации золотосеребряного оруденения, ранее предложенных Г.П.Воларовичем (1971), П.В.Бабкиным с соавторами (1973, 1977), А.И.Калининым (1991), Л.Н.Пляшкевич (1973), Н.Е.Саввой (1995), А.А.Сидоровым (1978, 1987) и Рис. 4. Схема процесса принятия решений третьего уровня экспертной системы для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса другими исследователями, а также прогнозных критериев и признаков, сформулированных М.М.Константиновым и С.Ф.Стружковым [Стружков, Константинов, 2005]. Третий уровень (оценка потенциальных рудных полей) (рис. 4) является наиболее важным на современном этапе, поскольку в условиях высокой степени изученности ОЧВП одним из апробированных алгоритмов новых открытий является переоценка формационных типов и масштабов известных рудопроявлений. Например, Дукатское золото-серебряное месторождение в течение нескольких десятилетий, предшествовавших его открытию в 1967 году, ошибочно фигурировало в списках рудопроявлений как мелкое непромышленное проявление олова. В связи с этим для разработки третьего уровня экспертной системы была специально составлена обширная база данных по 129 золото- и сереброрудным полям ОЧВП, использован программный комплекс АСТРА, реализующий обобщенные логико-информационные методы для обоснования критериев прогнозной оценки, что позволило повысить распознаваемость формационных типов и геолого-экономической значимости рудных объектов по сравнению с ранее реализованной версией системы. Экспертная система предназначена для оказания помощи в оценке перспективности рудоносных площадей различного ранга (от потенциальных рудных районов до рудных столбов). Система разработана в среде Delphi 7.0. Созданная на примере ОЧВП специализированная гибридная экспертная система основана на широком комплексе взаимосвязанных критериев и признаков и представительной базе данных, что позволяет применять ее при изучении и оценке золото-серебряных месторождений в сходных рудоносных провинциях. ГЛАВА 5. Экспертная система для прогноза и оценки месторождений золото-кварцевой и золото-редкометалльнокварцевой формации Северо-Востока России Глава 5 посвящена описанию разработанной на основе предложенной технологии АСТРА специализированной гибридной экспертной системы для прогноза и оценки золото-кварцевого и золоторедкометалльного оруденения в терригенных толщах и штоках гранодиоритов-диоритов, расположенного на территории СевероВостока России. Объектами прогнозирования являются следующие таксономические единицы: рудный район, рудный узел, рудное поле, месторождение. В основу базы знаний положены сведения, почерпнутые из опубликованных работ и фондовых отчетов, а также кадастров месторождений. Кроме того, были проанализированы геолого-геофизические, геологические признаки, полученные непосредственно из первичных геологических материалов, входящих в базу данных, включающую описания 47 месторождений в системе разнотипных признаков. Таким образом, предложенная экспертная система содержит сумму знаний, накопленных различными исследователями при изучении отмеченных месторождений. В разработке системы принимали участие Г.М.Курбанаев, Н.А.Бакшеев, Ю.И.Лебедев. Экспертная система состоит из следующих 4 уровней (рис.5). Стадия I. Составление прогнозных карт масштаба 1:1000 000 - 1:500 00. Объект прогноза - потенциальные рудные районы. Стадия II. Составление прогнозных карт масштаба 1:200 000. Объект прогноза - потенциальные рудные узлы Стадия III. Поиски масштаба 1:50 000 - 1:25 000 (подстадия общих поисков). Объект прогноза - потенциальные рудные поля. Стадия IV. Поисковые работы масштаба 1:25 000 - 1:10 000. Объект поисков - потенциальные месторождения. Рис. 5. Схема функционирования специализированной экспертной системы для прогноза и оценки месторождений золото-кварцевой и золото-редкометалльной формации Северо-Востока России Проводится оценка степени изученности. В случае недостаточной изученности объекта предлагается комплекс методов, необходимый для доизучения объекта. Предусмотрены сеансы экспертизы по сокращенному и полному вариантам. Экспертная система разработана в среде Delphi 7.0, предназначенной для визуальной разработки приложений. Экспертная система предназначена для оказания помощи в оценке перспективности рудоносных площадей различного ранга (от потенциальных рудных районов до рудных месторождений). ГЛАВА 6. Информационно-аналитическая экспертная система оценки золоторудных месторождений на основе выбора объекта-аналога (АНАЛОГ) Глава 6 посвящена описанию экспертной системы для оценки золоторудных объектов на основе выбора ближайшего аналога среди золоторудных месторождений мира, построенной по технологии АНАЛОГ. Проблема поиска геологического объекта (месторождения), наиболее сходного с анализируемым по некоторым критериям, всегда интересовала исследователей. Пути ее решения различны. Но особенно интересен подход автоматизированного поиска по различным мерам сходства, дающим количественный показатель. По найденному среди хорошо изученных эталонных объектов ближайшему аналогу по методу аналогии возможна оценка неизвестных свойств экспертируемого объекта. Учитывая огромные возможности когнитивных (т.е. способствующих познанию) свойств графической информации, целесообразно ее использование при экспресс-оценке месторождений, поскольку на эталонном объекте обеспечивается наглядное представление признаков и геологических ситуаций, неизвестных на слабоизученном объекте. Впервые система экспресс-оценки золоторудных месторождений на основе выбора объекта-аналога дополнена графической базой данных, содержащей геологические материалы, необходимые при анализе месторождений, но которые невозможно представить в текстовом или цифровом виде. Учитывая широкое развитие интернеттехнологий, для системы управления была выбрана технология создания вложенных HTML-файлов, обеспечивающая хранение неограниченного числа растровых изображений. Разработанная система состоит из трех основных взаимосвязанных блоков. Блок диалога обеспечивает ввод информации об экспертируемом объекте по системе описания, в зависимости от степени его изученности. Интеллектуальный блок обеспечивает работу системы принятия решения о выборе аналога на основе расчета мер сходства. Блок формирования результатов предназначен для отображения в табличной и графической форме коэффициентов сходства экспертируемого объекта и ближайших аналогов по каждой группе признаков. Аналогичные таблица и график строятся для оценки вкладов каждой группы признаков в общий коэффициент сходства. Изначально система АНАЛОГ опиралась на фактографическую базу данных. На сегодняшний день она содержит описание 2золоторудных месторождений мира в системе 894 признаков, объединенных в 26 групп. Основу ее составляет система признаков для описания месторождений, разработанная М.М.Константиновым. Выбор способа вычисления меры сходства объектов (эталонов из базы данных и экспертируемого объекта) проводится в зависимости от вида используемой информации (логической, качественной, количественной). Методика сравнения экспертируемого объекта с объектами из базы данных в системе АНАЛОГ описана в работе [Чижова, 2004]. В качестве меры сходства между объектами используется модификация меры сходства Говера с учетом природы исходной информации. Сравнение экспертируемого объекта с объектами выборки проводится последовательно для каждой выбранной группы признаков. В зависимости от формы представления исходной информации об объекте исследования меняются процедуры их анализа. Основные задачи , решаемые экспертной системой - подбор аналогов экспертируемому объекту, с целью определения по принципу подобия его рудно-формационных характеристик и масштаба промышленных параметров. Сведения об экспертируемом объекте (ЭО) система получает в результате диалога через заполнение пользователем экранных форм. Разработаны диалоговые окна с заполнением числовой и текстовой информацией путем ручного набора (на клавиатуре) или выбора из классификатора. Выбор аналога осуществляется в результате сравнения сведений об ЭО с объектами из базы данных по каждой группе свойств, характеризующих объект. Результат экспертизы представляется в табличной и графической формах в двух видах: - отражается сходство объекта-аналога и ЭО по каждому свойству из системы описания, по которому получена информация по ЭО в результате диалога; - отражается вклад каждого свойства при подборе конкретного аналога. Схема функционирования системы АНАЛОГ представлена на рис. 6. Получив в результате расчета мер сходства рекомендации системы по выбору объекта-аналога, проводится оценка рудно-формационного типа и масштаба оруденения ЭО по аналогии по значениям этих параметров у ближайшего эталонного объекта-аналога. Рис. 6. Схема процесса принятия решений в экспертной системе АНАЛОГ для оценки золоторудных месторождений на основе выбора ближайшего аналога среди золоторудных месторождений мира 1 - используемая база данных; 2 - таблица оценки степени сходства экспертируемого месторождения с его аналогами по каждой группе признаков и в целом по всей системе описания; 3 - представление данных таблицы 2 в графической форме; 4 - таблица оценки вкладов групп признаков (элементов системы описания изучаемых месторождений) в общий коэффициент сходства экспертируемого месторождения с его аналогами; 5 - представление данных таблицы 4 в графической форме, способствующее оперативному выбору групп признаков, по которым экспертируемое месторождение наиболее похоже на выбранные аналоги; 6 - интеллектуальный блок, передающий данные об экспертируемом месторождении в систему и принимающий решение о выборе из базы данных его ближайших аналогов на основе рассчитанных коэффициентов сходства; 7 - экспертируемое месторождение (объект оценки); 8 - результирующее заключение (список ближайших аналогов); 9 - формирование выводов по аналогии (о рудноформационном типе и масштабности оруденения) экспертируемого объекта на основе значений этих параметров у ближайших объектов-аналогов. Результаты апробации разработанной технологии поиска аналогов подтверждают ее эффективность при решении задач экспресс-оценки золоторудных объектов. В работе они рассмотрены на примере трех относительно новых объектов, для которых подобраны соответствующие по геолого-формационным и вещественным характеристикам аналоги, обладающие в одних случаях достаточно полным сходством, в других - как сходными, так и отличными особенностями оруденения. Последнее обстоятельство зачастую помогает составить более полное и глубокое представление об ЭО. По результатам апробации элементов системы выбора аналогов следует отметить, что разработанная компьютерная технология обеспечивает решение поставленной задачи - подбор аналогов с целью ускоренной оценки экспертируемого объекта. Программное обеспечение системы АНАЛОГ функционирует на базе.Net Framework 1.1, что позволят работать c ней в сетевом режиме. Фактографическая база данных системы хранится в стандартном формате *.mdb, и возможен ее просмотр в системе MS Access. При наличии координат (широта, долгота) в базе данных у выбранных системой объектов-аналогов подключается блок визуализации и формируется карта с информацией о географическом положении выбранных аналогов. Для удобства пользователя результаты экспертизы помещаются в файл формата.xlt, что делает возможным его просмотр в MS Excel (независимо от работы системы) и помещать результаты в отчет в привычном и удобном для пользователя виде. Графическая информация позволяет визуализировать ту часть человеческих знаний об объекте, для которых пока нет возможности получить текстовые описания. Разработан блок графического банка данных системы, содержащих растровую информацию по объектамэталонам (карты, схемы, геологические разрезы, фото образцов и т.п.). Графический блок базы данных носит, прежде всего, иллюстративный характер и дает возможность компактно хранить и оперативно получать, передавать и использовать интересующую графическую информацию по объекту, являющемуся ближайшим аналогом по результатам расчета системы. Применяемая технология вложенных HTML-файлов и модульная иерархически-соподчиненная структуризация графического материала являются оптимальными для выполнения этих функций. ЗАКЛЮЧЕНИЕ В настоящее время настоятельной необходимостью является применение инновационных информационных технологий. Сложность решаемой проблемы прогноза и оценки рудных месторождений обуславливает использование гибридных экспертных систем, в которых предусмотрено сочетание различных способов представления научных знаний (знания экспертов; закономерности, получаемые в результате обработки имеющейся базы данных). При разработке автоматизированных прогнозно-поисковых комплексов автором [Чижова, 1991; Чижова и др., 1991] впервые была применена технология построения базы знаний, включающей не только знания экспертов, но и закономерности, получаемые в результате анализа имеющихся баз данных по исследуемым геологическим объектам. Гибридные экспертные системы для прогноза и оценки рудных месторождений основываются на методологии теории распознавания образов. В зависимости от выбранного подхода (принципа общности свойств или перечисления объектов) строятся алгоритмы представления имеющихся знаний об объекте исследования и системы принятия решений. Основой баз данных для построения баз знаний гибридных экспертных систем для прогноза и оценки рудных месторождений являются многофакторные модели эталонных рудных месторождений, построенные с позиций системного анализа. Разработаны обобщенные логико-информационные методы анализа рудных объектов на основе изучения их многофакторных моделей с целью получения многомерной оценки информативности входящих в нее признаков, используемой при идентификации объектов в процессе решения прогнозных задач. Эти методы обеспечивают выделение системы информативных признаков, оценку их значимости и построение надежных решающих правил для идентификации объектов на основе полученных оценок. Разработанные методы позволяют обрабатывать разнотипную информацию, оценивать достоверность результатов идентификации, определять объем используемой входной информации, необходимый для получения результатов с заданной точностью, и обеспечивают автоматизацию процесса построения элементов комплексной базы знаний гибридной экспертной системы. Разработан программный комплекс АСТРА, реализующий данные методы. На базе разработанных теоретических основ получена технология создания гибридных экспертных систем для решения прогнозных задач, основными положениями которой являются: Х Экспертная система должна быть гибридной (включать модели, предложенные экспертом и модели, получаемые на основе анализа эталонных объектов). Х База знаний может быть построена на основе анализа эталонных объектов двумя способами: - по технологии АСТРА (с использованием обобщенных логикоинформационных методов при создании моделей объектов различных типов); - по технологии АНАЛОГ (на основе вычисления мер сходства). Х Модели объектов должны быть представлены в виде, допускающем их автоматизированное использование, что может быть достигнуто применением обобщенных логико-информационных методов. Х Для ускорения процесса принятия решения по методу ассоциативной аналогии целесообразно использование баз данных графической информации по эталонным месторождениям. Х Программные модули формируются для каждой стадии геологоразведочных работ в соответствии с выделенными металлогеническими таксонами. Таким образом, разработанные подходы к созданию баз знаний гибридных экспертных систем позволяют строить надежные специализированные системы для экспрессной оценки геологических объектов различного металлогенического ранга, что подтверждено примерами реализации предложенного метода для золоторудных месторождений. Совместно с экспертами-геологами сформулированы, систематизированы и структурированы знания о рудных месторождениях различных рудно-формационных типов, что позволило построить надежные специализированные экспертные системы. Системы обеспечивают принятие решений также и в условиях неполной информации об экспертируемом объекте (возможен анализ ответов типа Фне знаюФ). Проводится оценка степени изученности объектов. Технология апробирована при разработке специализированных гибридных экспертных систем: Х для прогноза и оценки золото-серебряных месторождений Охотскочукотского вулканогенного пояса; Х для прогноза и оценки месторождений золото-кварцевой и золоторедкометалльно-кварцевой формации Северо-Востока России; Х для оценки золоторудных месторождений на основе выбора объектааналога среди золоторудных месторождений мира; а также Х для оценки россыпных объектов золота Магаданской области; Х для оценки россыпных объектов золота Юго-Восточной части Алданского щита. Результаты апробации системы выбора аналогов на примере трех относительно новых объектов подтвердили ее эффективность при решении задач экспрессной оценки золоторудных месторождений. СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ По теме диссертации опубликованы 153 работы, из них опубликованы в журналах, входящих в Перечень ВАК. 1. Сиротинская С.В., Чижова И.А. Логические связи столбцов бинарных таблиц геологической информации // Логико-информационные решения геологических задач. М: Наука, 1975. С. 253-258. 2. Константинов М.М., Константинов Р.М., Чижова И.А. Геологические и минералого-геохимические факторы формирования золотосеребряных оруденений // Советская геология. 1979. № 3. С. 116124. 3. Константинов Р.М., Чижова И.А., Кузнецов В.В., Филатов Е.И. Прогнозная оценка месторождений и рудопроявлений на основе дискретного анализа // Разведка и охрана недр. 1979. № 9. С. 10-14. 4. Константинов Р.М., Чижова И.А. Устойчивость геологических факторов образования рудных месторождений // Горнорудный Пржибрам в науке и технике. ЧССР, 1979. С. 265-280. 5. Константинов Р.М., Чижова И.А. Математический подход к анализу устойчивости геологических факторов при решении прогнозных задач // История геологии. Подготовка специалистов в области геологии. Математическая геология и геологическая информация. М.: Недра, 1980. С. 132-140. 6. Гоньшакова В.И., Осипов Б.В., Чижова И.А. О петрохимическом различии базальтов и долеритов нормальной щелочности // Советская геология. 1982. № 5. С. 77-86. 7. Смольянинова В.Н., Чижова И.А. Геохимические особенности железомарганцевых руд Джеказган-Улутауского района // Геология рудных месторождений. 1982. Т. 24. № 1. С. 67-75. 8. Демидова Н.Г., Чижова И.А., Шишкунов М.Г. Логикоинформационное прогнозирование ртутного оруденения // Разведка и охрана недр. 1982. № 2. С. 23-28. 9. Константинов М.М., Чижова И.А. Способы оперативной оценки золото-серебряного оруденения // Разведка и охрана недр. 1983. № 11. С. 15-18. 10. Кузнецов В.В., Чижова И.А. Количественная оценка связей геологических и рудных формаций (на примере Рудного Алтая) // Формационный анализ как основа крупномасштабного прогноза и поисков месторождений цветных, редких и благородных металлов. Т. 1. М.: ЦНИГРИ, 1986. С. 73-74. 11. Чижова И.А. Алгоритм распознавания геологических объектов с корректировкой эталонной выборки // Теоретические проблемы кибернетики. Саратов: СГУ, 1987. Ч. 2. 12. Розанова Н.А., Чижова И.А., Шабаршов П.Я., Щепотьев Ю.М., Остроменцкий В.Н., Харченков А.Г. Использование системного подхода и экономико-математических методов для прогнозирования развития минерально-сырьевой базы. М.: ВИЭМС, 1988. 45 с. 13. Иванов В.Н., Катанский М.Ю., Жидков С.Н., Чижова И.А., Оптимизация разведки золоторудных месторождений на основе многофакторного моделирования // Руды и металлы. 1992. № 1. С. 90-101. 14. Чижова И.А. Экспертная система "Астра": структура и технология разработки // Методы и системы технической диагностики: Саратов. Изд-во СГУ, 1993. Выпуск 18. С. 184-186. 15. Чижова И.А. О формировании обучающих выборок при построении распознающих систем // Методы и системы технической диагностики. Саратов: Изд-во СГУ, 1993. Выпуск 18. С. 186-188. 16. Чижова И.А., Эпштейн Ю.А., Матвеева Е.В., Горелов А.Г., Крупник Н.А. Экспертные системы для прогноза и поисков россыпных и коренных месторождений золота // Руды и металлы. 1993. № 1-2. С. 42-46. 17. Коваленко В.И., Бахтеев Р.Х., Ярмолюк В.В., Чижова И.А. Количественная оценка связи эндогенного оруденения с магматизмoм (на примере Монголии) // Геология рудных месторождений. 1993. Т. 35. № 2. 18. Гореликова Н.В., Давыдов П.С., Чижова И.А., Сперанский А.В. Минералого-геохимические особенности оловоносных россыпей Северо-Ляховского района (шельф моря Лаптевых) // Геология рудных месторождений. 1994. Т. 36. № 5. С. 428-442. 19. Николаева Л.А., Пыцкая Е.А., Чижова И.А., Яблокова С.В. Количественный анализ индикаторных признаков россыпного золота // Руды и металлы. 1995. № 3. С. 20-23. 20. Николаева Л.А., Некрасова А.Н., Чижова И.А., Яблокова С.В. Количественная оценка типоморфных признаков самородного золота различных золоторудных формаций // Руды и металлы. 1995. № 5. С. 20-25. 21. Кузнецов В.В., Сандомирский С.А., Чижова И.А., Катанский М.Ю., Жидков С.Н., Информационно-аналитические компьютерные системы (ИАКС) прогноза и поисков месторождений благородных и цветных металлов // Руды и металлы. 1995. № 2. С. 27-39. 22. Чижова И.А., Кузнецов В.В., Лебедева Е.А. Экспертная система "SPRING" прогноза и поисков месторождений цветных и благородных металлов // Отечественная геология. 1996. № 4. С. 80. 23. Чижова И.А., Кузнецов В.В., Лебедева Е.А. Основы технологии проектирования интеллектуально-графических экспертных систем (ИГС) // Руды и металлы. 1996. № 1. С. 48-56. 24. Чижова И.А., Кузнецов В.В. Интеллектуально-графическая экспертная система (ИГС) // V Международный Симпозиум по применению математических методов и компьютеров в геологии, горном деле и металлургии: Сборник трудов. Дубна (Россия), 4-июня 1996 г. М.: ВНИИГеосистем, 1996. С. 81-89. 25. Патык-Кара Н.Г., Гореликова Н.В., Плахт И., Нечелюстов Г.Н., Чижова И.А. Пустынный загар как индикатор возраста четвертичных образований (урочище Махтеш-Рамон в Центральном Негеве) // Докл. РАН. 1997. Т. 353. № 4. С. 523-526. 26. Патык-Кара Н.Г., Гореликова Н.В., Плахт И., Чижова И.А., Нечелюстов Г.Н., Куликов О.А. Пустынный загар на террасах и педиментах урочища Махтеш-Рамон (Центральный Негев) и его связь с возрастом поверхностей // Геоморфология. 1997. № 2. С. 7282. 27. Кузнецов В.В., Чижова И.А. Интеллектуальные системы: теория, развитие, будущее // Труды VI Международного симпозиума по применению математических методов и компьютеров в геологии, горном деле и металлургии. Прага, 6-10 октября 1997. 28. Некрасова А.Н., Орешин В.Ю., Чижова И.А. Принципы систематики золото-серебряных месторождений на основе логикоинформационного анализа // Руды и металлы. 1997. № 5. С. 33-43. 29. Лебедева Е.А., Чижова И.А. Использование графической информации при работе с экспертной системой прогноза и поисков месторождений // Руды и металлы. 1997. № 4. С. 42. 30. Чижова И.А. Экспертная система УАстраФ // Сборник трудов семинара по дискретной математике и ее приложениям (2-4 февраля 1993 г.). М.: Изд-во механико-математического факультета МГУ, 1998. С. 220. 31. Стружков С.Ф., Чижова И.А., Константинов М.М. Опыт разработки автоматизированной экспертной системы прогноза золоторудных месторождений на примере Охотско-Чукотского вулканогенного пояса // Руды и металлы. 2000. № 2. С. 28-49. 32. Стружков С.Ф., Константинов М.М., Чижова И.А. Прогнозирование близповерхностных золото-серебряных месторождений (СевероВосток России): от статистических закономерностей к компьютерной экспертной системе // Отечественная геология. 2000. № 8. С. 67. 33. Чижова И.А., Кузнецов В.В. Решение прогнозно-металлогенических задач на базе компьютерной технологии "SPRING-II"// Отечественная геология. 2000. № 8. С. 76. 34. Патык-Кара Н.Г., Чижова И.А., Лапшин А.М., Федоров О.П., Шиятый И.Н., Шевелев А.Г. Минералогическое обоснование нового района титано-циркониевых россыпей в Центральной части Западно-Сибирской плиты, Ханты-Мансийский АО // Отечественная геология. 2002. № 3. С. 15-21. 35. Чижова И.А. Технология создания информационно-аналитических систем для прогнозно-металлогенических исследований перспективных площадей // Проблемы рудной геологии, петрологии, минералогии и геохимии. М.: ИГЕМ РАН, 2004. С. 524-533. 36. Чижова И.А. Интеллектуальные системы для прогнознометаллогенического анализа перспективных площадей // Материалы IX международной конференции "Интеллектуальные системы и компьютерные науки". М.: МГУ, 2006. Т. 2. С. 301-305. 37. Чижова И.А., Бардеева Е.Г. Современное состояние геоинформатики // Геоинформатика. 2006. № 2. С. 3-7. 38. Патык-Кара Н.Г., Левченко Е.И., Стехин А.И., Барсегян В.В., Бочнева А.А., Чижова И.А., Андрианова Е.А., Дубинчук В.Т. Минеральные ассоциации титано-циркониевых песков месторождения Центральное (Восточно-Европейская платформа) // Геология рудных месторождений. 2008. Т. 50. № 3. С. 246-270. 39. Чижова И.А. Особенности построения интеллектуальных экспертных систем для прогнозной экспресс-оценки перспективных площадей // Электронная Земля: использование информационных ресурсов и современных технологий для повышения достоверности научного прогноза на основе моделирования решений в интегральных информационных полях. М.: ВИНИТИ РАН, 2009. С. 323-331. 40. Чижова И.А., Константинов М.М., Стружков С.Ф., Покровский Д.А. Информационно-аналитическая система экспрессной оценки золоторудных месторождений: выбор объекта-аналога и когнитивная графика // Геоинформатика. 2009. № 2. С. 12-18. 41. Чижова И.А. Особенности современного этапа развития информационных технологий в геологии // Геология: история, теория, практика. Тезизы докладов Международной конференции, посвященной 250-летию Государственного геологического музея им. В.И.Вернадского. М., 2009. С. 269-272. 42. Чижова И.А., Константинов М.М., Стружков С.Ф. Опыт разработки графической базы данных для информационно-аналитической системы экспресс-оценки золоторудных месторождений на основе выбора объекта-аналога // Геология рудных месторождений. 2009. Т. 51. № 5. С. 461-469. 43. Чижова И.А. Логико-информационное моделирование при прогнозно-металлогеническом анализе перспективных площадей // Современные проблемы рудной геологии, петрологии, минералогии и геохимии М.: ИГЕМ РАН, 2010. С. 57-82. 44. Эпштейн Ю.А., Мальцев В.А., Чижова И.А. и др. Экспертная система "Близповерхностное золото-серебряное оруденение континентальных вулканогенных поясов Востока СССР". Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 60 с. 45. Aжгирей Д.Г., Чижова И.А. и др. Методическое руководство по созданию и ведению баз данных (баз многопризнаковых объектов разного ранга) по основным типам месторождений цветных и благородных металлов и алмазов. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 102 с. 46. Чижова И.А. Экспертная система "Астра". Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 72 с. 47. Курбанаев Г.М., Чижова И.А., Бакшеев Н.А., Лебедев Ю.И. Автоматизированный прогнозно-поисковый комплекс на объекты золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 85 с. 48. Матвеева Е.В., Гольдфарб Ю.И., Стефанский А.В., Чижова И.А., Хмелева Н.А. Автоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Магаданской области. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 90 с. 49. Матвеева Е.В, Чижова И.А., Хмелева Н.А. Автоматизированный прогнозно-поисковый комплекс на россыпные объекты золота ЮгоВосточной части Алданского щита. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 97 с. 50. Chizhova I., Kuznetsov V., Lebedeva E. SPRING Expert System for Prognostic Search and Assessment of Ore Deposits // Proceedings of the 30 th IGC. Beijing, China, 4-14 August, 1996. 51. Tchijova I. (Chizhova), Kuznetsov V. A design technology for intelligentgraphic expert system for forecasting and prospecting for base and precious metal deposits // IAMG-97 Proceedings of the third Annual Conference of the International Association for Mathematical Geology. Barcelona, Spain, 1997. Part 2. P. 1009-1014. 52. Gorelikova N., Tchijova I. (Chizhova) Application of mathematical methods in creating forecasting recognition model for tin deposits and placers // Proceedings of The Third Annual Conference of the IAMG. Barcelona (Spain), 1997. P. 997-1002. 53. Tchijova I. (Chizhova), Kuznetsov V., Pokrovsky D. Image analysis and intelligent systems in geology // IAMG-98 Proceedings of the fourth Annual conference of the International Association for Mathematical Geology. Naples, Italy, 1998. Part 2. P. 730-735. 54. Gorelikova N., Patyk-Kara N., Chizhova I. Computerized modeling of rock vanish dating // Computerized modeling of sedimentary systems / J.Harff, W.Lemke, K.Stattegger (Eds.). ISBN 3-540-64109-2. SpringerVerlag Berlin Heidelberg New York, 1999. P. 413-426. 55. Strujkov S.F., Konstantinov M.M., Chizhova I.A. Computer Expert System for Epithermal Gold-Silver Deposit Prognostication (OkhotskChuckchee Volcanic Belt, Northeast Russia). Natural Resources Research. 1999. V. 8. № 4. P. 315-343. 56. Tchijova I. (Chizhova), Konstantinov M., Poliakov R. Computer-aided system for selection of analogs of the world gold deposits. Proceedings of 8th Annual Conference of the International Association for Mathematical Geology, 5-20 September 2002, Berlin, Germany. 2002. P. 345-350. 57. Lobanov K, Tchijova I. (Chizhova) Computer analysis of structuralpetrophysical data for geodynamic simulation on example of the Kola superdeep borehole (Baltic shield, Russia) // Proceedings of 4 Europeann Congress on Regional geoscientific Cartography and information Systems, 15-23 June, 2003. Bologna, Italy, 2003. V.1. P. 36-38. 58. Tchijova I. (Chizhova), Polyakov R. Computer-Aided System of Analog Searching as Applied to the Gold Deposits // Proceedings of 9th Annual Conference of the International Association for Mathematical Geology, 715 September 2003. Portsmouth, UK, 2003. P. 769-774. 59. Tchijova I. (Chizhova) Logic-informative simulation at prospectingmetallogenic analysis of perspective areas // Abstracts of 32nd International Geological Congress. Florence, Italy, August 20-28, 2004. Part 1. P. 410. 60. Tchijova I. (Chizhova) Geological economic estimation of gold deposits by means of information-analitical system of analogue selection // Abstracts of 32nd International Geological Congress. Florence, Italy, August 20-28, 2004. Part 1. P. 411. 61. Chizhova I. Information-analytical System Design Technology for Forecasting and Prospecting for Base and Precious Metal Deposits // GIS and SpatialAnalysis. Proceedings of IAMGТ05. Toronto, Canada, 2005. V. 2. P. 1046-1051. 62. Chizhova I.A., Konstantinov M.M., Strujkov S.F., Pokrovsky D.A. Economic-Geological Estimation of Gold and Ore Deposits Using Information-Analitical System for the Selection of Analogues // Natural Resources Research. 2005. V. 14. № 4. P. 325-332. 63. Chizhova I.A. Principles of construction of information-analytical intellectual systems for prospecting-metallogenic analysis of perspective areas // Ext. Abs. 12th Quadrennial IAGOD Symposium 20"Understanding the genesis of ore deposits to meet the demands of the 21st century". 21-24 august 2006. Moscow, 2006. CD-version. 64. Chizhova I.A. An integrated representation of geo-knowledge for description and comparison of ore deposits // Proceedings of 5 European Congress on Regional geoscientific Cartography and information Systems, 13-16 June, 2006. Barcelona, Spain. V. 1. Р. 215-218. 65. Chizhova I.A. Forecasting and prospecting for base and precious metal deposits: intelligence systems - as the real way to solve this problem // Proceedings of XIth Congress for International Assoc. for Mathematical Geology. Universit de Lige, Belgium, 2006. CD-version. 66. Chizhova I., Lobanov K. Logic-information methods in analisys of petrophysical diagrams of rock samples from Precambrian tectonic structures // General Assembly of the European Geosciences Union. Vienna, Austria, 2008. CD-version. 67. Chizhova I.A., Konstantinov M.M., Struzhkov S.F. Cognitive graphics in database for search of analogues of gold deposits // 33-rd International Geological Congress: Abstracts. Norway, Oslo, August 6-14, 2008. MAG05. CD-version. 68. Chizhova I.A., Konstantinov M.M., Struzhkov S.F. Computer-aided system ANALOG for gold ore deposits over the world: the selection of closest analogues and cognitive graphics// Proceedings of 6 European Congress on Regional geoscientific Cartography and information Systems, 9-12 June, 2009. Munich, Germany. V. 2. P. 183-186.