Книги по разным темам Pages:     | 1 |   ...   | 39 | 40 | 41 |

На начальном этапе эксперимента было замечено, что возможностный анализ демонстрирует тенденцию к естественной классификации реконструктивных гипотез на каждом уровне уточнения на хорошие и плохие гипотезы, т. е. на гипотезы соответственно с малыми и большими расстояниями. Было также отмечено, что корректные гипотезы (то есть гипотезы, с помощью которых были порождены анализируемые данные) часто не обладают наименьшим расстоянием, но почти всегда принадлежат к хорошему кластеру. Исходя из этих наблюдений вероятностный и возможностный анализы проводились по немного отличающимся правилам.

При вероятностном анализе любая порожденная последовательность данных анализируется на соответствующей решетке уточнения дважды с помощью двух различных процедур поиска. Согласно первой процедуре на каждом уровне уточнения уточняются только структуры с минимальным расстоянием. Согласно второй процедуре уточняются все структуры, чьи расстояния не превышают минимальное более чем на 100%. По каждой из процедур характеристики вычисляются отдельно.

При возможностном анализе структуры на каждом уровне уточнения кластеризуются на плохие и хорошие и далее уточняются только хорошие структуры. Любая последовательность данных анализируется дважды с помощью двух разных процедур кластеризации. Для описания этих процедур пусть R = {( C,d )| i N } i i r обозначает множество всех С-структур Сi, оцениваемых на определенном уровне уточнения конкретного эксперимента, с их расстояниями di. Пусть didi+1 для всех i N и пусть r-G={C1 С2,..., Сс};

В= {Сс+1 Сс+2,..., Сr } - соответственно кластеры хороших и плохих структур, где 1 c r (то есть кластер G всегда непустой, в то время как кластер В в некоторых случаях может быть пустым).

В первой процедуре кластеризации с определяется наименьшим значением i, для которого разность di - di-1 превышает среднюю разность в R для всех iNr-1. To есть d - d r d - d i i-r для i N ( d = 0 )и c d - d r d - d >.

c+1 c r Будем называть эту процедуру кластеризацией по средней разности или AD-кластеризацией (average difference).

Во второй процедуре кластеризации с определяется значением k N, r для которого выражение c r ( d - a |+ d - a | | | i 1 i a - a i=1 i=c 2 достигает минимума, причем c a1 = d, i c i=r a2 = d.

i r - c i=c+Эта процедура основана на естественном кластеризационном требовании о том, что расстояния между кластерами должны быть велики, а расстояния внутри кластеров малы; будем называть это кластеризацией по внутреннему и внешнему расстоянию или IOD-кластеризацией (от англ. Inside and Outside Distance).

Теперь можно целиком описать процедуру реализации одного эксперимента (смотри диаграмму на рисунке Г.36). Она начинается с выбора струкОцениваемые Сструктуры и их расстояния l = Т DF l = D SF DSF l = x уровень ТSF TF RF Рисунок Г.36 - Схема вычислительного эксперимента турированной системы с поведением TSF (которая рассматривается в эксперименте как подлинная). Эта система основывается на С-структуре. Эта структуризованная система, представляющая обобщенную систему с поведением TF (полученную из системы TSF с помощью процедуры соединения), моделируется на компьютере и используется для порождения данных. После порождения данных из соответствующей системы данных D выводится обобщенная система с D поведением без памяти F (вероятностная или возможностная). Затем для ведением без памяти DF (вероятностная или возможностная). Затем для системы D F проводится реконструктивный анализ в соответствии с одной из упомянутых выше процедур поиска (например, для возможностных систем, основанных на одном из двух типов кластеризации). Результатом является последовательность множеств С-структур (и их расстояний), которые оцениваются на отдельных уровнях соответствующей решетки уточнения. Это множества, скажем множества El = {( Ci,di )| il Il } l для l = 1, 2,..., п(п Ч 1)/2, где п Ч число рассматриваемых переменных. Особый интерес представляет множество El для того же уровня уточнения, что и систеT D ма SF. Система F также используется для определения структурированной системы DSF, основанной на такой же С-структуре, что и заданная структурироT ванная система SF. Эта система (DSF) представляет обобщенную систему с поведением RF (реконструированную обобщенную систему).

По множеству El (l Nn(n-1)/2) и обобщенным системам с поведением TF, DF и RF, полученным в результате экспериментов одного типа (то есть для определенного числа переменных, определенных множеств состояний, для вероятностного или возможностного варианта и так далее), можно определить различные характеристики результатов анализа реконструируемости. Опишем эти характеристики на нескольких примерах систем из трех переменных. Некоторые основные характеристики для вероятностных систем (с тремя переменными) представлены на рисунке Г.37.

Они получены с использованием процедуры поиска, в которой уточняются только структуры с минимальным расстоянием. Графики на рисунке Г.37,а описывают влияние числа наблюдений (объем данных |d|) на качество анализа реконструируемости для переменных с двумя и с пятью состояниями. Качество оценивается как для тех экспериментов, для которых процедура поиска получает на соответствующем уровне уточнения корректную структуру, являющуюся структурой с наименьшим расстоянием. Как видно, 100%-ое качество достигается достаточно быстро для обоих случаев. Несмотря на то, что с ростом числа наблюдений результативность сходится к 100% во всех исследованных случаях, скорость сходимости несколько падает с ростом числа переменных.

Это объясняется прежде всего высокой селективностью используемой процедуры поиска. Видно также, что переменные с пятью состояниями (верхний график) оцениваются лучше, чем переменные с двумя состояниями (нижний график).

Это также общая тенденция: с ростом мощностей множеств рассматриваемых состояний улучшается и качество. Таким образом, для любого конкретного числа переменных характеристики представленных систем с двоичными пере менными могут рассматриваться как худший случай.

На остальных графиках на рисунка Г.37 показаны характеристики анализа реконструируемости только для двоичных переменных. На графике (рисунок Г.37,б) показано, насколько отличается корректная структура по информационному расстоянию от других структур на том же уровне уточнения. На нижнем графике представлено расстояние для корректной структуры D(Df, Rf ), на среднем Ч наименьшие расстояния для структур, конкурирующих с корректной на том же уровне уточнения, и на верхнем средние расстояния для всех структур, конкурирующих с корректной (в соответствии с процедурой по а) б) в) г) Рисунок Г.37 - Некоторые характеристики анализа реконструируемости для вероятностных систем иска) на одном уровне уточнения. Несмотря на то, что на вид этих кривых влияет число переменных и мощность множеств их состояний, а также используемый тип расстояния, с ростом числа наблюдений эти расстояния всегда убывают, а расстояние для корректной структуры стремится к нулю.

На графике (рисунок Г.37в) сравниваются информационные расстояния между подлинной системой TF и соответственно системами DF и RF. Поскольку соответствующие пары распределений вероятностей Tf, Df и Tf, Rf являются произвольными, необходима общая мера информационного расстояния. Это расстояние, назовем его G, определяется формулой 1 f +2f f +2f 1 1 G( f,2f ) = D( f, ) + D( f, ), (Г.44) 2 где 1f и 2f - произвольные распределения вероятностей, определенные на одном и том же конечном множестве состояний; D Ч специальное информационное расстояние, заданное уравнением (Г.40); (1f +2f )/2Чраспределение вероятностей, полученное взятием среднего для каждой пары соответствующих вероятностей из 1f и 2f. Нижний график на рисунке Г.37,в представляет D(Tf, R f),а а) б) в) г) Рисунок 7.38 - Некоторые характеристики анализа реконструируемости для возможностных систем верхний - D(Tf, Df). Таким образом, реконструированная система RF оказывается ближе к подлинной системе TF, чем система DF, опирающаяся только на доступные данные. Это довольно неожиданный результат, важность которого будет проанализирована в разделе Г.10.

На графиках (рисунок Г.37г) показана взаимосвязь множеств состояний с ненулевыми вероятностями для трех участвующих в вычислительном эксперименте систем с поведением ТF, DF и RF; будем эти множества состояний обозначать соответственно ТХ, DX и RХ. На нижнем графике показана доля тех состояний TF, которые имеются в DF (это происходит из-за недостатка данных), то есть (DX/TX)100; на верхнем графике представлен процент состояний TF, имеющихся в R X T X Из этих графиков ясно видно, что D X RX TX (Г.45) Это столь же важное свойство, как и то, что получено из графиков на рисунке Г.37,г, и оно также будет рассмотрено в разделе Г.10.

Возможностные аналоги описанных характеристик приведены на рисунке Г.38. Они основаны на IOD-кластеризации. Поскольку реконструктивный анализ возможностных систем основывается на работе с кластерами структур, а не с отдельными структурами, то соответствие между вероятностными характеристиками и их возможностными аналогами не является прямым.

На рисунке Г.38 (а) показано качество возможностного анализа реконструируемости для различных множеств состояний (от двух до пяти для переменной). График в данном случае имеет обобщенный вид, поскольку различия для разных множеств состояний малы и никаких особых тенденций выявить не удается. Качество представляется как доля экспериментов, в которых корректные структуры входят в кластер хороших структур. Остальные зависимости на рисунке Г.38 построены только для двоичных переменных На рисунке Г.38,г показаны верхнее и нижнее информационные расстояния для двух кластеров структур. Они существенно отличаются от своих вероятностных аналогов. Напротив, на рис. Г.38,в и г очень похожи на свои вероятностные аналоги. Возможностная версия общего информационного расстояния, использованная при построении графиков на этих рисунках, определяется формулой G(1f, 2f)=D(1f, 1f V 2f)+D(2f, 1f V 2f), (Г.46) где 1f и 2fЧ произвольные распределения возможностей, определенные на одном и том же конечном множестве состояний; D - специальное информацион1 ное расстояние, определяемое уравнением (Г.42); f V f - распределение возможностей, получаемое взятием максимума для каждой пары соответствующих возможностей из 1f и 2f.

Все эксперименты, для которых определялись данные характеристики, проводились в предположении, что данные порождены некой структурированной системой. Целью этих экспериментов было определение того, насколько недостаток данных влияет на качество анализа реконструируемости. Несмотря на то, что эти идеализированные эксперименты достаточно ценны и представляют собой естественный первый этап анализа реконструируемости, очень желательно было бы расширить их для более общих и более реальных ситуаций. Позвольте в качестве примера описать обобщенные эксперименты, подготавливаемые в настоящее время. Подобно идеализированным вычислительным экспериментам, обобщенные эксперименты будут также разбиты на группы по числу переменных и по мощностям их множеств состояний. Для каждого эксперимента будет выбрано определенное распределение, где для каждого обобщенного состояния рассматриваемых переменных будет определено число его наблюдений. Одни сматриваемых переменных будет определено число его наблюдений. Одни распределения будут выбраны из различных архивов данных и из литературы, а другие Ч порождены случайными процессами. Эти два класса экспериментов будут анализироваться по отдельности для того, чтобы понять, обладают ли распределения, основанные на реальных данных, некими особыми реконструктивными свойствами по сравнению с порожденными случайно распределениями.

Каждое отобранное распределение будет использовано двояко. Вопервых, его реконструктивные свойства будут анализироваться как вероятностным, так и возможностным методами. Во-вторых, оно будет использовано для порождения данных, обычно для 2000 наблюдений. Затем распределения, полученные для различных сегментов данных, будут анализироваться точно так же, как и исходные (истинные) распределения, и с помощью тех же методов (вероятностного и возможностного). Наконец, результаты соответствующих экспериментов, полученные для различных сегментов данных, будут сравниваться с теоретическими свойствами, определенными для исходного распределения. Это сравнение будет проводиться для того, чтобы определить, насколько хорошо эти теоретические (истинные) свойства согласуются с экспериментальными. Для каждого свойства, считающегося существенным, в результате выполнения каждой группы экспериментов будет определена зависимость средней сохранности этого свойства (а также вариации этой сохранности) от размеря анализируемого сегмента данных и используемого метода.

Вычислительные эксперименты так, как они описаны в этом разделе для анализа реконструируемости, являются важнейшим инструментом для метаметодологических исследований в науке о системах. УРСЗ должен не только предоставлять в распоряжение пользователя метод решения разных типов задач, но и давать метаметодологическое описание этих методов. Характеристики анализа реконструируемости, описанные в данном разделе,Ч это простой пример такого метаметодологического описания.

Г.10 Индуктивное рассуждение Откуда берутся гипотезы, если они не рождаются прямо из головы Зевса Частично ответ состоит в том, что они возникают в процессе порождения гипотез.

Герберт А. Саймон Хотя индуктивное рассуждение неявно применялось только при решении задач идентификации и реконструкции, оно используется практически в любой задаче, связанной с применением метода открытия в исследовании систем. Поэтому желательно дать обзор вопросов, связанных с индуктивными рассуждениями, и это - одна из задач данного раздела; вторая задача - введение нового принципа индуктивного вывода, основанного на некоторых особенностях анализа реконструируемости.

Понятие индуктивного рассуждения мы будем рассматривать не в традиционном узком смысле - как выведение общего заключения из частных примеров, а более широко - как лохват всех недоказуемых случаев, в которых истинность предпосылок хотя и не определяет инстинность заключения, но показывает, что есть серьезные основания доверять истинности этого заключения (Философская энциклопедия).

Pages:     | 1 |   ...   | 39 | 40 | 41 |    Книги по разным темам