Разработка математической модели оценки платежеспособности корпоративного заемщика
Дипломная работа - Менеджмент
Другие дипломы по предмету Менеджмент
рагмент решающего дерева с последовательным разбиением базы фактов
Информационная мера
Работа алгоритма индуктивного вывода основана на использовании информационной меры (см. рис.8). Она представляет собой функционал, который на каждом шаге построения решающего правила производит оценку информативности (полезности) имеющихся элементарных свойств.
Для конкретного свойства а функционал G(а), который и называется информационной мерой, рассчитывается следующим образом:
где а - элементарное свойство, т.е. логическая функция от показателей и параметров;
p - число примеров в базе фактов, на которых свойство а принимает значение истинно;
n - число примеров в базе фактов, на которых свойство а принимает значение ложно;
Np - число групп различных значений заключений Y для той части базы фактов, на которой свойство а принимает значение истинно;
Nn - число групп различных значений заключений Y для той части базы фактов, на которой свойство а принимает значение ложно;
pi =mi/p, где mi - число примеров, принадлежащих к i-й группе, находящейся в той части базы фактов, где свойство а принимает значение истинно;
qi =mi/n, где mi - число примеров, принадлежащих к i-й группе, находящейся в той части базы фактов, где свойство а принимает значение ложно.
Рисунок 8. Расчет информационной меры
Множество элементарных свойств
При формировании решающего правила алгоритм индуктивного вывода использует специальное множество - множество элементарных свойств, обозначим его через А.
Множество А образуют элементарные предикаты - логические функции от показателей и параметров простейшего вида. Они являются основой для построения более сложных.
С практической стороны множество элементарных свойств - это множество простейших реально существующих свойств экономического объекта или явления, которые образуют более сложные, содержательные.
Использование в качестве множества А элементарных свойств типа "сравнение показателя с пороговым значением" образует семейство сравнений следующего вида:
Xi<rik где
Xi - величина показателя или параметра;
rik - величина порогового значения.
В качестве элементарных свойств могут быть рассмотрены предикаты типа "сравнение значений показателей между собой":
Xi<Xj , где Xi ,Xj - значения показателей или параметров.
Дальнейшее расширение множества А может состоять в сравнении арифметических выражений показателей и параметров между собой и с пороговыми значениями. На самом деле, в качестве множества А может быть использовано любое количество логических функций на показателях и параметрах.
Характер множества элементарных свойств определяет многообразие решающих правил, а, соответственно, и многообразие содержательных свойств экономического объекта или явления, которые определяются (регистрируются) решающим правилом.
Пример
Оно может состоять из следующих подмножеств;
А = А1А2А3А4 , где
А1 - сравнение параметров с пороговыми значениями;
А2 - сравнение параметров между собой;
А3 - сравнение арифметических выражений параметров с пороговыми значениями;
А4 - сравнение арифметических выражений параметров между собой.
База фактов
Основой для построения решающего правила является база фактов, которая содержит значения показателей и параметров, а также соответствующие значения заключений.
Пусть Х - множество показателей и параметров, характеризующих экономический объект или явление.
Х={Хi}, i=1,N где N - число параметров.
Пусть Y множество заключений, которые характеризуют рассматриваемый экономический объект или явление.
Y={Yj}, j=1,М где М - число тем.
Пусть V множество допустимых заключений.
V={Vj) , где Vj - множество заключений j-й темы, причем
Vj={Vj} , =1,Lj где Lj - число различных заключений j-й темы.
Множество фактов, состоящих из совокупности значений параметров, соответствующих экономической ситуации, и характеризующих их заключений, образуют базу фактов.
{Х1k, Х2k,...,ХNk, Yk1, Yk2,...,YkM, Wk}, k=1,К,
где К - общее число записей в базе фактов;
Wk - значимость k-го факта.
Каждый факт, содержащийся в базе фактов, представляет собой соответствие совокупности значений показателей и параметров и множеству заключений из множества допустимых заключений.
F = {f} .
Каждому отдельному факту f соответствует своя совокупность конкретных значений показателей и параметров. Каждое элементарное свойство из множества А принимает на этой совокупности значения "истинно" или "ложно".
"aA a(f) = {"истинно" , "ложно"}
Предварительно для базы фактов следует провести специальное преобразование, которое состоит в следующем. Все одинаковые комбинации значений Хi, в том случае, если им соответствуют различные значения Yi, назовем "противоречивыми". Для каждой "противоречивой" комбинации значений параметров образуем специальное заключение - класс, который содержит все встречающиеся значения заключений со своими эмпирическими весами wi.
wi=qi/Q, где Q - общее количество значений рассматриваемой "противоречивой" комбинации;
qi - количество значени