Основы построения систем распознавания образов
Методическое пособие - Компьютеры, программирование
Другие методички по предмету Компьютеры, программирование
окажется принадлежащим к классу Wi.
Как получить ПРВ классов системы распознавания? В распоряжении разработчика СР - три способа:
-экспериментальное определение по статистическим данным;
-теоретический вывод;
-моделирование.
То же касается априорной вероятности класса P(Wi).
Если признаки распознавания - структурные, то описанием каж-дого класса должен быть набор предложений (цепочек из непроизводных элементов с правилами соединения). Каждое из предложений класса - характеристика структурных особенностей объектов этого класса. Пример - код Фримена.
ЗАДАЧА № 5
Выбор алгоритма классификации, обеспечивающего отнесение распознаваемого объекта или явления к соответствующему классу.
Непосредственное решение задачи распознавания на основе использования словаря признаков и алфавита классов объектов или явлений фактически заключается в разбиении пространства значений признаков распознавания на области D1,D2,...,Dn, соответствующие классам W1,W2,...,Wn (вспоминаем определение “образа”).
Указанное разбиение должно быть выполнено таким образом, чтобы обеспечивались минимальные значения ошибок отнесения классифицируемых объектов или явлений к “чужим” классам.
Результатом такой операции является отнесение объекта, имеющего набор признаков X1,X2,....,Xn (точка в n-мерном пространстве), к классу Wi, если указанная точка лежит в соответствующей классу области признаков - Di.
Разбиение пространства признаков можно представлять как построение разделяющих функций fi(x1,x2,....,xn) между множествами (областями) признаков Di, принадлежащим разным классам.
Упомянутые функции должны обладать следующим свойством:
-если объект, имеющий вектор признаков фактически относится к классу , то значение разделяющей функции
должно быть большим, чем значение ее для класса - (здесь индекс q - означает номер класса, к которому принадлежит вектор признаков).
Отсюда легко определить выражение решающей границы между областями Di, соответствующим классам Wi:
Для двух распознаваемых классов разбиение двумерного пространства выглядит так (рис 2.2). Физически распознавание основывается на сравнении значений той или иной меры близости распознаваемого объекта с каждым классом. При этом если значение выбранной меры близости (сходства) L данного объекта w с каким-либо классом Wg достигает экстремума относительно значений ее по другим классам, то есть
то принимается решение о принадлежности этого объекта классу Wg, то есть wWg.
Надеюсь понятно, что если мера близости не имеет экстремума, то мы находимся на границе, где не можем отдать предпочтение ни одному из классов.
X1 o o o o
xx x o o o
x o o F2(X1,X2) > F1(X1,X2)
x x x o o o o
x o o o o o
x x x x x o o o o o
F1(X1,X2)>F2(X1,X2) x o
x x x x x x x o o
x x x x x x
x x x x x
X2
Рис.2.2
В алгоритмах распознавания, использующих детерминированные признаки в качестве меры близости, используется среднеквадратическое расстояние между данным объектом w и совокупностью объектов (w1,w2,....,wn), представляющих (описывающих) каждый класс. Так для сравнения с классом Wg это выглядит так
где kg - количество объектов, представляющих Wg-й класс.
При этом в качестве методов измерений расстояния между объектами d(w,wg) могут использоваться любые методы (творческий процесс здесь не ограничивается).
Так, если сравнивать непосредственно координаты (признаки), то
где N - размерность признакового пространства.
Если сравнивать угловые отклонения, то рассматривая вектора, составляющими которых являются признаки распознаваемого объекта w и класса wg, будем иметь:
где ||Xw|| и ||Xwg|| - нормы соответствующих векторов.
В алгоритме распознавания, использующем детерминированные признаки можно учитывать и их веса Vj (устанавливать степень доверия или важности). Тогда рассмотренное среднеквадратическое расстояние принимает следующий вид:
В алгоритмах распознавания, использующих вероятностные признаки, в качестве меры близости используется риск, связанный с решением о принадлежности объекта к классу Wi, где i - номер класса. (i=1,2,..,m.).
Описания классов, как мы недавно рассмотрели
В рассматриваемом случае к исходным данным для расчета меры близости относится платежная матрица вида:
Здесь на главной диагонали - потери при правильных решениях. Обычно принимают Сii=0 или Cii<0.
По обеим сторонам от главной диагонали - потери при ошибочных решениях. В каждой системе эти потери свои, свойственные только ей. Однако назначение их - творчество разработчика системы распознавания.
Если вектор признаков распознаваемого объекта w - , то риск, связанный с принятием решения о принадлежности этого объекта к классу Wg, когда на самом деле он может принадлежать классам W1,W2,...,Wm, наиболее целесообразно определять как среднее значение потерь
С1g, C2g,...,Cmg ,
то есть, потерь, стоящих в g-ом столбце платежной матрицы.
Тогда этот средний риск можно запи