Исследование систем управления манипулятором MR-999Е

Диссертация - Компьютеры, программирование

Другие диссертации по предмету Компьютеры, программирование

т требуется, чтобы шумом порождалось минимальное число фрагментов. Данное предположение сводится к простой схеме указания. Берется каждый фрагмент изображения и указывается каждый образ, который может породить фрагменты этого класса. Выбирается образ, получивший наибольшее число указаний, он же считается присутствующим на изображении. Данная стратегия может быть эффективной, хотя ее использование приводит к некоторым проблемам.

 

2.4.4 Вероятностные модели для указания

Полученный простой процесс голосования можно интерпретировать через вероятностную модель, поскольку при этом проявляются сильные и слабые стороны описанного подхода. Фосайт и Понс [16] пишут, что используемую порождающую модель можно превратить в вероятностную, предположив, что фрагменты генерируются независимо и случайным образом, причем также предполагается, что объект присутствует. Запишем

 

Р{фрагмент i-гo типа есть на изображении | присутствует j-й образ} = pij

Р{фрагмент i-го типа | нет образа} = рix.

 

В простейшей модели предполагается, что для каждого образа j, pij = , если образ может породить данный фрагмент, и 0 - в противном случае. Более того, предполагается, что рix = ? < для всех i. Наконец, предполагается, что каждый наблюдаемый фрагмент на изображении может порождаться либо отдельным образом, либо шумом. Всего на изображении ni фрагментов. При таких допущениях для вычисления функции правдоподобия нужно знать только, какие фрагменты порождены образом, а какие - шумом. В частности, если взять функцию правдоподобия изображения при данном образе и предположить, что np фрагментов порождены данным образом, а np - ni фрагментов порождены шумом, можно записать:

 

Р(интерпретация | образ) = , (2.8)

 

причем данная величина больше для больших значений np. В то же время, поскольку не каждый образ может породить любой фрагмент, максимальный доступный выбор np зависит от выбранного образа. Принятый метод указания равнозначен выбору образа с максимальным возможным правдоподобием при данной (простой) порождающей модели.

Отсюда видится источник определенных сложностей: если образ мало правдоподобен, следует учесть дополнительную (априорную) информацию. Более того, вследствие шума некоторые фрагменты могут порождаться легче, чем другие - если не учесть этот факт, при подсчете голосов некоторые образы будут в более выгодном положении. Наконец, при данном объекте некоторые фрагменты могут быть более вероятными, чем другие. Например, углы значительно чаще будут встречаться на образе шахматной доски, чем на изображении полос зебры.

 

2.4.5 Доработка порождающей модели

Относительно просто учитывать все вышесказанное и соответствующим образом усовершенствовать простейшую модель (фрагменты появляются независимо при условии наличия образа). Предположим, что имеется N различных типов фрагментов. Форсайт и Понс [16] пишут, что фрагменты каждого типа генерируются со своей вероятностью всеми изображениями и шумом. Теперь предположим, что на изображении присутствует nil экземпляров фрагментов l-го типа. Более того, nk из них генерируется образом, а остальные - шумом. Теперь поскольку фрагменты возникают независимо при данном образе и шум не зависит от образа, правдоподобие равно

 

Р(фрагменты порождены образом | j-й образ)

Р(фрагментов порождено шумом). (2.9)

 

Первый член равен

 

Р(тип 1 | j-й образ)"1 Р(тип 2 | j-й образ)"2 … (2.10)

Р(тип N | j-й образ)nN,Р(шум), (2.11)

 

что можно оценить как

 

(2.12)

 

Теперь предположим, что фрагменты порождаются шумом независимо друг от друга. Это означает, что шумовую составляющую можно записать следующим образом:

 

(2.13)

 

что можно оценить как

 

(2.14)

Это означает, что правдоподобие можно записать как

 

(2.15)

 

Для каждого типа фрагментов k возможны два случая: если pkj > pkx , то максимум достигается при nk = nik; в противном случае максимум достигается при nk = 0. Обозначим через ?i априорную вероятность того, что содержит j-й образ, а через ?0 - априорную вероятность того, что оно не содержит ни одного объекта. Это означает, что для каждого типа образов j максимальное значение апостериорной вероятности запишется следующим образом:

 

(2.16)

 

где индекс m служит для подсчета значений признаков, для которых pmj > рmх, а l - для подсчета значений признаков, для которых рlj < plx. Данная величина формируется для каждого объекта, а затем выбирается та из них, которая имеет наибольшее апостериорное значение. Обратите внимание, что данная модель является реляционной, хотя в действительности мы не вычисляем геометрические признаки, связывающие образы. Это объясняется тем, что фрагменты связываются условными вероятностями их появления при данном образе, которые отличаются для разных образов.

 

2.4.6 Указание связей

Для улучшения простой стратегии указания можно использовать геометрические связи. Фрагмент сопоставляется с объектом, только когда с объектом сопоставлены соседние фрагменты и все эти фрагменты образуют подходящую конфигурацию. Термин "подходящая конфигурация" может быть источником сложностей, но предположим пока, что объекты сопоставлены с точностью до плоского вращения, трансляции и масштаба (это предположение разумно, например, для лиц анфас). Предположим теперь, что дан фрагмент, соответствующий некоторому объекту. Далее берем р ближайших фрагментов и проверяем, согласу