Исследование систем управления манипулятором MR-999Е
Диссертация - Компьютеры, программирование
Другие диссертации по предмету Компьютеры, программирование
? то же время основной вопрос достаточно очевиден - как закодировать набор связей между шаблонами в форму, с которой легко работать. В данной главе изучается ряд различных подходов к данной задаче. Во-первых, каждый шаблон может указывать на объекты, которые он может представлять, а затем каким-то образом считается число указателей. Если построить некоторую явную вероятностную модель, для описания деталей пространственных отношений можно использовать больше весовых коэффициентов. Данную модель можно получить из функций правдоподобия; по сути, нужна функция распределения вероятностей, дающая большое значение, когда конфигурация компонентов подобна объекту, и малое - в противном случае. Тогда поиск объектов превращается в поиск шаблонов, которые при подстановке в вероятностную модель дают большие значения. Нужно отметить, что следует внимательно относиться к сокращению поиска. Сложность этого подхода заключается в том, что даже при сокращении поиск может быть дорогим. Как утверждают Форсайт и Понс, в то же время при определенном классе вероятностных моделей можно провести эффективный поиск [21].
Простые модели объектов могут обеспечивать достаточно эффективное распознавание. Простейшая модель - это рассматривать объект как набор фрагментов изображения (небольших окрестностей элементов характерного вида) нескольких различных типов, формирующих образ (pattern). Чтобы определить, какой образ наблюдается, находятся все фрагменты, каждый из которых указывает на все образы, в которые он входит. То изображение, на которое было указано наибольшее число, и считается присутствующим. Хотя данная стратегия проста, она довольно эффективна. Ниже описываются методы поиска фрагментов, а затем представляется ряд последовательно усложняющихся реализаций данной стратегии.
2.4.2 Описание фрагментов изображения
Небольшие фрагменты изображения могут иметь достаточно характерный вид, если имеют много ненулевых производных (например, в углах). Авторы [16] искали углы на изображении, часто именуемые точками интереса. Далее оценивался набор производных функции яркости в этих углах и набор производных, инвариантных относительно вращения, трансляции, определенного изменения масштаба и изменения освещения. Данные признаки назывались инвариантными локальными особенностями (invariant local jets).
Далее будем предполагать, что фрагменты изображения можно разбить на несколько классов. Представители каждого класса могут быть получены использованием нескольких изображений каждого объекта - как правило, соответствующие фрагменты будут относиться к одному классу, но, возможно, вследствие шума иметь несколько отличающиеся инвариантные локальные потоки. Подходящий набор классов можно определить либо посредством ручной классификации фрагментов, либо посредством кластеризации фрагментов-образцов (несколько лучший метод). Теперь требуется определить, когда два набора инвариантных локальных потоков представляют один класс фрагментов изображения. Шмид (Schmid) и Mop (Mohr) для проверки использовали расстояние Махаланобиса (Mahalanobis distance) между векторами признаков тестируемого фрагмента и фрагмента-образца; если замер был меньше некоторого порога, тестируемый фрагмент считался идентичным образцу.
Обратим внимание на то, что по сути описан классификатор (он распределяет фрагменты по классам, представленным образцами, или отказывается от классификации), а фрагменты представляют шаблоны. Программу согласования шаблонов можно построить с помощью любой техники, не используя признаки, инвариантные относительно вращения, как говорили Форсайт и Понс [21]. Для этого можно использовать набор настроек, содержащий версии каждого фрагмента-образца, которые отличаются вращением и изменением масштаба, при варьирующихся условиях освещения, так чтобы классификатор мог определить, что вращение, изменение масштаба и освещения не влияет на идентификацию фрагмента. Преимущество использования инвариантных признаков заключается в том, что классификатору не нужно узнавать об инвариантности из набора настроек.
2.4.3 Указание признаков и простая порождающая модель
Пусть дано изображение, в котором находяться интересующие нас точки и в каждой точке изображения классифицируется фрагмент изображения. Возникает следующий вопрос: какие образы находятся в изображении? Для ответа на этот вопрос можно построить соответствие между фрагментами изображения и образами. Предположим, что всего на изображении имеется Ni фрагментов. Более того, предположим, что на изображении либо присутствует один образ из данной коллекции, либо ни одного. Отдельный фрагмент может порождаться либо единственным присутствующим образом, либо шумом. Впрочем, образы, как правило, содержат фрагменты не всех классов. Это означает, что утверждение о присутствии определенного образа равнозначно утверждению о том, что некоторые фрагменты изображения порождены шумом (поскольку может присутствовать только один образ, а имеются фрагменты изображения, которые принадлежат классам, не содержащимся в текущем образе).
Окончательно приходим к простой порождающей модели изображения. Когда образ присутствует, возникнуть могут только фрагменты некоторых определенных классов. Разрабатывая данную модель, получаем ряд алгоритмов сопоставления образов с наблюдаемыми картинами.
Простейшая версия данной модели получается в предположении, что образ порождает все фрагменты классов, которые он может породить, а значи