Разработка биотехнической системы для распознавания фонем русской речи по изображениям губ

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



В·ования исследуемого отображения должны быть известны входные переменные без ошибок, а единая выходная величина должна оцениваться для каждой входящей переменной. Многие задачи зрительной робототехники и контроля должны сохранять взаимосвязь между переменными, которые не разделяются свободно таким способом. Вместо этого существует нелинейная ограниченная поверхность, на которой для расположения значения переменных совместно ограничен. Мы предлагаем изображения для таких поверхностей, которые поддерживают широкий круг запросов и которые могут быть легко исследованы исходя из имеющихся данных.

Рисунок 15 - Использование ограниченной поверхности для снижения неопределенностей двух переменных

Рисунок 16: Нахождение ближайшей к заданной точки на поверхности

Простейшими запросами являются запросы завершения. В этих запросах значения некоторых переменных определены, а значения (или ограничения значений остальных переменных) должны быть установлены. Это сводится к обычному запросу отображения, если входные переменные определены и система сообщает значения соответствующих выходных переменных. Такие запросы также могут использоваться для инвертирования отображений, однако, с указанием выходных переменных в запросе. На Рисунке 15 показано обобщение, в котором, как известно, переменные лежат в определенных диапазонах и ограниченная поверхность используется для дальнейшего ограничения этих диапазонов.

Для задач распознавания запросы ближайшей точки, в которую система должна вернуть точку поверхности, ближайшую к установленной точке образца, очень важны (Рисунок 16). Например, симметрично инвариантная классификация может быть представлена посредством взятия поверхности для создания путем применения всех операций симметрии к прототипам класса (например, переводы, вращения и масштабирования характеристик образца в системе OCR). На нашем изображении мы можем рационально находить глобальную ближайшую точку поверхности при запросе такого рода.

Другим важным классом запросов является запросы интерполяции и запросы прогнозирвоания. Для них, определяются две или более точек на кривой, а цель заключается в интерполяции между ними или экстраполяции за их пределами. Обладание знанием об ограниченной поверхности может значительно повысить производительность по сравнению с подходами без знания, таких как линейная или сплайн-интерполяция.

В дополнение к поддержке данных и других запросов, хотелось бы иметь изображение, которое можно эффективно исследовать. Данные исследования представляют собой множество точек, случайным образом выбранных с поверхности. Система должна обобщить эти точки исследования для формирования изображения поверхности (Рисунок 17). Эта задача более сложна, чем исследование отображения, по нескольким причинам: 1) Система должна установить размерность поверхности. 2) Поверхность может быть топологически сложной ( например, тором или сферой) и может не поддерживать единое множество координат. 3) Должен поддерживаться и более широкий диапазон запросов, описаных выше.

Рисунок 17 - Исследование поверхности

Наш метод начинается с того наблюдения, что если данные точки были получены с линейной поверхности, тогда может использоваться анализ главных компонент для определения размерности линейного пространства и для нахождения лучшего линейного пространства данной размерности. Крупнейшие основные вектора будут перекрывать пространство, и будет иметь место стремительное падение основных значений размерности пространства. Анализ основных компонент более не будет применяться, однако, если поверхность нелинейна, так как даже кривая размерности может быть внедрена таким образом, чтобы перекрывать все размерности пространства.

Если нелинейная поверхность гладкая, если каждый локальный участок стремится к линейности при увеличении. Если мы рассматриваем только эти данные точки, лежащие в пределах локальной области, тогда при надлежащей аппроксимации они происходят из линейного участка поверхности. Главные величины могут использоваться для определения наиболее вероятной размерности поверхности и это количество ключевых компонентов охватывают касательную поверхность. Основная идея наших отображений заключается в соединении этих локальных участков вместе, используя метод разбиения единицы.

Мы изучаем несколько реализаций, но все результаты, представленные здесь, происходят из отображения на базе запроса ближайшей точки. Поверхность представлена в виде изображения из пространства вложения в самого себя, которое извлекает каждую точку к ближайшей точке поверхности. K-means кластеризация применяется для определения исходного набора прототипов центров из данных точек.Анализ главных компонент осуществляется при определенном количестве ближайших соседей каждого прототипа. Эти результаты локального PCA используются для оценки размерности поверхности и нахождения лучшего линейного проецирования окрестности соседнего прототипа i. "ияние этих локальных моделей определяется гауссовскимиситемами, соредоточенными в расположении прототипа с дисперсией, определяемой плотностью локального образца. Проекция на поверхность устанавливается с помощью формирования разбиения единицы из этих гауссовских систем и исполльзования этого для создания выпуклой линейной комбинации локальных