Разработка программного обеспечения для голосового управления трехмерными моделями функционирования промышленных роботов

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



РЕФЕРАТ

Метою дослiдження СФ розробка програмного забезпечення для голосового керування тривимiрними моделями функцiонування промислових роботiв.

Основними задачами СФ аналiз методiв цифровоСЧ обробки звукових сигналiв, аналiз систем розпiзнання мовлення, розробка програмного забезпечення для розпiзнання команд керування промисловим роботом.

Розглядаються питання обробки звуковоСЧ iнформацiСЧ, СЧСЧ аналiзу та фiльтрацiСЧ. Проаналiзованi методи реалiзацiСЧ систем розпiзнання мовлення.

Реалiзовано програмне забезпечення для запису, вiдтворення й аналiзу звуковоСЧ iнформацiСЧ. Програмне забезпечення розроблене в середовищi розробки програмного забезпечення Visual C++ 6.0 з використанням мультимедiйноСЧ бiблiотеки mmsystem, а також графiчноСЧ бiблiотеки OpenGL.

СПЕКТРАЛЬНИЙ АНАЛРЖЗ, ДИСКРЕТНЕ ПЕРЕТВОРЕННЯ ФУРРД, MMSYSTEM, ГРАФРЖЧНА БРЖБЛРЖОТЕКА, OPENGL, СЕРЕДОВИЩЕ ПРОГРАМУВАННЯ, VISUAL C++.

РЕФЕРАТ

Целью исследования является разработка программного обеспечения для голосового управления трехмерными моделями функционирования промышленных роботов.

Основными задачами является анализ методов цифровой обработки звуковых сигналов, анализ систем распознавания речи, разработка программного обеспечения для распознавания команд управления промышленным роботом.

Рассматриваются вопросы обработки звуковой информации, её анализа и фильтрации. Проанализированы методы реализации систем распознавания речи.

Реализовано программное обеспечение для записи, воспроизведения и анализа звуковой информации. Программное обеспечение разработано в среде разработки программного обеспечения Visual С++ 6.0 с использованием мультимедийной библиотеки mmsystem, а также графической библиотеки OpenGL.

СПЕКТРАЛЬНЫЙ АНАЛИЗ, ДИСКРЕТНОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ, MMSYSTEM, ГРАФИЧЕСКАЯ БИБЛИОТЕКА, OPENGL, СРЕДА ПРОГРАММИРОВАНИЯ, VISUAL С++.

THE ABSTRACT

Software development for the voice control by the three-dimensional models of industrial robots functioning is a purpose of research.

Basic tasks are the analysis of the digital sounds signal processing methods, analysis of the words recognition systems, software development for recognition of control commands by an industrial robot.

The questions of sound information processing, of its analysis and filtration are examined. The methods of implementation of the words recognition systems are analyzed.

Software for a record, reproducing and analysis of sound information is implemented. Software is developed in the environment of Visual C++ 6.0 with the using of mmsystem multimedia library, and also OPENGL graphic library.

SPECTRAL ANALYSIS, DISCRETE TRANSFORMATION OF FURJE, MMSYSTEM, GRAPHIC LIBRARY, OPENGL, PROGRAMMING ENVIRONMENT, VISUAL C++.

Перечень условных сокращений, обозначений, терминов

ПР - промышленный робот

ЭВМ - электронно вычислительная машина

ДПФ - дискретное преобразование Фурье

БПФ - быстрое преобразование Фуре

ЛП - линейное предсказание

PCM - Pulse-Code Modulation

Содержание

Введение

1. Цифровая обработка сигналов и её использование в системах распознавания речи

  1. Дискретные сигналы и методы их преобразования
  2. Основы цифровой фильтрации
  3. Особенности акустической фонетики и её* учёт при обработке речевых сигналов
  4. Обработка речевого сигнала во временной области

2. Реализация систем распознавания речи

  1. Гомоморфная обработка речи
  2. Кодирование речи на основе линейного предсказания
  3. Цифровая обработка речи в системах речевого общения человека с машиной

3. Разработка программного обеспечения для распознавания команд управления промышленным роботом

  1. Реализация интерфейса записи и воспроизведения звукового сигнала в операционной системе Microsoft Windows
  2. Реализация программного обеспечения для записи, воспроизведения и анализа звукового сигнала
  3. Реализация функции распознавания голосовых команд голосового управления промышленным роботом

3.4 Реализация голосового управления трёхмерными моделями промышленного робота

Выводы

Перечень ссылок

Приложение А. Элементы текстов программы

Введение

Распознавание человеческой речи является одной из сложных научно-технических задач. В настоящее время пользователями вычислительных машин и средств, оснащенных вычислительными машинами, становятся люди, не являющиеся специалистами в области программирования. Проблема речевого управления возникла, кроме того, в связи с тем, что в некоторых областях применения речь стала единственно возможным средством общения с техникой (в условиях перегрузок, темноты или резкого изменения освещенности, при занятости рук, чрезвычайной сосредоточенности внимания на объекте, который не позволяет отвлечься ни на секунду, и т.д.). Хотя в этой области и достигнуты существенные успехи, тем не менее, системы распознавания еще весьма далеки по своим возможностям от человеческих.

Проблема реализации речевого диалога человека и технических средств - актуальная задача современной кибернетики.

Задача машинного распознавания речи привлекает внимание специалистов уже очень давно. Тем не менее, продвинуться далеко в этом направлении пока не удалось. Чисто формально процесс распознавания речи можно описать буквально в нескольких фразах. Аналоговый сигнал, генерируемый микрофоном, оцифровывается, и далее в речи выделяются так называемые фонемы, то есть элементарные фрагменты, из которых состоят все произносимые слова. Затем определяется, какое слово, какому сочетанию фонем соответствует, и строится соответствующий словарь. Распознать слово - значит найти его в этом словаре по произнесенному сочетанию фонем. По мере развития компьютерных систем становится все более очевидным, что использование этих систем намного расшир