Машины, которые говорят и слушают

Реферат - Компьютеры, программирование

Другие рефераты по предмету Компьютеры, программирование

get может использоваться лишь в словосочетании budget figure и, так как это словосочетание находится в конце предложения, никаких слов справа больше не будет. Блок управления использует далее найденное словосочетание в качестве расширенного "островка надежности" для поиска слов от позиции II до начала высказывания.

Обращаясь к синтаксической процедуре, блок управления обнаруживает, что прагматическая грамматика допускает еще несколько слов, кроме слов из списка, рассмотренного ранее, для расширения этой гипотезы. 9то связано с тем, что служебные слова,которые могут стоять перед словосочетанием budget. figure , имеют слишком небольшой вес (очки). В результате сравнения сегментов, расположенных слева от слова budget , и эталонов слов, допускаемых прагматической грамматикой, получают новый список, расширяющий предыдущий (в списке остаются лишь слова, оценки которых превышают <DU очков):

40

33. OF 10 11 4 , - 16 - - Н

34. А 10 11 4 - 16 - - R

35. THE 911 -105 - 16 - - R

36. THE 9 11 -105 - 16 - - R

37. OUR 10 11 -123 - 31 - - R 3. THE 9 11 -135 - 16 - - R

39. - S 10 11 -140 0 - - R

40. ANO 9 11 -163 - 26 - - R

41. OUR 911 -169 - 46 - - R

42. ME 9 11 -189 - 46 - - R

Каждое из этих слов может расширить гипотезу budget figure слева. Посмотрим, что выберет блок управления. Наиболее подходящим (см. позиции 3 и ЯО) оказывается слово total ,которое используется лишь с определенным артиклем THE. Таким образом, -удалось объединить уже четыре слова THE TOTAL budget figure, для которых синтаксическая процедура в словесной решетке отмечает слова "is" и " s ", найденные при первоначальном сканировании ( - s- укороченный глагол-связка, допускаемый правилами произношения). Синтаксис также предлагает и некоторые другие слова, но их оценки (очки) меньше 100, тогда как is имеет вео 96 (см. позицию 7). Поэтому переходим к новой гипотезе IS the total budget figure и пытаемся ее расширить. При расширении гипотезы синтаксическая процедура "подсказывает" слова what и но'.'? ыасн. Процедура лексического поиска выбирает для начального участка высказывания слово v/hat с оценкой 176 очков и формирует окончательную гипотезу what IS the total budget figure. Процедура "синтаксис" производит в заключение полный грамматический разбор этой фразы.

Описанная "островковая" стратегия интерпретации высказывания одна из нескольких, реализованных в системе hwim . Другие стратегии используют словесную верификацию на параметрическом Уровне, предсказание слов на уровне диалога, просодическую информацию и т.д.

Испытание системы hwim производилось на двух словарях: из 409 и 1097 словоформ, 124 предложения произносили трое дикторов" "ужчин. Точность интерпретации высказывания составила 52% в первом случае и 44% во втором. Процент высказываний, близких к пра-видьным, составил 23 и 20% соответственно.

Основное отличие системы VDMS (Voioe-Controlled Date Manage-roent Sis.) от ранее рассмотренных СПР Speeohlis.HWIM и Неаг-^-И заключается в тим, что в ее основе лежит синтаксис спон-

Зак.480

41

 

тайного английского диалога [182] ; это позволяет использовать при общении с системой сильно "усеченные" эллиптические выражения СПР. Система vdms использует проблемно-ориентированный язщ доступа к информационно-поисковой системе данных о подводном фаоте США, Великобритании и СССР. Общий словарь языка составлял 450 слое. Система имела возможность запонинать информацию о ранее произнесенных фразах и декодировать текущие, имея результаты рас познавания предыдущих высказываний. В системе vdms при интерпретации предложений наиболее полно использована идеология искусственного интеллекта.

Общая структура vdms включает три основь-ле компоненты:

1) акустико-фонетический процессор, в результате работы которого формируется массив данных, содержащих информацию о фонетическом строении высказывания (А-матрица);

2) процедуру лексического сравнения, которая производит сравнения предсказываемых слов, опираясь на слоговой уровень и используя акустико-фонологические правила;

3) лингвистический процессор, который содержит блок грамматического разбора (парсер) и управляющий блок диалогового уровня (discourse level controller )> вктоочающий модель пользова-теяя и семантическую память.

Эксперименты с vdms показали, что речевой сигнал ограничивается по полосе на частоте 9 кГц и поступает на 12-разрядный аналого-цифровой преобразователь, где квантуется с частотой 30 кГц. Затеи оцифрованная речь проходит через ЦАП и результирую щая аналоговая речь поступает на три полосовых фильтра, имеющих полосы пропускания I&0 - 190, 990 - 2200 и 8000 - 5000 Гц. Через интервалы в 10 мс с фильтров снимались два параметра - максимальная амплитуда и число нулевых пересечений. Полученные шесть параметров использовались для грубой акустической маркировки каждого десятимиллисекувдного отрезка.

Как только слово поступает в систему, формируется и хранится в памяти информахцж о нем, в частности, отмечается, сколько высказываний тому назад это слово было произнесено и былс ли оно использовано, насколько вероятно, что это слово повторится еще раз. В системе учтено, что различные контекстные слова предсказанные тематической памятью, "стареют" от высказывания ч высказывании и вероятности их использования уменьшаются. Вел* вероятность предсказанного слова Падает ниже заданного нaпepe^ пор