E-mail: Djavdet. Suleymanov@ksu
Вид материала | Документы |
- Новые технологии в системе оценки качества школьного образования, 184.96kb.
- Авторы программы и лекторы: доктор физ мат наук, профессор Д. А. Таюрский (Dmitrii., 162.8kb.
- с) 1999 А. Аливердиев (e-mail: aliverdi@mail, 1826.11kb.
- О. А. Невзорова ниимм им. Н. Г. Чеботарева, Татарский государственный гуманитарно-педагогический, 220.71kb.
- Нп «сибирская ассоциация консультантов», 69.44kb.
- Берестовая Жанна Александровна, методист гцро, тел. 74-57-34; e-mail: metodist-70@mail, 43.21kb.
- Россия. Москва, ул. Сущевский вал, д. 47, стр. 2, оф. 1, Пц «Маэстро» (конкурс), 127.12kb.
- Кубанского Государственного Аграрного Университета, Краснодарского края состоится 18-я, 28.2kb.
- Открытый конкурс. Наименование, почтовый адрес, номер контактного телефона, 1173.49kb.
- Научная электронная коллекция: опыт разработки и реализации, 120.82kb.
В работах [51, 53] Нариньяни высказывает следующую весьма продуктивную мысль о «модельном подходе»: «Получая на вход формальную Модель, машина автоматически сжимает n-мерное пространство значений ее параметров до минимального параллелепипеда, охватывающего всю область решений. При введении дополнительных ограничений или изменений Модели параллелепипед сжимается или меняет свои размеры в соответствии с новыми областями значений параметров, исчезая совсем, если Модель и\или введенные ограничения оказываются несовместимыми». Нам представляется, что с точки зрения прагматически-ориентированного подхода, саму входную модель можно было бы рассматривать как иерархию разнотипных моделей, взаимосвязанных и взаимозависимых, пересекающихся, возможно, лишь в цепочке прагматически-ориентированной технологии анализа ЕЯ-текста (модель ПО, модель диалога, модели языковых уровней, включающие соответствующие грамматики, модель среды и т.п.).
В целом, идеи А.С.Нариньяни о модельном, а не алгоритмическом подходе, о децентрализованном и асинхронном анализе текстов, об организованном сообществе активных constraint-based агентов - а это в нашем определении концептуально-функциональные лингвистические модели, и ряд других, весьма четко и убедительно очерчивают перспективные направления развития систем обработки информации, в том числе ЕЯ-текстов.
Семантически-ориентированный подход к процессу понимания текста на примере экспериментальной системы понимания описаний рентгеновских снимков рассматривается также и в работе И.С.Кононенко [40]. Практически, идеи, изложенные в работе [40], также в [52], сильно коррелируют с идеями построения прагматически-ориентированной диалоговой вопросно-ответной модели, изложенной Бухараевым-Сулеймановым в [25] с той разницей, что если в работе Каноненко И.С. объектом анализа является произвольный описательной текст в сильно-ограниченной предметной области (материал текстов рентгенологических описаний состояния органов грудной клетки), а в [32, 52] - изолированное сообщение в рамках ограниченной ПО, то в [25] объект анализа - это текст, являющийся одним из ожидаемых значений по заданному вопросу.
В работе «Методология минимизации усилий в инженерной лингвистике» [102] Шереметьева С.О. раскрывает идеи, также весьма близкие к прагматически-ориентированной технологии построения лингвистических моделей. Здесь приводится анализ основных методов экономии усилий, используемых при создании различных реально действующих систем автоматизированной обработки текста, и формулируется методология минимизаций усилий, которая определяет совокупность методов и правил выбора деятельности для создания компьютерных систем обработки текста в условиях ограниченных ресурсов времени и материалов языковых описаний, а также стандартных вычислительных алгоритмов.
В целом ряде проанализированных нами работ, авторы также явно или неявно высказывают, или даже используют при разработке конкретных систем, идеи, близкие по содержанию к идее прагматически-ориентированного подхода. Так, в работе Андрусенко Т.Б. [3] приводится следующее определение: "...прагматически ориентированным можно считать направление прикладных исследований и разработок, целью которых является определение теоретических и практических основ создания систем диалога с ЭВМ с учетом особенностей решаемых задач и стратегии использования ЕЯ".
Прагматически-ориентированный подход, по мнению Андрусенко, позволяет создать предпосылки и для разработки диалоговых моделей общего типа, которые бы отражали общие свойства задач данного класса с точки зрения функций общения при решении задач. Под прагматикой диалога здесь понимается организация диалога с точки зрения типа решаемой задачи (например, информационно-справочная, обучения, принятия решений), предметной области, варианта ЕЯ-диалога и речевой (коммуникативной) ситуации, выступающей фрагментом функционального окружения диалога. Прагматическая ориентация здесь заключается в способе выбора той или иной композиционной схемы диалога как варианта структуры диалога пользователя с системой, в отличие от нашего подхода, при котором, во-первых, изначально не делается акцент на определенную модель (диалоговую или недиалоговую), а соответствующая модель выбирается именно на основе прагматически-ориентированной технологии, во-вторых, наряду с общим и тематическим схемами диалога [35], важным является также и способ выбора средств для обработки естественно-языкового текста. Следующие утверждения, декларируемые в работе [3], практически, являются методологическим этапом прагматически-ориентированной технологии построения лингвистических моделей:
а) Ориентация на тип задачи определяет некую стратегию построения диалога.
б) Прагматика предметной области определяет допустимые границы интерпретации текста.
в) Прагматика языка общения связана с его употреблением в соответствии с целями в определенных ситуациях, в результате чего осуществляется выбор языковых средств этой интерпретации.
Вместе с тем, как справедливо замечает Андрусенко, прагматика даже в таком, более узком, ее понимании по-прежнему представляет собой наименее разработанный аспект диалога [3], а для более общих случаев построения прагматически-ориентированных моделей и технологий вопрос в такой постановке, практически, в литературе не рассматривается. Исследователи Дж.Гвида и К.Тассо [28, 118] предлагают подход к созданию систем понимания естественных языков, называемый целенаправленным анализом, подтверждая тем самым объективность и перспективность предлагаемой нами технологии построения прагматически-ориентированных лингвистических моделей. Модель понимания языка, предложенная Дж.Гвидо и др. [27], используется для решения задачи взаимодействия человека с ЭВМ и базируется на предположении о том, что ограниченность предметной области при взаимодействии с ЭВМ часто дает возможность создать эффективный интерфейс с системой искусственного интеллекта (СИИ). В случае прагматически-ориентированного подхода ограничение на ПО не констатируется, т.е. не делается явных ограничений на ПО, а ограничивается (определяется) режим диалога, фиксирующий активную и пассивную стороны. Под ЕЯ-интерфейсом в [27, 28] декларируется запрос к системе. В нашем же случае, естественно-языковой текст - это ответ на вопрос системы, причем, естественность заключается в том, что не накладывается никаких специальных ограничений на форму и полноту языка ответа. Ранее пути решения общей проблемы понимания ЕЯ, как отмечено вначале статьи, базировались, в основном, на чисто лингвистическом анализе входного текста. Однако, очевидно, что оптимальную модель понимания ЕЯ можно построить, если только эксплицитно учитывать ее цели и сферу применения [9, 14, 15, 16, 26, 33, 34, 35]. Если во главу угла будет поставлена цель взаимодействия с ЭВМ на ЕЯ, то это даст возможность отвлечься от многих лишних деталей и тонкостей входного текста и выбирать из них только релевантную информацию. Такой подход позволит увеличить эффективность алгоритмов анализа текста и в то же время обеспечит свободное взаимодействие с ЭВМ на ЕЯ. Авторы [27, 28] замечают, что такой принцип целенаправленного (goaloriented) анализа может с успехом использоваться в общей лингвистической теории, в которой семантика ЕЯ в контексте взаимодействия человека с ЭВМ определяется на основе таких понятий, как поведение, цели и планы слушающего и говорящего. Известно, что предложение может иметь несколько разных значений, в зависимости от целей говорящего и от точки зрения слушающего. При таком подходе сложность задачи понимания ЕЯ определяется не только особенностями устройства входного текста, но и внутренними свойствами участников диалога и широтой предметной области, в рамках которой осуществляется взаимодействие. Идея целенаправленного анализа положена в основу типовой системы, названной NLI (Natural Language Interface) и обслуживающей запросы к реляционным базам данных [27, 28, 118]. Предлагаемая модель понимания языка используется для решения задачи взаимодействия человека с ЭВМ и базируется на предположении о том, что ограниченность предметной области при взаимодействии с ЭВМ часто дает возможность создать эффективный интерфейс с СИИ. В основе проекта - принцип целенаправленного понимания ЕЯ на основе алгоритмов семантически- ориентированного анализа текста. Область приложения системы NLI-1 - обработка запросов на итальянском языке к небольшой реляционной базе данных, представляющий собой библиотечный каталог, в котором «понимание» достигается на уровне очень простых предложений на ЕЯ. В 1979 авторы разработали развитую систему NLI-2, которая осуществляло целенаправленное понимание ЕЯ и семантически-ориентированный анализ текста, было достигнуто улучшение понимания ЕЯ (вплоть до понимания текстов запросов, содержащих анафорические связи).
По мере накопления опыта разработки и эксплуатации диалоговых систем прагматическая концепция постепенно складывается как требование исследования и реализации моделей общения различного назначения. Одним из аспектов такого исследования может служить попытка сформулировать задачу следующим образом: определение влияния так называемых неязыковых факторов общения на выбор языковых средств передачи сообщений. Этими средствами выступают как целые языковые структуры (уровень композиционной схемы диалога), так и конкретные языковые элементы.
На необходимость комплексного, технологичного подхода к исследованию проблемы «понимания» текста, большей интеграции между семантикой уровня предложения или высказывания и теориями структур текста или диалога указывается и в работе [141]. С.Пулман справедливо утверждает, что последние работы в семантике сместили акцент с подхода, основанного чисто на предложении, однако степень того, насколько интерпретация отдельных предложений может зависеть от диалога или установок текста, или целей участника, гораздо больше, чем представляется в настоящее время. Как подчеркивается в работе [36] опыт разработки систем понимания и синтеза связных текстов показывает, что многие трудности, как правило, вызываются отсутствием указания на практическое приложение данной проблемы. Отсюда возникают неопределенности, связанные с описанием внешней среды диалога, его темы и целей, описанием внутренних миров партнеров и механизмов генерации, восприятия и когнитивной обработки речевых актов. Некоторые важные идеи раскрываемого нами прагматически-ориентированного подхода к разработке систем обработки ЕЯ-текстов высказаны и использованы при создании конкретных систем Мальковским М.Г. в работе [45]. Здесь подчеркивается, что «переход к созданию прикладных систем общения с ЭВМ на ЕЯ ставит перед разработчиками целый комплекс вопросов, не возникавших на этапе первых экспериментов. Серьезная практическая задача обеспечения взаимодействия с машиной на ЕЯ требует серьезного и практического подхода». Акцентируя внимание на прагматике и приводя основательные доводы в пользу ЕЯ-диалога, Мальковский М.Г. также подчеркивает разумность выбора пути не ограничения ЕЯ. Если диалоговая система узко ориентирована (узка ее область применения, функции), разумнее, вероятно, использовать не так называемый «ограниченный ЕЯ», а специализированный формальный язык общения. Средства обеспечения диалога в этом случае относительно просты и эффективно реализуемы, компактность и однозначность адресуемых системе сообщений гарантирует высокую надежность ее работы. А запомнить ограничения, наложенные на ЕЯ, и, главное, следовать им - в ходе диалога постоянно следить за допустимостью формулировок - человеку может оказаться ничуть не легче, чем изучить два-три десятка директив формального входного языка. Крайне неудачным представляется и сам термин «ограниченный ЕЯ» (смысл его, как правило, не уточняют) [45] .
Анализ существующих лингвистических моделей и тенденций в этой области показывает актуальность и естественность разработки прагматически-ориентированной технологии построения лингвистических моделей, что, как мы полагаем, и демонстрирует также и наш опыт построения реальных моделей обработки ЕЯ-текстов, описанных в работах [17-25, 70-88, 145-147].
- Анализ средств обработки ЕЯ-текстов в диалоговых системах
- Особенности диалоговых моделей в аспекте прагматически-ориентированного подхода.
На современном этапе можно указать две концепции развития средств ЕЯ-взаимодействия. В рамках первой из них подсистема ЕЯ-общения рассматривается как процессор (а вернее, препроцессор) ввода-вывода к традиционной прикладной системе. Подобный подход применяется, например, в системе ПОЭТ [59] и ее промышленной версии АИСТ [35]. Вторая концепция предполагает, что модуль ЕЯ-взаимодействия с пользователем берет на себя функции интеллектуального монитора, а отдельные подсистемы (например, информационно-поисковые, планируюшие и т.п.) выступают в качестве функциональных и обеспечивающих программ [2, 66].
В последние годы активизировались теоретические и прикладные работы по развитию комплексной и многоаспектной лингвистической стороны данной проблемы, а именно, исследование диалога как способа общения и вида текста [35, 65, 89-95]. Прагматически определяющим фактором человеко-машинного диалога является то, что она формируется на основе связи темы диалога, ситуации и контекстов взаимодействия в зависимости от коммуникативных задач, стоящих перед участниками общения, а также языковых возможностей, которыми обладают участники диалога. Как утверждается в [3], формализация процесса общения в целях построения систем человеко-машинного диалога (ЧМ-диалога) диктует определение таких языковых структур, которые могут быть порождены и интерпретированы алгоритмически. Факторы, влияющие на выбор языковых средств и формирование текста ЧМ-диалога: фактор подготовленности диалога, тематически ограниченная предметная область, факт структуризации предметной области (ПО) в сознании человека и в памяти системы, стереотипный характер ситуаций ЧМ-диалога, предсказуемость и ожидания в стереотипных ситуациях. К главным критериям выделения предпочтительных языковых средств Андрусенко относит типы проблемных ситуаций задачи, решаемой в диалоге, и способность языковых элементов выступать в роли того или иного компонента проблемной ситуации. Установление объективности категории предпочтительных языковых средств выражается в концепции ограниченного естественного языка как варианта языка диалога, который является ограничением не по своей природе, а по степени использования тех или иных средств передачи сообщений [3]. Далее рассматриваются признаки и отношения, характерные для текста человеко-машинного диалога. Наиболее структурированный уровень отношений составляют отношения между элементами структуры диалога и языковыми средствами. Являясь отражением отношений между фрагментами действительности (зафиксированными в некоторой модели представления знаний о ПО) и описывающими их языковыми средствами (составляющими материальную основу текста), что выражается категорией смысла, они образуют как бы серединный уровень следующей иерархии:
-------------------------------------------------------------------------------------------
действительность | смысл (отношение) | язык
------------------------------------------------------------------------------------------
Модель действительности | Смысл - соответствие | языковые средства
(структуры знаний о ПО) | |(текст)
Структура диалога | Смысл - прогнозиро- | языковые средства
(комплекс диалогических | вание | (фрагменты теста)
элементов и отношений)
Ситуация и элементы | Смысл-функция | языковые средства
ситуации | | (конкретные
языковые элементы)
В первом аспекте смысл текста в ЧМ-диалоге рассматривается в связи с категориями цели и функций участников при решении некоторой задачи. В этом случае понимание каждым участником диалога языкового выражения связывается с выполнением своей функции на данном этапе диалога, вытекающей из содержания анализируемого выражения. Например, может быть установлена следующая ситуация: тип диалога - вопросно-ответный; режим диалога - второй (см. п.1.2.1.2), т.е. активна система (ведущая) - пассивен ученик (ведомый).
Второй аспект смысла ассоциируется с категорией прогнозируемости стереотипных ситуаций и их последовательностей, а также закрепленных за ними устойчивых языковых форм, т.е. понимание в этом случае связывается с прогнозированием. В нашем случае, это - определение типа вопросов и ответов и концептуальной грамматики как совокупности [25, 78].
В третьем аспекте смысл выступает как отношение между моделью действительности и текстом, где текст фиксирует некоторое положение вещей в мире. Здесь понимание связывается с соответствием содержания языкового выражения данному фрагменту действительности. Категория соответствия включает как результат действия на основе понимаемого (воспринимаемого) смысла, так и его оценку, которая завершает текущий цикл понимания. Такая ситуация соответствует анализу на уровне модели значений заданного вопроса и соответствующей индивидуальной концептуальной грамматики [25].
Отдельным типом отношений между элементами и единицами диалога можно считать тематическую связность. Тема диалога всегда известна и структурирована в модели предметной области. Для вопросно-ответной ситуации, средством, обеспечивающим тематическую связность, выступают типы вопросов и классы значений вопросов, т.е. «ожидаемых» ответов обучаемого.
Формально-грамматическая связность базируется на конкретных языковых элементах и отношениях, служит основой формирования текста. В диалоговой модели, описываемой в [25], формально-грамматическая связность реализуется через индивидуальные концептуальные грамматики каждого класса значений вопросов, связывающие глубинные смысловые конструкции анализируемого текста с ожидаемой моделью значений.
В лингвистическом процессоре ЛП [25], разработанном на основе прагматически-ориентированной диалоговой модели, минимальной коммуникативной единицей выступает текст, создаваемый в вопросно-ответной ситуации, т.е. ответ обучаемого на вопрос системы, являющийся одним из ожидаемых значений вопроса (в отличие запросно-ответной ситуации, в которой текст является либо запросным текстом пользователя к системе, либо реакцией (ответом) системы на некоторый запрос пользователя - подробно рассматривается ниже).
- Запросно-ответные системы.
Диалог человека с машиной означает интерактивный обмен посланиями между пользователем и диалоговой системой в соответствии с условленными языком (языками) диалога и формой (формами) диалога для достижения определенной задачи [31]. Диалоговое взаимодействие пользователя с автоматизированной системой протекает в одном из следующих режимов: 1) активна система, когда на вопросы системы отвечает пользователь, 2) активен пользователь, когда на запрос пользователя определенным образом реагирует система, и наконец, 3) двухсторонне активный диалог, когда пользователь и система меняются ролями в ходе общения.
Наиболее изученным, развитым и представленным в литературе является режим (2), когда вопросы задает пользователь, а система отвечает. Очевидно, что при этом успешный поиск информации в базе данных и генерирование соответствующего ответа, главным образом, зависят от того, насколько корректно система сможет интерпретировать вопрос пользователя. Большинство лингвистических процессоров для общения с базой данных (БД) на ЕЯ, активно разрабатываемых рядом отечественных и зарубежных исследовательских групп и фирм, не опираются на принципиальную лингвистическую модель и функционирует в предположении, что человек инициирует диалог, т.е. цели пользователя, а не системы, определяют диалог [31]. К таким работам относятся исследования Н.Бельнапа и Т.Стила [13], У.Ленерта [151], системы SAM (Р.Шенк и др.), ПОЭТ (Э.В.Попов и др.) [59], многие экспертные и информационно-справочные системы, например, MYCIN (Шортлифф)[60], ИВОС (Л.Т.Кузин, А.Преображенский, В.Хорошевский и др.)[42], Лингвистический процессор для сложных информационных систем (Ю.Д.Апресян и др.) [6], система InterBASE (А.С.Нариньяни и др.) [122].
Работа Бельнап и Стил "Логика вопросов и ответов" [13] посвящена рассмотрению формальной теории вопросов и выработке на уровне метаязыка системы понятий, полезной для классификации и оценки вопросов и ответов, а также для установления связи между ними. В работе анализируются в основном два типа вопросов: