Разработка алгоритма работы синтаксического анализатора текста, а также базы данных синтаксических правил русского языка

Курсовой проект - Иностранные языки

Другие курсовые по предмету Иностранные языки

рагменты уничтожаются и создается один большой фрагмент. Его границы определяются стандартно из границ объединенных фрагментов; заполнение других полей в структуре фрагмента определяется каждым правилом отдельно.

Порядок применения правил

Начальное разбиение предложения

Расстановка границ

По всем знакам препинания и сочинительным союзам без запятой проводятся границы фрагментов. Исключения:

1.Граница не проходит по тем знакам препинания, которые входят в состав определенных графематическим анализом единиц (сокращения, дробные числа, букво-числовые комплексы и др.);

2.В том случае, если несколько знаков препинания идут подряд, по ним проходит одна граница. (Не строится фрагментов, не содержащих ни одного слова).

Правило о двух предикатах в одной клаузе

Список глаголов ГС = {давать, становиться, оказаться}

Список значений частей речи, которые могут принимать предикаты

ПС = {VERB (гл. в личн. форме), ADVERB_PARTICIPLE (деепричастие), ADJ_SHORT (кр. прил.), PARTICIPLE_SHORT (кр. прич.), PREDK (предикатив)}

В одной клаузе не может находиться две словоформы, все омонимы которой ПС & ГС. В случаях, когда возникает такая ситуация (опечатка или ошибка морфологии), перед вторым предикатом восстанавливается запятая. Данное правило работает внутри правила расстановки границ и учитывает информацию об аналитических формах. Примеры для клауз исключений, содержащих словоформы из ГС: давайте будем дружить, Ему там могло бы за это время стать совсем скучно и т.д.

Алгоритм интерпретации клауз с тире и восстановления тире в клаузах с нулевым Копулом, написанный для Синтаксиса

Правило 1.

Если мы видим тире, то идем от него направо и налево. Пусть С1 - клауза слева от тире, а С2 - клауза справа. Осуществим следующую проверку: ищем в С1 и в С2 глагол в личной форме или предикатив, если находим, то алгоритм обрывается.

Правило 2.

Если непосредственно слева от тире стоит запятая, (дом, построенный на холме, - большой), то это говорит о конце причастного оборота (P1) либо деепричастного, либо оборота с вершиной который, либо вводного слова, мы ищем его начало (вершины причастие, деепричастие, который, вводное слово), и группу (слово), которая им управляет (R1). Затем мы объединяем R1, P1, C2 в одну клаузу тире.

Правило 3.

Восстановление тире.

Работа производится на этапе первоначальной фрагментации. Мы имеем первоначальный фрагмент.

Если фрагмент не Пустыха, то мы выходим из работы алгоритма. Если фрагмент имеет вариант Пустыха, то мы все равно выходим из работы алгоритма.

Алгоритм не восстанавливает тире в клаузах с двумя инфинитивами (жить все равно что родине служить) по той причине, что случаев, требующих восстановление тире, много меньше, чем случаев, где восстановленное тире - ошибка (Он еще поигрался с этой мыслью, прежде чем позволить ей удалиться.)

случай (тип клаузы ТИРЕ)

Определяем в составе:

 

Таблица 1

Первое словоВторое словоПримерС, им.С/МС, им.маша красавицаС, им.П, имМаша красиваяМС, имС/МС, имОна красавицаМС, имП, имОна красиваяэтоС/МС, им.,Это Машау+С/МС, рдС/МС, имУ соседей ссора

Дополнительные условия:

1.Прилагательное может стоять только справа от существительного или местоимения.

2.Существительное с большой буквы может стоять только слева (кроме случаев с это и у+рд).

.Все части речи неомонимичны, в том числе не должно быть падежной омонимии (типа глазок - С, ед. им., или С, мн. рд), за исключением случая омонимии С, им, ед, но, С, вн, ед, но (стол - стол) и омонимии С ед, мн, им (дело-дела). В противном случае алгоритм обрывается.

.Тире не может восстанавливаться непосредственно перед запятой и другими знаками препинания.

.Тире не восстанавливается, если в одной из клауз есть инфинитив, даже если он омоним (вести свое хозяйство на крестьянский лад). Если состав фрагмента определен согласно таблице 1, то во фрагменте восстанавливаем тире и тип фрагмента становится ТИРЕ. Если мы имеем это + С им, ср и хотя бы еще один претендент на восстановление тире по вышеуказанным правилам (это окно белое), то мы после это тире не восстанавливаем.

.Если в клаузе есть предлог (покушение на жизнь, в стол рукопись), то тире не восстанавливается, за исключением предлога у (Ссора у соседей)

.В случаях, требующих восстановления тире, последнее восстанавливается после первого слова (Покушение - по-человечески жизнь.)

.В клаузе не может восстанавливаться больше одного тире. В случае, если одно тире уже есть или восстановилось, то процедура обрывается. (тире не строится после это в примере Мир - это сон)

К МС мы приравниваем здесь также местоименные прилагательные один, каждый, другой, тот.

случай (тип клаузы КОПУЛ)

 

Таблица 2

С, им. +как словно будто что точно как будтоС, им. Иван что герой

Корпус примеров.

Там, где есть тире, Синтаксис именует клаузу ТИРЕ, где тире нет, там оно восстанавливается и Синтаксис именует клаузу ТИРЕ. Примеры, выделенные жирным шрифтом, не обрабатываются в соответствии с указанными после них правилами.

Петя - человек

вести свое хозяйство на крестьянский лад (см правило 5)

жить все равно что родине служить (см правило 3)

дом, построенный на холме, - боль