Литература

Вид материалаЛитература

Содержание


7. Мера различия между родами
G(pom) - мужской , G(carte)
P(pom) можно связать с любым словом парадигмы P(carte)
8. Категория падежа
9. Определение падежа
10. Падеж в смысле Колмогорова
K - некоторое множество объектов, а M
M. Будем говорить, что два состояния s
P , считая, например, что имеется отличный от x
Подобный материал:
1   2   3

7. Мера различия между родами


Перейдем теперь к проблеме измерения различий между двумя данными родами. С этой целью введем понятие расстояния между двумя родами G(x) и G(y), которое определяется как наименьшее число n такое, что всякое слово рода G(x) может быть соединено со всяким словом рода G(y) цепью, длина которой не более n + 1. В том случае, когда такого числа не существует, мы будем говорить, что расстояние между G(x) и G(y) бесконечно. Будем обозначать через d (x,y) расстояние между G(x) и G(y). Нетрудно видеть, что d (x,y) ³ 0, d (x,y) = d (y,x), d (x,y) £ d (x,z) + d (z,y) для всякого слова z. Таким образом, для d (x,y) выполняются почти все свойства расстояния в метрическом пространстве. Это понятие особенно удобно, когда множества слов, относящиеся к разным родам, не пересекаются (как в большинстве приведенных выше примеров).

Определим теперь расстояния между родами в различных естественных языках. Не претендуя на полное описание, мы хотим тем самым лишь пояснить на примерах понятие расстояния и его лингвистический смысл.

А н г л и й с к и й я з ы к. Для двух произвольно взятых существительных x и y имеем G(x)= G(y) и d (x,y) = 2.

Ф р а н ц у з с к и й я з ы к. Рассмотрим семь следующих родов: G(crayon) - первый мужской, G(arbre) - второй мужской, G(maison) - женский, G(cas) - первый средний, G(voix) - второй средний, G(enfant) - третий средний, G(camarade) - четвертый средний. Поскольку bel arbre и bels arbres - правильные словосочетания в отличие от bel crayon, bels crayons, то d (crayon,arbre) = ¥ . C другой стороны, так как beau crayon и beaux crayons - правильные словосочетания, а beau maison и beaux maisons таковыми не являются, то d (crayon,maison) = ¥ . Так как словосочетания nouveau cas и nouveaux cas правильные, а nouveau crayon и nouveaux crayons неправильные, то d (crayon,cas) = ¥ . Поскольку beau voix и beaux voix неправильны, то d (crayon,voix) = ¥ . Ввиду того, что правильные словосочетания belle enfant и belles enfants становятся неправильными, если заменить enfant на crayon и enfants на crayons d (crayon,enfant) = ¥ . Поскольку bel arbre, bels arbres правильны, тогда как bel cas, bels cas неправильны, то d (arbre,cas) = ¥ . Так как словосочетания bel voix, bels voix неправильны, то d (arbre,cas) = ¥ . Ввиду того, что belle enfant и belles enfants правильны, тогда как belle arbre и belles arbres правильными не являются, d (arbre,enfant) = ¥ . Поскольку grande voix и grandes voix - правильные словосочетания, а grande maisons grandes maison - нет, то d (maison,voix) = ¥ . Так как bel enfant и bel enfants являются правильными словосочетаниями, тогда как bel maison и bels maisons - нет, то d (maison,enfant) = ¥ . Подобным же образом мы находим, что d (maison,cas) = ¥ , d (voix,cas) = ¥ и d (voix,enfant) = ¥ . Из того, что словосочетания beau camarade, beaux camarades, bell camarade и belles camarades являются правильными, тогда как beaux camarade, beau camarades, belles camarade, belle camarades, bel camarade, bels camarades неправильны, следует, что d (crayon,camarade) = d (arbre,camarade)= d (maison,camarade)= d (camarade,cas)= camarade = d (enfant, camarade) = ¥ , Нетрудно видеть, что два различных рода никогда не пересекаются.

И т а л ь я н с к и й я з ы к. Рассмотрим три следующих рода: G(fratello) - мужской, G(bocolla) - женский, G(giovane) - средний. Так как buono fratello и buoni fratelli - правильные словосочетания, а buono bocolla и buoni bocolle - неправильные, то d (fratello,bocolla) = ¥ . Так как buona giovane и boune giovani допустимы, а buona fratello и buone fratelli - нет, то d (fratello,giovane) = ¥ . Из того, что buono giovane и buoni giovani - правильные словосочетания, в то время как buono bocolla и buoni bocolle неправильные, следует, что d (giovane,bocolla) = ¥ . Легко видеть, что два разных рода никогда не пересекаются.

И с п а н с к и й я з ы к. Рассмотрим роды G(padre) и G(madre). Аналогичными приемами находим, что d (padre,madre) = ¥ .

Р у м ы н с к и й я з ы к. Рассмотрим шесть следующих родов: G(pom) - мужской , G(carte) - женский , G(scaun) - первый средний , G(ochi) - второй средний , G(inv ă t ă toare) - третий средний , G(nume) - четвертый средний.

Кратчайшая цепочка между pomi и carte имеет длину 6: pomi - pom - scaun - scaune - c ă rti - carte. Так как любое слово парадигмы P(pom) можно связать с любым словом парадигмы P(carte) цепью, длина которой не превышает 6, то d (pom,carte) = 5. Кратчайшая цепь между pomi и scaune имеет длину 4: pomi - pom - scaun - scaune.

Так как любое слово парадигмы P(pom) можно соединить с любым словом парадигмы P(scaun) цепью, длина которой не больше 4, то имеем d (pom,scaun) = 3.

Кратчайшая цепь между pom и ochi имеет длину 4: pom - pomului - ochiului - ochi. Так как любое слово из парадигмы P(pom) можно соединить со всяким словом парадигмы P(ochi) цепью, длина которой не превышает 4, то d (pom, ochi) = 3. Кратчайшая цепь между pomi и inv ă t ă toare имеет длину 6: pomi - pom - scaun - scaunelor - inv ă t ă toarelor - inv ă t ă toare. Так как любое слово парадигмы P(pom) может быть соединено с любым словом парадигмы P(inv ă t ă toare) цепью, длина которой не превышает 6, то имеем d (pom,inv ă t ă toare) = 5. Из того, что для любого x Î P(pom) и любого y Î P(nume) имеется цепь x - pomului - numelui - y, следует, что d (pom,nume) = 3.

Для всякого x Î P(carte) и всякого y Î P(scaun) имеется цепь x - c ă rti - scaune - y. Отсюда d (carte,scaun) = 3. Для любого x Î P(carte) и любого y Î P(ochi) имеется цепь x - c ă rti - scaune - scaunului - ochiului - y; отсюда d (carte,ochi) = 5. Для всякого x Î P(carte) и всякого y Î P(inv ă t ă toare) имеется цепь x - c ă rtii - inv ă t ă toarei - y. Отсюда d (carte,inv ă t ă toare) = 3. Для всякого x Î P(carte) и всякого y Î P(nume) существует цепь x - c ă rtilor - numelor - y. Отсюда d (carte,nume) = 3.

Подобным же образом устанавливаем, что d (scaun,ochi) = 3, d (scaun,inv ă t ă toare) = 3, d (scaun,nume) = 3, d (ochi,inv ă t ă toare) = 5, d (ochi,nume) = 3, d (nume,inv ă t ă toare) = 3. Ясно, что два разных рода никогда не пересекаются.

Р у с с к и й я з ы к. Рассмотрим роды G(стол) - мужской, G(книга) - женский и G(окно) - средний. Используем следующее свойство этого языка: форма множественного числа русских прилагательных для всех родов совпадает. Отсюда следует, что формы множественного числа двух существительных, стоящих в одном и том же падеже, относятся к одному и тому же семейству. Если x Î G(стол), y Î G(книга) и z Î G(окно), а x ¢ , y ¢ , z ¢ - соответствующие формы именительного падежа множественного числа, то существуют цепи x - x ¢ - y ¢ - y , x - x ¢ - z ¢ - z, y - y ¢ - z ¢ - z. Следовательно, d (стол,книга) = d (стол,окно) = d (книга,окно) = 3.

Н е м е ц к и й я з ы к. Рассмотрим следующие роды: G(Titel) - мужской, G(Gabel) - женский, G(Fenster) - средний. По тем же причинам, что и в русском языке, оказывается, что d (Titel,Gabel) = d (Gabel,Fenster) = d (Titel,Fenster) = 3.

Л а т и н с к и й я з ы к. Рассмотрим роды G(puer) - мужской, G(aestas) - женский, G(tempus) - средний. Воспользуемся следующими обстоятельствами: форма дательного падежа множественного числа латинских прилагательных совпадает для всех родов. Из этого следует, что формы дательного падежа множественного числа двух существительных принадлежат одному и тому же семейству. Если x Î G(puer), y Î G(aestas), z Î G(tempus), то имеются цепи x - pueris - aestatibus - y, x - pueris - temporibus - z, y - aestatibus - temporibus - z. Отсюда следует, что d (puer,aestas) = d (aestas,tempus) = d (puer,tempus) = 3.

Сделаем выводы по приведенным результатам.

1. Расстояние между мужским и женским родом максимально во французском, итальянском и испанском языках (где оно равно ¥ ) и минимально в русском, немецком и латинском языках (где оно равно 3). Румынский язык в это отношении занимает промежуточное положение.

2. В отличие от русского, немецкого и латинского языков, где три рода в одинаковой степени противопоставлены друг другу, что проявляется в постоянном значении расстояний между ними, в румынском языке некоторые из средних родов занимают явно подчиненное положение по сравнению с мужским и женскими родами. Например, расстояние между мужским и женским родом равно 5, тогда как расстояние между мужским родом и первым средним родом равно 3.


8. Категория падежа


Карегория падежа является более сложной проблемой для изучения чем категория рода. Имеющиеся работы по этой проблеме касались, в основном, уточнения числа семантических признаков падежей и выявления инвариантных дискретных элементов, как правило бинарных. Комбинируя эти элементы, можно получить все значения различных падежей, возможных в данном языке. Эта точка зрения нашла выражение в известных работах [31-33]. Другие аспекты проблемы падежа затронуты в работах [34-37].

Ниже рассматриваются следующие вопросы. Вначале мы рассмотрим математическую модель падежа, основанную на идее В.А.Успенского [38]. Эта модель выдвигает на первый план синтагматический аспект грамматической категории падежа. Поэтому мы не будем пользоваться здесь понятием формы слова и использовать сведения об их морфологической структуре, а ограничимся, как и в случае с грамматическими родами, обращением к контекстам, в которых употребляются эти слова. Падежи, таким образом, будут определены как классы контекстов. С этой целью мы введем некоторое отношение эквивалентности на множестве отмеченных контекстов, и соответствующие классы эквивалентности как раз и будут падежами.

Далее мы рассмотрим идею А.Н.Колмогорова, предложившего определить падеж с точки зрения семантики. Эта идея изложена в работе [38], но как известно из [39], она была сформулирована Колмогоровым еще несколько десятилетий тому назад. Здесь для описания падежа привлекается семантика, поэтому такой способ определения падежа называется определением в плане содержания. Затем мы рассмотрим также предложенный И.И.Ревзиным [23,40] аналог падежа по Колмогорову, относящийся к плану выражения. Так как все перечисленные походы имеют недостатки, мы, следуя [38], представим затем некоторый синтез упомянутых точек зрения. Следует отметить, что падежная система наиболее сложна в славянских языках, поэтому все используемые примеры взяты из русского языка. На примере русского же языка сформулированы выводы по этому разделу.

9. Определение падежа


Как уже было отмечено выше, категория падежа является более сложной, чем категория рода, и для её изучения требуется построение более тонких разбиений, чем просто разбиения на парадигмы и дистрибутивные классы. Действительно, при всем многообразии слов в парадигме, все они одного рода и дистрибуция требуется по существу лишь для того, чтобы отделить формы единственного и множественного числа. В то же время, в каждой парадигме содержатся формы всех падежей, допустимые контексты которых образуют подчас весьма сложные связи. Поэтому для определения падежа ключевым является понятие согласованных контекстов .

Будем говорить, что два контекста g ¢ и g ¢ ¢ согласованы относительно слова a Î G , если существует такое слово a ¢ Î P(a) , что a ¢ непосредственно допустимо и в g ¢ и в g ¢ ¢ .

Далее, два контекста g ¢ и g ¢ ¢ будем называть согласоваными , если для любого слова a Î G , допустимого как в g ¢ так и в g ¢ ¢ , g ¢ и g ¢ ¢ являются согласованными относительно a и существует по меньшей мере одно слово b непосредственно допустимое как в g ¢ так и в g ¢ ¢ . Условие согласованности контекстов g ¢ и g ¢ ¢ можно представить следующим образом: A ( g ¢ ) Ç A ( g ¢ ¢ ) ¹ 0 и для всякого x Î A ( g ¢ ) Ç A ( g ¢ ¢ ) пересечение P(x) Ç B ( g ¢ ) Ç B ( g ¢ ¢ ) непусто.

Наконец, два контекста g ¢ и g ¢ ¢ назовем эквивалентными и будем обозначать это g ¢ » g ¢ ¢ , если существует конечная цепочка контекстов g ¢ = d 1 , ..., d i , d i +1 ,... d n = g ¢ ¢ , такая что для любого 0 < i < n контексты d i , и d i +1 согласованы. Эквивалентные контексты образуют разбиение множества контекстов на классы. Каждый класс эквивалентных контекстов мы будем называть грамматическим падежом .

Рассмотрим несколько примеров из русского языка. Пусть f 1 = q - пустая последовательность f 2 = кипит, g 1 = кошка пьет, g 2 = q , h 1 = кошка любит, h 2 = q .

Слово воду непосредственно допустимо в контекстах ( g 1 , g 2 ) и ( h 1 , h 2 ), так как фразы кошка пьет воду и кошка любит воду принадлежат Ф. Контексты ( f 1 , f 2 ) и ( g 1 , g 2 ) согласованы относительно слова молоко, но не согласованы относительно слова вода , потому что можно сказать вода кипит и кошка пьет воду, но нельзя сказать ни воду кипит, ни кошка пьет вода. Контексты ( мальчик идет, q ) и ( мальчик идет по, q ) не согласованы относительно слова берег. Контексты ( q , строит дом ) и ( дом строится, q ) не согласованы относительно слова рабочий. Контексты c 1 = ( q , бежала ) и c 2 = ( q , бежит ) согласованы. Контексты c 1 и c 3 = ( q , бежал ) эквивалентны, поскольку в цепочке c 1 - c 2 - c 3 согласованы.

Необходимо отметить, однако, некоторое несовершенство модели. Контексты ( я вижу синий, q ) и ( синий, q ) являются согласованными, а значит эквивалентными, хотя с точки зрения традиционной грамматики мы имеем здесь разные падежи. Чтобы обойти эту трудность, В. А. У с п е н с к и й [38] предложил отказаться от контекстов с прилагательными, порядковыми числительными и т. п. К числу недостатков этой модели следует отнести и то, что разные словоформы одного и того же существительного могут быть непосредственно допустимыми в одном контексте. Например, формы газеты и газету непосредственно допустимы в контексте ( не читал, q ), формы кошке и кошку непосредственно допустимы в контексте ( дал, q ). Чтобы избежать этого Успенский в той же работе предлагает ограничить классы рассматриваемых контекстов таким образом, чтобы две различные словоформы одного и того же слова не могли быть непосредственно допустимыми в одном контексте. Можно показать, однако, что и это усовершенствование не снимает всех трудностей и необходима новая модель.


10. Падеж в смысле Колмогорова


Подход Колмогорова к определению падежа основывается на уверенности в том, что только формальных, то есть синтаксических, средств для определения падежа недостаточно. Необходимо привлечение семантики. Поэтому наряду с языковыми средствами Колмогоров вводит понятия объекта и его состояния.

Пусть K - некоторое множество объектов, а M - множество состояний. Через j обозначим отображение множества K в множество подмножеств M. Обозначим, кроме того, через Z множество всех упорядоченных пар вида { x,t }, где x Î K и t Î j ( x ). Рассмотрим теперь некоторое отображение f множества Z на множество G . Приведем несколько примеров, иллюстрирующих введенные понятия.

Рассмотрим объект молоко. Он может иметь следующие состояния: оно может кипеть, оно может отсутствовать, его может выпить кошка и т. д. Обозначим x = молоко ; s 1 = возможность кипеть, s 2 = возможность отсутствовать, s 3 = возможность быть выпитым кошкой, s 4 = возможность быть выпитым собакой и т. п. Отображение j задается так, что s 1 Î j ( x ), s 2 Î j ( x ), s 3 Î j ( x ), s 4 Î j ( x ) и т.д. Далее, f ({ x , s 1 }) = молоко ( молоко кипит ), f ({ x , s 2 }) = молока ( молока нет ), f ({ x , s 3 }) = молоко ( кошка пьет молоко ), f ({ x , s 4 }) = молоко ( собака пьет молоко ).

Введем теперь новое отношение на множестве состояний M. Будем говорить, что два состояния s 1 и s 2 конгруэнтны, есди выполняются следующие три условия:

1) если s 1 Î j ( x ), то s 2 Î j ( x );

2) если s 2 Î j ( x ), то s 1 Î j ( x );

3) если x - это объект, для которого s 1 Î j ( x ) и s 2 Î j ( x ), то f ( z 1 ) = f ( z 2 ), где z 1 = { x , s 1 } и z 2 = { x , s 2 }.

Введенное отношение разбивает множество состояний M на непересекающиеся классы, которые будем называть семантическими падежами или падежами в смысле Колмогорова.

Семантические падежи хорошо работают при исследовании модельных т. е. искуственных конструкций. При анализе же естественных языков использование семантических падежей связано с некоторыми трудностями, вызванными по большей части слишком широким характером обычных парадигм, т. е. специфическими свойствами множеств P ( u ), где u Î G , и явлением синонимии.

В частности, если для всякого существительного u P ( u ) содержит множество его словоформ, причем не учитываются различия по числу и по определенности-неопределенности (при условии, что последнее выражается в данном языке с помощью артикля), то при попытке применить описанную модель к естественным языкам мы сталкиваемся с определенными трудностями, когда одному состоянию объекта может соответствовать несколько форм слова, обозначающего данный объект. Напрмер, в предложениях мальчик идет берегом и мальчик идет по берегу формы берегом и по берегу выражают одно и то же состояние объекта берег, в предложениях рабочий строит дом и дом строится рабочими формы рабочими и рабочий выражают одно и то же состояние объекта, обозначаемого словом рабочий.

Эти примеры приводят к выводу, что отображение f множества Z на множество G в естественных языках не однозначно. Такого положения можно избежать, приняв следующие меры предосторожности:

(а) выбирать возможно более мелкие разбиения на парадигмы P , считая, например, что имеется отличный от x объект y , состояние которого выражается словоформами множественного числа, а также отличный как от x, так и от y объект z , состояния которого выражаются словоформами единственного числа с неопределенным артиклем;

(б) принять соглашение, исключающее абсолютную синонимию; из него следовало бы, что две отличные друг от друга формы одного и того же слова не могут выражать в точности одно и то же состояние; так, например, предложение мальчик идет берегом выражает другой оттенок значения (иное состояние объекта), обозначенного словом берег, по сравнению с предложением мальчик идет по берегу.

Условия, предложенные в пунктах (а) и (б) вполне приемлимы с точки зрения лингвистики. Если говорить о пункте (б), то многие авторы считают, что в языке не существует полных синонимов. Что касается пункта (а), то он предполагает просто, что анализ категрий числа и определенности-неопределенности закончен, и мы рассматриваем существительные этих категорий по отдельности.