Зированной информационно-поисковой системы, предназначенной для информационного обслу­живания инженерно-технических работников угольной промышлен­ности Кузбасса

Вид материалаДокументы

Содержание


Исследование роли предлогов и союзов для повышения качества индексирования
Технология обработки информации для ипс
Карта характеристик
Подобный материал:
1   2   3   4   5   6   7   8

^ ИССЛЕДОВАНИЕ РОЛИ ПРЕДЛОГОВ И СОЮЗОВ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ИНДЕКСИРОВАНИЯ


Предлоги и союзы как форма связи 2-х понятий играют сущест­венную роль при индексировании документов дескрипторами. Связи эти могут иметь различный качественный характер:

• связи целевого назначения;

• причинно-следственные связи;

• видо-родовые связи;

• атрибутивные;

пространственно-позиционные;

• пространственно-направленные;

• пространственно-исходные;
  • связи способа и орудия;
  • связи субстанциональных отношений;
  • связи отрицания;
  • отношения субституции (замещения);
  • формально-грамматические связи.

Одни и те же предлоги или союзы могут иметь различный ха­рактер в зависимости от их дистрибуции (или контекста).

Возможные связи предлогов и союзов представлены в следую­щей таблице:


Виды значений служебных слов


Предлоги, союзы и др. служебные слова

Кол-во значений

Виды значений

Без

1

Связь отрицания

В

2

Связь пространственного направления; Связь пространственно позиционная

Внутри

1

Связь пространственно позиционная

Вид

1

Видо-родовая связь

В качестве

1

Видо-родовая связь

Возникающие при

1

Причинно-следственная связь

В результате

1

Причинно-следственная связь

В следствие

1

Причинно-следственная связь

Для

1

Связь целевого назначения

И

2

Связь объединения; Формально-грамматическая связь

К

2

Связь целевого назначения;

Связь пространственного направления

Как

1




Как вид

1

Видо-родовая связь

Как причина

1

Причинно-следственная связь

Из

3

Субстанциональных отношений; Связь пространственно-исходная; Связь отрицания

На

5

Связь целевого назначения; Атрибутивная связь; Связь способа и орудия; Пространственно-позиционная связь; Связь пространственного направления

На основе

1

Связь субстанционных отношений

По

2

Пространственно-позиционная; Связь целевого направления

От

3

Причинно-следственная; Связь отрицания; Пространственно-исходная связь

Причина

1

Причинно-следственная связь

Против

1

Связь отрицания

Путем

1

Связь способа и орудия

Работающие на

1

Связь способа и орудия

С

4

Атрибутивная связь; Пространственно-исходная связь; Связь отрицания; Связь объединения

С помощью

1

Связь способа и орудия

С применением

1

Связь способа и орудия

Её (всё)

1

Отношения замещения (субституции)



Предлоги, союзы

и др. служебные

слова

Частота

В

358

На

355

И

333

Для

227

С

123

По

89

К

79

Из

34

Их

22

От

24

С применением

17
Пользуясь приведенной таблицей, мы в ходе исследования 2000 рефератов по горному делу выявили частоту и частные связи предлогов, союзов и других служебных слов.


Предлоги, союзы

и др. служебные

слова

Частота

его

12

с помощью

26

как, её

8

без

4

в качестве

4

на основе

4

работающие на

4

или

3

внутри

1

л.

при




0

74


В результате анализа по частоте встречаемости в рефератах по горному делу выявлены следующие предлоги с их видами связей:


Предлоги

Связи

Частота

В

пространственно-позиционная пространственно-направленная

337 21




атрибутивная

84

С

объединения

18




отрицания

18




пространственно-исходная

3

И

объединения

180




формально-грамматическая

151




причинно-следственная

11

От

отрицания

9




пространственно-исходная

4

К

целевого назначения

9




пространственного направления

8




целевого назначения

16

По

атрибутивная пространственно-позиционная

60 13

Из

субстанциональная

19




пространственно-исходная

15




целевого назначения атрибутивная

58 63

На

связь способа и орудия пространственно-позиционная пространственного направления

101

120

13


Как показали наблюдения над частотой предлогов, в документах (рефератах) по горному делу наибольшую частоту имеют простые пред­логи в, на, для, с, к, по, из, от. Причем основной массе предлогов свой­ственно выражать, прежде всего, пространственные и временные отно­шения.

В то же время, являясь служебными, предлоги служат для выра­жения различных отношений между понятиями. Отношения между предметами могут рассматриваться со стороны объема понятий.

Объем понятий - это множество предметов, каждому из которых принадлежат признаки, относящиеся к содержанию понятия.

Содержание же понятий - это совокупность свойств и отноше­ний (признаков) предметов, отражаемых в понятии.

Между понятиями возможны следующие отношения: « объемы понятий совпадают;
  • объемы понятий не имеют общих предметов;
  • объемы одного понятия входит в объем другого;
  • объемы понятий пересекаются.

Предлоги для, на, с, из выражают отношения вхождения понятия в более широкое. Ко второму понятию можно поставить вопрос: ка­кой? какая? Эти предлоги говорят о назначении предмета, из чего он состоит, вторым понятием управляет существительное, после него управляемое слово стоит в родительном или творительном падеже.

Примеры:

Автоматизация для взрывных сред; сирена для взрывоопасных условий; шланги для гидравлических систем; грохот с инерционным вибратором; разрезы с высоким пластовым давлением; рештаки из стеклопластиков; защита от однофазных замыканий; поплавковый вы­ключатель для шахтного водоотлива.

Во всех этих примерах предлоги выражают отношение подчине­ния второго понятия первому. Это можно изобразить знаком вхождения одного понятия в другое А € В, где А - грохот с инерционным вибрато­ром, а В - грохот.

Предлоги в, к, по, от выражают отношение между понятиями, ко­торые имеют общие элементы. Понятия с этими предлогами пересека­ются. Предлоги не выражают пространственные отношения, а также место совершения действия. Пространственные отношения требуют по­становки вопроса куда?, откуда?, место совершение действия - где?

Пространственные отношения выражают предлоги:

в, с - винительным падежом имени;

на, с - винительным падежом имени;

с - родительным падежом имени;

к, с - дательным падежом имени;

из, с - дательным падежом имени.

Место совершения действия выражают предлоги:

в - с предложным падежом имени (в городе);

из - с предложным падежом имени (на горе);

по - с дательным падежом имени.

Примеры:

Несчастные случаи в горной промышленности; соревнование по безопасности труда; выставка горного оборудования а Канаде; техника смазки в угольной промышленности; нагнетание воды в пласт; погруз­ка железной руды в движущиеся вагоны; механизация работ на шахтах Караганды.

Союз и связывает два понятия в одно новое. Например, охрана труда и техника безопасности; запыленность и силикоз в угольных шахтах; кибернетика и горное дело.

Известно, что над понятиями можно производить операции ал­гебры, логики. Операции сложения, умножения, отрицания выполня­ются по правилам. Например,

сложение по-правилу: 1 + 1 = 10; 1+0=1; 0+1 = 10; 0+0 = 0;

умножение по-правилу: 1х 1 = 1; 1x0 = 0x1 = 0; 0x0=0.

Если понятие А входит в понятие В, производится операция сложения, а если понятия пересекаются - операция умножения.

К предлогам для, на, с, из можно применять операцию сложения, к союзу и эту же операцию. К предлогам в, на, к, по, с, выражающим пространственные отношения, можно применять операцию умноже­ния. Операции алгебры, логики можно использовать только тогда, ко­гда известно, какие отношения выражают предлоги, союзы и другие служебные слова. Например, если попытаться поставить вопрос ка­кой? - будет целевое назначение или отрицание, если где? куда? отку­да? - связи пространственного направления.


^ ТЕХНОЛОГИЯ ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ИПС

Из информационного документа выписываются характеристики, которые отражают его предметное содержание. Такими характеристи­ками в большинстве случаев бывают имена существительные, прила­гательные и причастия. Выбор характеристик из документа произво­дится специалистом в области горного дела.

Другие части речи (местоимения, глаголы, предлоги, союзы и др.) из обрабатываемого документа не выписывают, хотя они и опре­деляют логическую связь слов и словосочетаний в предложения, но предметного содержания не раскрывают.

Имена существительные выписываются в форме именительного падежа единственного числа, имена прилагательные, причастия запи­сываются ниже соответствующих существительных в именительном падеже. Например, клеть зона

подъемная обогащения

Поясняющие характеристики не рекомендуется отрывать от их существительных.

Если в документе встречаются неделимые терминологические сочетания (т.е. сочетания, теряющие свое специальное терминологи­ческое значение при расчленении их на отдельные слова), то они вы­писываются целиком. Например, лен горный, мельница чилийская, за­кон Дерси, счетчик Гейгера-Мюллера, школа профессора Протодьяконова и т.д.

Встречающиеся в тексте названия бассейнов, марки комбайнов и наименования некоторых единиц измерения (а отдельных - и числовые значения: мощность пласта, угол падения пласта), выделяются как характеристики документа.

Кроме того, для каждого обрабатываемого документа указыва­ется его форма (статья, патент, обзор); характер публикации (научно-исследовательская работа, лабораторные, полупромышленные испытания, опыт, проект, теория, схема, методика); на каком языке напеча­тан оригинал текста и год его издания.

В качестве характеристики документа не учитываются встречающиеся в нем названия комбинатов, трестов, шахт, институтов, моделей машин и их деталей.

Из обрабатываемого документа выписывается не более 20 характеристик, причем каждая из них выписывается только один раз.

Характеристики записываются на карту характеристик.

Карта характеристик размером 125 х 170 мм разделена на четы­ре поля. В каждом поле производится соответствующая запись: в первом поле - слова или словосочетания, передающие содержание доку­мента, во втором - их эквиваленты в дескрипторном словаре, в треть­ем - их вышестоящие и связанные термины, в четвертом - эквиваленты вышестоящих и связанных терминов в дескрипторном словаре.

Характеристики записываются в столбцах в том порядке, как „ они встречаются в информационном документе.

Тип публикации, ее характер, язык и год издания отмечаются в конце карты после основных характеристик.

В левом верхнем углу карты проставляется инвентарный номер информационного документа.

Приводим образец карты характеристик для информационного документа: Передвижка изгибающихся конвейеров гидравлическими, домкратами ДТ-2. Савельев И.П., Гудырин ЮН., «Уголь Украины», . 1964, № 9, стр. 25-26.


06346

02632 машина 03301

02212 транспортная 07402

01613

01154

04520

10347 выработка 01040

03102 горная 01314

06225

07005
^ КАРТА ХАРАКТЕРИСТИК

2359
Передвижка

Конвейер
изгибающийся

Домкрат

гидравлический

переносный

Шахта

Лава

Русский

Статья

1964

Обработанная информация на перфокарте направляется на пер­форацию кодовых значений характеристик.

Технологическая схема обработки показана на схеме № 1.

На обработку поступает перфокарта, на которой нанесена элек­трографическим или другим методом реферативная информация.

Индексатор проводит инвентаризацию документа. Операция за­ключается в том, что в верхней левой части реферата ставится нарас­тающий порядковый номер документа.

В реферате подчеркиваются слова-характеристики, определяю­щие предметное содержание документа.

Подчеркивание характеристик производится специалистом в горном деле.

Затем из реферата выписываются подчеркнутые слова и слово­сочетания на карту характеристик, в верхней правой части карты ста­вится индекс УДК.


р- Рабочие массивы

Аппарат Вега
П ерфоратор П80-2


Сортировка С-80

Схема № 1

С помощью индикаторного словаря устанавливаются числовые значения характеристик.

В последней редакции индикаторного словаря большинство свя­занных и вышестоящих терминов перенесены к основным дескрипто­рам. В том случае, если дескриптор выражен словосочетанием и имеет связанный или вышестоящий термин, в индикаторном словаре сделана пометка плюс (+), что обязывает индексатора обратиться к дескрипторному словарю. Для облегчения работы базисные и вышестоящие термины в индикаторном словаре имеют индексы.

Следующей технологической операцией является пробивка ко­довых значений характеристик на перфокарте с применением перфо­ратора П80-2. Кодовые значения характеристик на панели перфорато­ра набираются в двоичной системе счисления, для чего оператор дела­ет постоянный перевод цифр, входящих в состав числового индекса, в восьмеричной системе счисления. Перфорация проводится в зоне с 9-й по 40-ю колонки.

На рабочей карте перфорируется в зонах все поисковые призна­ки, указанные на карте характеристик: индексы УДК и индексы выпи­санных слов. Более удобен в работе перфоратор КЭВЦМ М20, позво­ляющий сразу производить «запись» в двоичной системе счисления.

Отперфорированная карта направляется в хранилище перфокарт.

Карта характеристик сохраняется во временном архиве.