Зированной информационно-поисковой системы, предназначенной для информационного обслуживания инженерно-технических работников угольной промышленности Кузбасса
Вид материала | Документы |
СодержаниеИсследование роли предлогов и союзов для повышения качества индексирования Технология обработки информации для ипс Карта характеристик |
- Сборник научных трудов, 3225.32kb.
- Общественнополитическая жизнь Свердловской области в условиях курса на обновление, 182.51kb.
- Пособие к сниП 03. 11-85 по контролю состояния, 2191.02kb.
- Методические указания по курсовому проектированию для студентов специальности 210100, 395.17kb.
- Учебник для вузов, 4251.03kb.
- Региональная целевая программа Информатизация системы образования Ленинградской области, 1115.91kb.
- Разработка принципов создания информационно-поисковой интернет-системы в области наук, 328.8kb.
- Методический комплекс для студентов специальности 271200, 27124. 00 всех форм обучения, 1207.22kb.
- «Анализ pr деятельности интернет ресурсов на примере Информационно поисковой Системы, 583.54kb.
- Конспект лекций кемерово 2003 удк: 637. 992, 1167.63kb.
^ ИССЛЕДОВАНИЕ РОЛИ ПРЕДЛОГОВ И СОЮЗОВ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ИНДЕКСИРОВАНИЯ
Предлоги и союзы как форма связи 2-х понятий играют существенную роль при индексировании документов дескрипторами. Связи эти могут иметь различный качественный характер:
• связи целевого назначения;
• причинно-следственные связи;
• видо-родовые связи;
• атрибутивные;
пространственно-позиционные;
• пространственно-направленные;
• пространственно-исходные;
- связи способа и орудия;
- связи субстанциональных отношений;
- связи отрицания;
- отношения субституции (замещения);
- формально-грамматические связи.
Одни и те же предлоги или союзы могут иметь различный характер в зависимости от их дистрибуции (или контекста).
Возможные связи предлогов и союзов представлены в следующей таблице:
Виды значений служебных слов
Предлоги, союзы и др. служебные слова | Кол-во значений | Виды значений |
Без | 1 | Связь отрицания |
В | 2 | Связь пространственного направления; Связь пространственно позиционная |
Внутри | 1 | Связь пространственно позиционная |
Вид | 1 | Видо-родовая связь |
В качестве | 1 | Видо-родовая связь |
Возникающие при | 1 | Причинно-следственная связь |
В результате | 1 | Причинно-следственная связь |
В следствие | 1 | Причинно-следственная связь |
Для | 1 | Связь целевого назначения |
И | 2 | Связь объединения; Формально-грамматическая связь |
К | 2 | Связь целевого назначения; Связь пространственного направления |
Как | 1 | |
Как вид | 1 | Видо-родовая связь |
Как причина | 1 | Причинно-следственная связь |
Из | 3 | Субстанциональных отношений; Связь пространственно-исходная; Связь отрицания |
На | 5 | Связь целевого назначения; Атрибутивная связь; Связь способа и орудия; Пространственно-позиционная связь; Связь пространственного направления |
На основе | 1 | Связь субстанционных отношений |
По | 2 | Пространственно-позиционная; Связь целевого направления |
От | 3 | Причинно-следственная; Связь отрицания; Пространственно-исходная связь |
Причина | 1 | Причинно-следственная связь |
Против | 1 | Связь отрицания |
Путем | 1 | Связь способа и орудия |
Работающие на | 1 | Связь способа и орудия |
С | 4 | Атрибутивная связь; Пространственно-исходная связь; Связь отрицания; Связь объединения |
С помощью | 1 | Связь способа и орудия |
С применением | 1 | Связь способа и орудия |
Её (всё) | 1 | Отношения замещения (субституции) |
Предлоги, союзы и др. служебные слова | Частота |
В | 358 |
На | 355 |
И | 333 |
Для | 227 |
С | 123 |
По | 89 |
К | 79 |
Из | 34 |
Их | 22 |
От | 24 |
С применением | 17 |
Предлоги, союзы и др. служебные слова | Частота |
его | 12 |
с помощью | 26 |
как, её | 8 |
без | 4 |
в качестве | 4 |
на основе | 4 |
работающие на | 4 |
или | 3 |
внутри | 1 л. |
при | |
0 | 74 |
В результате анализа по частоте встречаемости в рефератах по горному делу выявлены следующие предлоги с их видами связей:
Предлоги | Связи | Частота |
В | пространственно-позиционная пространственно-направленная | 337 21 |
| атрибутивная | 84 |
С | объединения | 18 |
| отрицания | 18 |
| пространственно-исходная | 3 |
И | объединения | 180 |
| формально-грамматическая | 151 |
| причинно-следственная | 11 |
От | отрицания | 9 |
| пространственно-исходная | 4 |
К | целевого назначения | 9 |
| пространственного направления | 8 |
| целевого назначения | 16 |
По | атрибутивная пространственно-позиционная | 60 13 |
Из | субстанциональная | 19 |
| пространственно-исходная | 15 |
| целевого назначения атрибутивная | 58 63 |
На | связь способа и орудия пространственно-позиционная пространственного направления | 101 120 13 |
Как показали наблюдения над частотой предлогов, в документах (рефератах) по горному делу наибольшую частоту имеют простые предлоги в, на, для, с, к, по, из, от. Причем основной массе предлогов свойственно выражать, прежде всего, пространственные и временные отношения.
В то же время, являясь служебными, предлоги служат для выражения различных отношений между понятиями. Отношения между предметами могут рассматриваться со стороны объема понятий.
Объем понятий - это множество предметов, каждому из которых принадлежат признаки, относящиеся к содержанию понятия.
Содержание же понятий - это совокупность свойств и отношений (признаков) предметов, отражаемых в понятии.
Между понятиями возможны следующие отношения: « объемы понятий совпадают;
- объемы понятий не имеют общих предметов;
- объемы одного понятия входит в объем другого;
- объемы понятий пересекаются.
Предлоги для, на, с, из выражают отношения вхождения понятия в более широкое. Ко второму понятию можно поставить вопрос: какой? какая? Эти предлоги говорят о назначении предмета, из чего он состоит, вторым понятием управляет существительное, после него управляемое слово стоит в родительном или творительном падеже.
Примеры:
Автоматизация для взрывных сред; сирена для взрывоопасных условий; шланги для гидравлических систем; грохот с инерционным вибратором; разрезы с высоким пластовым давлением; рештаки из стеклопластиков; защита от однофазных замыканий; поплавковый выключатель для шахтного водоотлива.
Во всех этих примерах предлоги выражают отношение подчинения второго понятия первому. Это можно изобразить знаком вхождения одного понятия в другое А € В, где А - грохот с инерционным вибратором, а В - грохот.
Предлоги в, к, по, от выражают отношение между понятиями, которые имеют общие элементы. Понятия с этими предлогами пересекаются. Предлоги не выражают пространственные отношения, а также место совершения действия. Пространственные отношения требуют постановки вопроса куда?, откуда?, место совершение действия - где?
Пространственные отношения выражают предлоги:
в, с - винительным падежом имени;
на, с - винительным падежом имени;
с - родительным падежом имени;
к, с - дательным падежом имени;
из, с - дательным падежом имени.
Место совершения действия выражают предлоги:
в - с предложным падежом имени (в городе);
из - с предложным падежом имени (на горе);
по - с дательным падежом имени.
Примеры:
Несчастные случаи в горной промышленности; соревнование по безопасности труда; выставка горного оборудования а Канаде; техника смазки в угольной промышленности; нагнетание воды в пласт; погрузка железной руды в движущиеся вагоны; механизация работ на шахтах Караганды.
Союз и связывает два понятия в одно новое. Например, охрана труда и техника безопасности; запыленность и силикоз в угольных шахтах; кибернетика и горное дело.
Известно, что над понятиями можно производить операции алгебры, логики. Операции сложения, умножения, отрицания выполняются по правилам. Например,
сложение по-правилу: 1 + 1 = 10; 1+0=1; 0+1 = 10; 0+0 = 0;
умножение по-правилу: 1х 1 = 1; 1x0 = 0x1 = 0; 0x0=0.
Если понятие А входит в понятие В, производится операция сложения, а если понятия пересекаются - операция умножения.
К предлогам для, на, с, из можно применять операцию сложения, к союзу и эту же операцию. К предлогам в, на, к, по, с, выражающим пространственные отношения, можно применять операцию умножения. Операции алгебры, логики можно использовать только тогда, когда известно, какие отношения выражают предлоги, союзы и другие служебные слова. Например, если попытаться поставить вопрос какой? - будет целевое назначение или отрицание, если где? куда? откуда? - связи пространственного направления.
^ ТЕХНОЛОГИЯ ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ИПС
Из информационного документа выписываются характеристики, которые отражают его предметное содержание. Такими характеристиками в большинстве случаев бывают имена существительные, прилагательные и причастия. Выбор характеристик из документа производится специалистом в области горного дела.
Другие части речи (местоимения, глаголы, предлоги, союзы и др.) из обрабатываемого документа не выписывают, хотя они и определяют логическую связь слов и словосочетаний в предложения, но предметного содержания не раскрывают.
Имена существительные выписываются в форме именительного падежа единственного числа, имена прилагательные, причастия записываются ниже соответствующих существительных в именительном падеже. Например, клеть зона
подъемная обогащения
Поясняющие характеристики не рекомендуется отрывать от их существительных.
Если в документе встречаются неделимые терминологические сочетания (т.е. сочетания, теряющие свое специальное терминологическое значение при расчленении их на отдельные слова), то они выписываются целиком. Например, лен горный, мельница чилийская, закон Дерси, счетчик Гейгера-Мюллера, школа профессора Протодьяконова и т.д.
Встречающиеся в тексте названия бассейнов, марки комбайнов и наименования некоторых единиц измерения (а отдельных - и числовые значения: мощность пласта, угол падения пласта), выделяются как характеристики документа.
Кроме того, для каждого обрабатываемого документа указывается его форма (статья, патент, обзор); характер публикации (научно-исследовательская работа, лабораторные, полупромышленные испытания, опыт, проект, теория, схема, методика); на каком языке напечатан оригинал текста и год его издания.
В качестве характеристики документа не учитываются встречающиеся в нем названия комбинатов, трестов, шахт, институтов, моделей машин и их деталей.
Из обрабатываемого документа выписывается не более 20 характеристик, причем каждая из них выписывается только один раз.
Характеристики записываются на карту характеристик.
Карта характеристик размером 125 х 170 мм разделена на четыре поля. В каждом поле производится соответствующая запись: в первом поле - слова или словосочетания, передающие содержание документа, во втором - их эквиваленты в дескрипторном словаре, в третьем - их вышестоящие и связанные термины, в четвертом - эквиваленты вышестоящих и связанных терминов в дескрипторном словаре.
Характеристики записываются в столбцах в том порядке, как „ они встречаются в информационном документе.
Тип публикации, ее характер, язык и год издания отмечаются в конце карты после основных характеристик.
В левом верхнем углу карты проставляется инвентарный номер информационного документа.
Приводим образец карты характеристик для информационного документа: Передвижка изгибающихся конвейеров гидравлическими, домкратами ДТ-2. Савельев И.П., Гудырин ЮН., «Уголь Украины», . 1964, № 9, стр. 25-26.
06346
02632 машина 03301
02212 транспортная 07402
01613
01154
04520
10347 выработка 01040
03102 горная 01314
06225
07005
^ КАРТА ХАРАКТЕРИСТИК
2359
Передвижка
Конвейер
изгибающийся
Домкрат
гидравлический
переносный
Шахта
Лава
Русский
Статья
1964
Обработанная информация на перфокарте направляется на перфорацию кодовых значений характеристик.
Технологическая схема обработки показана на схеме № 1.
На обработку поступает перфокарта, на которой нанесена электрографическим или другим методом реферативная информация.
Индексатор проводит инвентаризацию документа. Операция заключается в том, что в верхней левой части реферата ставится нарастающий порядковый номер документа.
В реферате подчеркиваются слова-характеристики, определяющие предметное содержание документа.
Подчеркивание характеристик производится специалистом в горном деле.
Затем из реферата выписываются подчеркнутые слова и словосочетания на карту характеристик, в верхней правой части карты ставится индекс УДК.
р- Рабочие массивы
Аппарат Вега
П ерфоратор П80-2
Сортировка С-80
Схема № 1
С помощью индикаторного словаря устанавливаются числовые значения характеристик.
В последней редакции индикаторного словаря большинство связанных и вышестоящих терминов перенесены к основным дескрипторам. В том случае, если дескриптор выражен словосочетанием и имеет связанный или вышестоящий термин, в индикаторном словаре сделана пометка плюс (+), что обязывает индексатора обратиться к дескрипторному словарю. Для облегчения работы базисные и вышестоящие термины в индикаторном словаре имеют индексы.
Следующей технологической операцией является пробивка кодовых значений характеристик на перфокарте с применением перфоратора П80-2. Кодовые значения характеристик на панели перфоратора набираются в двоичной системе счисления, для чего оператор делает постоянный перевод цифр, входящих в состав числового индекса, в восьмеричной системе счисления. Перфорация проводится в зоне с 9-й по 40-ю колонки.
На рабочей карте перфорируется в зонах все поисковые признаки, указанные на карте характеристик: индексы УДК и индексы выписанных слов. Более удобен в работе перфоратор КЭВЦМ М20, позволяющий сразу производить «запись» в двоичной системе счисления.
Отперфорированная карта направляется в хранилище перфокарт.
Карта характеристик сохраняется во временном архиве.