Исследование информационных потребностей

Вид материалаИсследование

Содержание


Координатного индексирования информационных документов по горному делу для ввода в ипс "квантор"
Типы издания
Научные издания
Справочные издания
Учебные издания
Опыт (научный эксперимент)
Опыт работы (производственный)
Временная инструкция по составлению карт профильных интересов потребили
Описание карты
Составление карты
Подобный материал:
1   2   3   4
и, где

- количество слов поискового предписания;

- количество слов поискового предписания, которые должны иметься в поисковом образе, чтобы этот документ считался отвечающим на запрос. Количество импликант в такой функции равно:



Используя эти условия, для каждого поискового предписания выбирают свой критерий смыслового соответствия (КСС). КСС выбирают так: из слов ПП составляют все возможные смысловые комбинации, при совпадении каждой из которых с поисковым образом документа нужно считать, что документ, соответствующий этому поисковому об­разу, отвечает на запрос.

Составим из слов поискового предписания все те комбинации, при которых должна отсортироваться без потерь необходимая инфор­мация (отвечающая на запрос). Таких логических комбинаций будет всего одна - АВСДЕ,

£ = АВСДЕ

Из пяти слов ПП мокко составить всего одну комбинацию по 5, т.е. избыточных комбинаций нет.

Поиск по этому запросу проводят в режиме "Сортирование по количеству совпавших слов". Смотреть искомые документы нудно б пятой кармане сортировки.

Пример 2.

"Вентиляция и водоснабжение в животноводстве".

Составим поисковое предписание


А Вентиляция 00672

В Водоснабжение 01052

С Животноводство 15770

Д Коровник I64I4

E Свинарник 20050

F Телятник 20365

G Свиноферма 20056


Перечисляют все те смысловые комбинации, которые обеспечиваю! полноту выдачи информации машиной.

Эти комбинации определяют булевой функцией - £ = (А+В) х (С+Д+E+F+G). Если перемножить скобки, то получим 10 смысловых комбинаций, из 7 слов по 2 слова, а всего возможное количество комбинаций из 8 по 2 определяют по формуле числа сочетаний




где

=7,= 2, С = 21.

Информацию по этому запросу в режиме "Сортирование по коли­честву совпавших слов" мы искать не можем, т.к. возможно появление шумовых документов, определяющихся одиннадцатью (21-10) избыточ­ными комбинациями. Это такие комбинации, которые не входят в функ­цию, как АВ, GH и т.д. и поэтому поиск по этой теме нужно произ­водить в 3 режиме ("Сортирование по произвольным функциям").

ров",

Пример 3.


"Борьба с пылью при работе экскаваторов и проветривание карьеров"




А

Борьба

00556

В

Пыль

06224

С

Обеспыливание

06220

Д

Пылеподавление

60176

E

Орошение

04652

Т

Проветривание

00672

G

Карьер

37741

H

Экскаватор

55107


Все необходимые нам смысловые комбинации определят функцией:

£ = (АВ+С+Д+E) H+FG

Всего удовлетворяющих нас в 5 логических комбинациях одна содержит 3 слова - АВН и 4 содержат по 2 слова - СН, ДН, ЕН,FG. Если вести поиск по этой теме в первом режиме, то необходимую нам информацию нужно смотреть в третьем и во втором карманах. Но в них из-за большого количества избыточных комбинаций будет очень много шумовых документов. Поэтому оптимальным режимом будет

третий.

При наличии родственных тем их объединяют в группы по 3 темы в каждой (для ИПМ "Квантор-8") для осуществления трехпрограммного поиска.


Пример 4.

  1. "Проведение полевых штреков".
  2. "Проведение откаточных штреков".
  3. "Проведение основных штреков с присечкой породы".


А Проведение 60237

В Полевой 17406

С Штрек II047

Д Откаточный 57512

Е Основной I2I57

F Присечка 12655

G Порода I223I


В этом случае составляют общее поисковое предписание, а функцию составляют для каждой темы отдельно.

F1 =АВС

F2 = АСД

F3= ACEFG

Из приведенных примеров можно сделать вывод: оптимальный режим поиска выбирают путем анализа поискового предписания, т.е. составления всех смысловых комбинаций из слов ПП, обеспечивающих максимальную полноту выдачи информации при минимальном шуме.

Режим "Сортирование по количеству совпавших слов" берут в тем случае, если:
  1. Все комбинации содержат одинаковое количество слов;
  2. С0 = Сn, где C0 - возможное количество комбинаций с учетом вхождения в каждую комбинацию приобретенных слов (если та­ковые имеются);

Сn - количество полезных комбинаций.

В остальных случаях пользуются режимом "Сортирование по произвольным функциям".


ПРАВИЛА

КООРДИНАТНОГО ИНДЕКСИРОВАНИЯ ИНФОРМАЦИОННЫХ ДОКУМЕНТОВ ПО ГОРНОМУ ДЕЛУ ДЛЯ ВВОДА В ИПС "КВАНТОР"

В информационно-поисковую систему "Квантор" вводят вторич­ные документы из следующих информационных источников:

1. Реферативные журналы "Горное дело" и "Горные машины",изд. ВИНИТИ.

2. Сборник рефератов НИР (научно-исследовательских работ), изд. ВНТИЦ, сер. 07 и 08.

3. Сборник рефератов НИР и ОКР, изд. ВИМИ.

4. Картотека "Местный опыт", изд. ЦНТИ Объединения и УССР.

5. Информационные листки и плакаты, изд. ЦНТИ Объединения и УССР.

6. Реферативная информация на картах, изд. Центральных отраслевых и республиканских институтов информации (ЦНИЭИуголь, Черметинформация, Цветметинформация).

Документы, вводимые в ИПС, подвергают профессиональному от­бору и индексированию.

I. Отбор документов

Отбору подлежат документы, соответствующие следующим тема­тическим направлениям:

1. Организация и экономика горных предприятий, нефтяных и газовых промыслов (кроме морских).

2. Проектирование, строительство и реконструкция горных предприятий.

3. Шахтная геология.

4. Маркшейдерское дело.

5. Разработка твердых полезных ископаемых: уголь, руда, не­рудные, торф, сланец подземным и открытым способами (добычные машины и механизмы, системы разработки, рудничное крепление и управление горным давлением, буровзрывные работы).

6. Разработка нефтяных и газовых месторождений, кроме моро­кой.

7. Сооружение и ремонт подземных выработок.

8. Рудничный водоотлив. Осушение. Водное хозяйство на горных предприятиях.

9. Подземный и карьерный транспорт.

10. Комплексная механизация и автоматизация. Сигнализация. Связь.

11. Ремонт оборудования, борьба с коррозией. Надежность оборудования.

12. Энергоснабжение. Освещение.

13. Проветривание горных выработок.

14. Техника безопасности (охрана труда, подземные пожары, рудничные газы, рудничная пыль, горноспасательное дело).

15. Обогащение полезных ископаемых. Брикетирование.


II. Индексирование. Основные правила индексирования

Выражение основного содержания документов при помощи клю­чевых слов - характеристик, которые явно или в скрытом виде со­держатся в тексте, называется индексированием.

Индексирование документа производят путей выбора (подчер­кивания) из него наиболее существенных ключевых слов (характе­ристик), передающих основной смысл документа, т.е. его пред­метное содержание.

Ключевые слова выделяют из заглавия документа, а также из всего текста, если это требуется для полного отражения содер­жания. Причем ключевое слово, встречающееся по тексту докумен­та несколько раз, подчеркивают один раз.

Практика показала, что ключевые слова, определяющие основ­ное содержание документа, находятся в его заглавии, в первой фразе, если она не начинается со слова отмечается, а также в последующих фразах, которые содержат глаголы, указанные в при­ложении II.

К ключевым словам относятся имена существительные, прилагательные, причастия и числительные, несущие основную смысловую нагрузку. Другие части речи (местоимения, глаголы, деепричастия, наречия, предлоги и союзы) не подчеркивают, т.к. они обычно не отражают его предметного содержания, хотя и определяют логичес­кую связь слов и словосочетаний в предложении. В качестве характеристик документов подчеркивают названия бассейнов, марки горных комбайнов, комплексов и др. механизмов, а также следующие параметры, выраженные количественными числи­тельными:


мощность пласта

(един.измер.)





угол падения пласта

-II-


градус


производительность шахты, разреза


-II-


т/время


производительность выемочного комбайна, комплекса, машины

-II-


т/время


производительность экскаватора

-II-


т,м3/время


скорость проведения выработок

-II-


м/время

дебит нефтяной скважины

-II-


м3/время

сечение выработок

-II-


м2


Временно (до разработки специальной программы по автомати­ческому кодированию количественных характеристик) индексатор производит перевод чисел из десятичной системы счисления в вось­меричную (приложение I0) и переведенное значение записывает на обороте документа. Если количественные характеристики в тексте документа имеют значение в пределах (знак " + "), то кроме чис­ловых характеристик, на обороте документа записывают слово "интервал".

Числовую характеристику записывают на перфокарте с помощью перфоратора во время контроля массива. Одновременно с записью числовой характеристики производят пробивку в 9-й (для харак­теристик поля № I) и 25-й (для характеристик поля № 2) колон­ках в позиции, соответствующей положению числовой характерис­тики.

Ключевые слова, выделенные в результате индексирования и поставленные в однозначное соответствие данному документу, составляют поисковый образ документа (ПОД).

Поисковый образ документа пополняют отсутствующими в нем характеристиками, необходимыми для раскрытия предметного содер­жания, если недостаточно выделенных характеристик по тексту.

Затем подчеркнутые и дописанные предметные характеристики индексатор по дескрипторному словарю дополняет связанными и выше­стоящими характеристиками. (Эта ручная технологическая операция после разработки специальной программы автоматического кодирова­ния будет выполняться машиной).

При подчеркивании ключевых слов учитывают следующие два положения:

1. Во время отработки программы автоматического кодирования подчеркнутые и введенные характеристики должны иметь свой экви­валент в индикаторном словаре. При отсутствии его в индикатор­ном словаре по горному делу необходимо проверить наличие этого слова в других отраслевых словарях. Если выделенного слова не окажется ни в одном из словарей, его выписывают на отдельную карточку для приятия решения о включении этого слова в дескрипторный словарь при его пополнении и усовершенствовании.

2. После отработки программы автоматического кодирования подчеркивают все те характеристики, которые индексатор считает необходимыми для раскрытия предметного содержания документа.

Слова, выведенные на печать как отсутствующие в индикатор­ном словаре, подвергают анализу на предмет ввода их в дескрипторный и индикаторный словари.

Исходя из емкости перфокарты, количество подчеркнутых и введенных характеристик не должно превышать 24 (вместе с аспек­тами).


Ш. Основные операции, производимые индексатором

1. Подчеркивание в заглавии документа и по тексту ключевых слов (существительные, прилагательные, причастия и числительные).

2. Марки подчеркивают вместе с основным словом. Например, комплекс ОМКТ, машина ПМЛ.

3. Замена ключевых слов синонимичными при отсутствии экви­валента в индикаторном словаре.

Например: отвесный заменяется вертикальным, подсобный - вспомогательным, воспламеняющийся - горючим и т.д.

4. Замена ключевых слов при отсутствии эквивалента в инди­каторном словаре выше стоячими или связанными дескрипторами.

Например: пневматический осланцеватель - ключевое слово осланцеватель отсутствует в словаре, поэтому его заменяют вышестоящим дескриптором установка и дескриптором, стоящим в связи - осланце­вание; или ключевое слово стеклохолст заменяют вышестоящим стек­лоткань.

5. Пополнение поискового образа документа недостающими или скрытыми, неясно выраженными характеристиками.

Например: прибор ШИ-3 - пополняют характеристиками (скры­тыми в марке) шахтный интерферометр»

6. Замена ключевого слова, выраженного существительным, не имеющего эквивалента в словаре, однокоренным прилагательным и наоборот.

Например: в документе "Двойные пружины для подвески гро­хота"- ключевое слово пружина не имеет эквивалента в словаре, по­этому его заменяют характеристикой пружинный.

7. Разделение и замена сложного слова, не имеющего эквива­лента в словаре» на составные части, имеющие один и тот же (первоначальный) смысл.

Например: штабелеукладчик заменяют на штабель и укладку.

8. Разделение сложных слов, не имеющих эквивалента в словаре, разделяющим знаком () на простые слова, если первая часть сложного слова выражена прилагательным.

Например: сложное слово сейсмобезопасный разделяют знаком на слова сейсмический и безопасный.

Если первая часть сложного слова выражена существительным, то его разделяют вертикальной чертой (/).

Например: трещин/образование разделяют на два слова трещина и образование.

9. Разделение сложного слова, соединенного дефисом и не имеющего эквивалента в словаре, на две составные части.

Например: штрек-коллектор разделяют на штрек и коллектор (штрек-/коллектор).

Если же сложное слово, соединенное дефисом, имеет эквивалент в словаре, то его подчеркивают одной чертой. Например: капсюль-детонатор.

10. Отделение части олова (приставка, суффикс, окончание), если смысл слова не меняется, при отсутствии эквивалента в словаре для полного слова.

Например: ключевое слово переоценка отсутствует в словаре, поэтому отделяют приставку пере и подчеркивают оценка (переоценка); ключевого слова ремонтный нет в словаре, поэтому в нем отделяют суффикс "н" и окончание "ый", подчеркивают ремонт (ремонтный).

11. Перевод числовых характеристик мощности и угла падения пласта в словесные.

Например: в документе мощность и угол падения пласта выра­жены в числах: мощность пласта 1,35 – 1,6 м, угол падения 4-6°, подчеркивают характеристики мощность, падение и дописывает на обороте характеристики средний и пологий.


Примечание: углы падения пласта, рудной залежи

от 0° до 25° - пологий

от 25° до 45° - наклонный

от 45° до 90° - крутой


мощность пласта; мощность рудной залежи

до 1,3 м тонкий - до 2 м

от 1,3 м до 3,5 м средний - от 2 до 5 м
свыше 3,5 м мощный - свыше 5 м.


12. Перевод в словесные характеристики химических элементов и соединений, выраженных формулами.

Например: СН4 переводят в метан, Ре - железо, СО -- угарный газ и т.д.

13. Если в документе приставки против, без выражают смысл отрицания, то их трансформируют в слова, имеющие тот же самый смысл.

Например, в документе "Разработанная конструкция комбайна позволяет вести выемку угля без ниш " или ... "без постоянного присутствия людей" - ключевое слово без ниш трансформируют в безнишевый, без людей - безлюдный.

14. Производят отметку знаком "х" тех ключевых слов, кото­рые имеют признак омонимии, для правильной записи их на перфоленту, т.к. они имеют двоякий смысл и соответствующие им цифры.

Отмечают следующие слова, имеющие омонимы:

Амортизациях (экономическая)

Аппаратх (управленческий)

Бассейнх (угольный)

Воронках (взрывная)

Выходх (показатель)

Горючеех (топливо)

Емкостьх (электрическая)

Криваях (график)

Кромках (режущая)

Котельнаях (здание)

Ламповаях (помещение)

Лентах (мерная)

Линиях (очистная)

Направляющиех (как сущ.)

Организациях (учреждение)

Отбросых (отходы)

Отделениех (организация)

Откосх (наклон)

Простоих (потеря рабочего времени)

Охладительх (аппарат)

Рабочийх (горнорабочий)

Разработках (исследование)

Разрядх (электрический)

Расходх (процесс)

Расчетх (хозяйственный)

Системах (разработка)

Смазках (материал)

Соединениех (химическое)

Сооружениех (процесс)

Составх (подвижной)

Составх (структура)

Стабилизаторх (прибор)

Щельх (трещина)

Указательх (библиографический)

Установках (процесс).


Эти слова отмечают знаком "х", если они выражают смысл, ука­занный в скобках.

15. Слова-омонимы, имеющие пояснение в скобках в индикатор­ном словаре, но не имеющие омонимичных слов, при индексировании подчеркивают в документе лишь в том случае, если смысл их соот­ветствует пояснению в скобках.

Например, ключевое слово "атмосфера" подчеркивают в докумен­тах только в том случае, если говорится об "атмосфере" как "сре­де". Как единицу измерения ключевое слово "атмосфера" не берут, этот дескриптор в индикаторном словаре имеет эквивалент "атмосфера" (среда).

Такие слова-омонимы, имеющие место в индикаторном словаре, индексатору необходимо помнить.

Атмосфера (среда)

Нагрузка (усилие)

Перегрузка (процесс)

Переход (проход)

Ряд (крепь)

Стабилизация (регулирование)

Устройство (приспособление)

Часть (горноспасательная).

16. Производят расшифровку сокращений, которые тоже являют­ся характеристиками, но не имеют эквивалента в словаре. Эти сок­ращения не подчеркивают, а расписывают на обороте документа.

Например, БВР - записывают как буровзрывные работы. ПАВ - поверхностно-активные вещества.

Примечание: сокращения, имеющие эквивалент в словаре, только подчеркивают, но не расшифровывают. Например: ГДР, АСПУ.


IV. Определение аспектов


Для полного описания документа индексатор определяет харак­тер публикации (тип издания) и точку зрения, которые записывает на обороте документа в виде сокращений или подчеркивает в доку­менте по тексту. Остальные аспекты (вид изданий, год и язык) определяет телетайпист (техник).

Типы издания определяют характером изложения и научным уров­нем изложения, определяющим читательское назначение. Резких кри­териев между различными типами изданий не существует.

Научные издания - информация, создаваемая в ходе научного процесса. Этот тип присваивают научно-исследовательским работам (имеющим прикладное значение):

- диссертациям

- монографиям.
может присваиваться

- описаниям к авторским свидетельствам и патентам

- статьям

- книгам

- информационным листкам

- картам "Местный опыт"

- сборникам.

производственные издания - информация, создаваемая в облас­ти производства (по обмену опытом работы, по техническим усовер­шенствованиям) и т.п. Этот тип присваивают:

- картам "Местный опыт"

- информационным листкам

- промышленным каталогам

- ГОСТам (стандартам)

может присваиваться:

- техническим условиям

- статьям, освещающим производственные достижения и эксплуатацию.

Справочные издания - произведения печати, содержащие обоб­щенные сведения и предназначенные для использования в качестве справочного пособия.

Этот тип присваивают справочникам: тематическим (о материа­лах, оборудовании и продукции), нормативным и рецептурным.

Учебные издания присваивают учебникам и учебным пособиям

Точка зрения - это такой признак (аспект), который харак­теризует состояние и стадию развития описываемого предмета.


На определение точки зрения также влияет уровень и характер изложения материала.

Точку зрения определяют при смысловом чтении документа в зависимости от его содержания.

Если это научная литература, то она носит теоретический и экспериментальный характер (теория, эксперимент - научный опыт).

Если это производственная литература, то освещает производ­ственные достижения, рационализацию, эксплуатацию и т.д.

Теория - это расчеты, методики, проекты, оценки технологи­ческих процессов, надежности, прочности и пр.1, математическое моделирование технологических процессов, рекомендуемые электри­ческие и технологические схемы, способы и системы, предлагаемые мероприятия, меры в рекомендации по совершенствованию процессов, анализ практического опыта.

Опыт (научный эксперимент) - научные наблюдения, изучения и исследования на лабораторных моделях из эквивалентных материа­лов (моделирование) и в производственных условиях, лабораторные и промышленные испытания опытных образцов разработанных конструк­ций, технологических схем, способов, систем.

Опыт работы (производственный) - производственный опыт ра­боты предприятия, скоростной и передовой методы труда предприя­тий, бригад, цехов.

Эксплуатация - использование машин и механизмов, крепей и сооружений, технологических систем, способов и автоматических систем управления, применение (использование) химических веществ и материалов.

Конструкция - описание устройства машин, механизмов, установок, сооружений, крепи, приборов, инструментов и т. д.
Рационализация - рациональное совершенствование машин и механизмов, технологических процессов, давшее экономический эффект, а также реконструкция и модернизация.

Экономика - управление производством, научная организации труда, планирование, нормирование труда, себестоимость производ­ства, основные фонды, заработная плата, формы материального поощрения, финансирование, производительность труда, технико-экономические показатели, технико-экономический анализ производства, оценка и расчеты эффективности внедрения новой техники и технологии, кадры, опыт работы предприятия в условиях экономичес­кой реформы.

Информационные документы могут иметь несколько точек зрения, когда в одном документе одновременно освещаются научный экспери­мент, теоретические выводы, рекомендации и производственные дос­тижения, полученные в результате внедрения разработанных рекомен­даций.

В информационно-поисковой системе "Квантор" заиндексированные документы инвентаризуют, путем проставления номера и компо­нуют в пачки по 50 шт. (22I5I-22200).

Инвентарные номера проставляют черными чернилами для снятия копии, а подчеркивают синим, чтобы избежать проявлений при сня­тии копии.

Обработанные индексатором документы записывают на перфоленте с помощью телеграфного аппарата СТ-35 во втором международном коде М-2.


ВРЕМЕННАЯ ИНСТРУКЦИЯ ПО СОСТАВЛЕНИЮ КАРТ ПРОФИЛЬНЫХ ИНТЕРЕСОВ ПОТРЕБИЛИ


Назначение карты


Карта отражает адресные данные и тематический профиль пот­ребителя, находящегося на информационном обслуживании.

Карта является неотъемлемой частью всех информационно-поис­ковых систем, предназначенных для обслуживания специалистов. Такими системами могут быть: система избирательного распростра­нения информации (ИРИ), прячем она может быть как с механизиро­ванным поиском (система "Квантор"), так и с традиционным ручным, и система "запрос-ответ". Наибольшее число карт профильных ин­тересов составляют в конце года (в декабре), т.к. к этому време­ни собирается основная масса запросов от потребителей.

Карты составляют на основе изучения запросов предприятий на тематические подборки, библиографические оправки, эпизодические запросы, а также те запросы, которые потребитель формулирует с помощью "Каталогов тем ..." (система ИРИ). Эти запросы относятся к конкретной форме проявления информационной потребности.

Карты можно составлять и на тематические планы исследований, на проектные разработки, планы внедрения новой техники и передо­вой технологии, а также на перечни "узких мест" предприятий. В таком случае карта профильных интересов будет отражать потен­циальную информационную потребность предприятия.

Поскольку потребитель информации может заявить не одну, а несколько тем, то карты профильных интересов составляют по ко­личеству заявленных тем. Если одну и ту же тему заявили два или более потребителя, то карт профильных интересов заполняют столько, сколько потребителей заявили эту тему. Таким образом, количество карт профильных интересов равняется числу тем-запро­сов в системе. Эта же мысль формулой выразится так:

к = 31+32+33+…...3n

где:

К - количество карт профильных интересов в системе;

31- количество запросов 1-го потребителя;

32- количество запросов 2-го потребителя;

Зn - количество запросов n-го потребителя.

Согласно "Типовому положению о лаборатории (на правах отде­ла) механизированного поиска" разработку карт профильных интере­сов проводят инженеры межотраслевой научно-технической информации по промышленности и сельскому хозяйству и инженеры справочно-информационного отдела.

Порядок составления карт для различных систем (ИРИ и система "запрос-ответ") остается одинаковым. Описание карты

Карта изготовлена из плотной бумаги и имеет размер по гори­зонтали 200 мм, по вертикали 280 им.

На карте приведены следующие признаки, относящиеся к адрес­ным данным потребителя и его тематическому профилю, причем приз­наки перечислены в таком порядке, как они следуют на карте, сверху вниз: предприятие (организация), ф.и.о., должность, телефон, шифр, темы, название темы, поисковое предписание - дескрипторы (А, В, С, Д, E, F ,G, Н, I, J, К, L, М) и УДК; ограничения - вид изданий, тип изданий, точка зрения, год изданий, язык публикаций, стратегия поиска - I, II, Ш, IV (нужное округлить).

Для заполнения данных по каждому признаку на карте отведено место. Оборотная сторона карты - чистая (см. приложение 4).

Текст на бумагу наносят с помощью ротапринта. Тиражность карт соответствует числу тем-запросов в системе.

Составление карты

Карту заполняет инженер-куратор на основе полученных заявок от специалистов на информационное обслуживание (образец заявки в системе ИРИ дан в приложении 3).

Фамилию, имя и отчество рекомендуется записывать карандашом, т.к. потребитель в течение года может смениться (например, уволь­нение специалиста с данной должности), а вновь пришедший специалист, возможно, пожелает получать информацию того же тематического направления. Исследования показали, что сфера занятости и долж­ностное положение потребителя информации являются решающим при выборе ими тематических направлений информации.

В следующих позициях карты заполняют соответственно назва­нию предприятия (или организации), па котором работает потребитель-заказчик, его занимаемая должность и рабочий телефон. Эти данные также берут из заявок.

Название темы пишут на естественном языке, причем оно может быть сформулировано как самим потребителей (в системе "запрос-ответ"), так и может соответствовать формулировке темы в каталоге (в системе ИРИ). Каждую заказанную тему в системе нумеруют и этот номер проставляют в графе "шифр темы".

Далее по карте заполняют данные по стратегии поиска.

Разработать стратегию поиска - это значит выделить из зап­роса элементы, несущие наибольший объем информации, и определить оптимальный путь поиска документов с учетом взаимодействия эле­ментов информации между собой.

Разработка стратегии поиска является необходимой технологи­ческой операцией в любой системе обслуживания.

Далее по тексту данной инструкции, гели называемая операция присуща только одной системе (например, системе ИРИ с механизиро­ванным поиском), то такая оговорка делается, если же такой ого­ворки нет, то операция относится ко всем системам обслуживания.

В карте профильных интересов запись признаков стратегии поиска производят в трех позициях: поисковое предписание, огра­ничения и собственно стратегия поиска.

В графе "Поисковое предписание" записывают ключевые слова (дескрипторы запроса и шифр УДК, указывающие на потенциальные массивы документов, в которых следует проводить поиск).

Выделение из запроса ключевых слов обеспечивается техноло­гической операцией, называемой индексированием.

Под индексированием понимается выражение основного содержа­ния запроса при помощи ключевых слов-характеристик, которые явно или в скрытом виде содержатся в тексте запроса.

Ключевые слова запроса - это фактически те признаки, по ко­торым проводят оценку документов как при механизированном поиске, так и при визуальном их просмотре.

Индексирование запроса осуществляют на основе "Общей мето­дики индексирования документов в автоматизированной ИПС "Квантор" или же с помощью частных методик, например, "Инструкции по индексированию информационных документов по горному делу в автоматизированной ИПС "Квантор".

Основные моменты технологии индексирования запроса заключены в следующем:

I. Деление запроса на подзапросы. Запрос подвергают анализу на предмет того, насколько широки понятия, встречающиеся в запро­се, или, какие более узкие понятия входят в предмет запроса. Вполне естественно, что при большей степени абстрагирования зап­рос делят на несколько частных подзапросов. Например, имеется запрос гл.зоотехника Кемеровского треста "Скотопром" - "Рационы для кормления крупного рогатого скота", который фактически со­держит три подзапроса:

- рационы для кормления коров;

- рационы для кормления телят;

- рационы для кормления быков.

Кроме нижестоящих терминов, на количество частных подзапро­сов влияет наличие связанных терминов.

Деление запроса на подзапросы проводят в результате инже­нерного анализа запроса, справочным материалом при котором слу­жит дескрипторный словарь или энциклопедические справочники.

2. Второй технологической операцией при индексировании зап­роса является извлечение из подзапросов конкретных аспектов со­держания вплоть до отдельных фактов (числовые характеристики) и представление этих аспектов в виде ключевых слов. Например, для запроса "Рационы для кормления крупного рогатого скота" в поис­ковое предписание необходимо выписать ключевые слова: крупный, рогатый, скот, корова, теленок, бык.

3. В системе "Квантор" для каждого ключевого слова устанав­ливают эквивалент в индикаторном словаре. При отсутствии экви­валента ключевое слово заменяют другим, имеющимся в словаре, без нарушения предметного содержания запроса.

Дескрипторы с кодовыми значениями записывают в графу "поис­ковое предписание" (см.приложение 4). Причем ключевые слова за­писывают в единственном числе именительного падежа.

Против одной латинской буквы (А, В, С, Д ...) пишут только одно слово или словосочетание, если последнему в индикаторном словаре дан один шифр. Например, если в запросе имеется слово­сочетание генератор оптический, то его следует писать в одну строку, т.к. в "Индикаторном словаре" (раздел "Электротехника") оно имеет один шифр - 23274.

Для определения рабочих подмассивов, в которых проводят поиск документов (определение рабочих подмассивов проводят как в системе "Квантор", так и в системе с ручным поиском) необхо­димо:

- выделить из запроса предметные рубрики;

- отыскать им эквиваленты в соответствующих отраслевых таб­лицах УДК.

Найденные эквиваленты и являются потенциальными рабочими подмассивами.

Например, для запроса "Схема автоматического управления ля­дами подъемно-погрузочного комплекса при проходке (углубке) верти­кальных стволов" выделяют следующие предметные рубрики и их экви­валенты в отраслевых таблицах УДК "Горное дело":


Проходка шахтных стволов 622.25

Переоборудование стволов. Ремонт

стволов, выходящих из строя. Ляды

(Горное дело) 622.455.7

Шахтный подъем. Оборудование 622.67

Людской подъем. Подъемные клети. 078.2
Схема принципиальная (форма) (084.2)

Автоматическое управление 62-52


Из выделенных предметных рубрик определяют основные. Для данного запроса базисными рубриками будут 622,25;622.455.7 и 622.67. Этими индексами определяются потенциальные рабочие подмассивы, в которых будет организован последующий поиск.

Данные в графу "Ограничения" берут из заявок специалистов. При оформлении заявки специалист может не только произвольно формулировать тему, но и указывать, издания каких видов ему необ­ходимы (например, исследователь чаще всего просит высылать статьи и изобретения). Если в заявке указан тип издания (научный, произ­водственный, справочный, учебный), эти данные также записывают в графу "Ограничения" и системой (ручной или механизированной) выдают потребителю документы требуемого характера и научного уровня изложения.

При заявке потребитель, кроме указанных аспектов, может на­зывать точку зрения (признак, характеризующий состояние и стадию описываемого предмета), год издания и язык публикации.

При индексировании документов в системе "Квантор" все эти признаки выявляются, поэтому при поиске документов ими пользуются как самостоятельными дескрипторами. При обработке запроса аспекты, под углом зрения которых следует проводить поиск документов, от­мечают как в графе "Ограничения" (в приложении 4: тип издания - производственный; точка зрения - опыт), так и в графе "Поиско­вое предписание" в качестве самостоятельного дескриптора (в на­шей примере под буквой I записан дескриптор производственный и под J - опыт).

При обработке запроса потребителя в системе с ручным поис­ком аспекты отмечают в виде общих определителей языка, формы, точки зрения, времени. При этом используют "Таблицы общих опре­делителей УДК" (в приложении 4 тип изданий и точка зрения - производственный, опыт - описывается общим определителем точки зрения 002.). Общие определители записывают на карте профильных интересов сразу аз после аспектов.

Чтобы определить наиболее рациональный путь поиска для дан­ного запроса или группы запросов, следует выяснить:

-содержит ли данный запрос частные подзапросы (сколько и какие);

- возможно ли при поиске объединение нескольких запросов.

Исходя из такого анализа, запросы можно разделять на три категории.

Первая - когда у запроса нет частных подзапросов. В этом случае запрос имеет только одну формулировку, у ключевых слов запроса нет нижестоящих и связанных характеристике. Например, "Использование асинхронного 3-фазного двигателя в однофазном режиме". Термины запроса однозначны и не нуждаются в пояснениях. Пусть поисковое предписание будет состоять из слов асинхронный (А), трехфазный (В), двигатель (С), однофазный (Д) и режим E). Как очевидно, релевантными документами будут такие, в которых имеются все пять признаков. Тогда функция, которую мы реализуем при поиске (ручном и машинном), будет представлена как:

f = АВСДЕ

Её-то и записывают в графу "Стратегия поиска". Для библиог­рафа, проводящего анализ документов визуально, функция f = АВСДЕ означает необходимость наличия в анализируемом документе всех пяти признаков (А, В, С, Д, Е). Отсутствие хотя бы одного признака не дает права включать документ, например, в тематичес­кую подборку.

Для оператора, проводящего поиск на ИПМ "Квантор", функ­ция означает, что машина производит только одну логическую комби­нацию, а именно из пяти слов поискового предписания одну ком­бинацию по 5. Такую операцию производит "Квантор" при I режиме работы (сортирование по X - сортирование по количеству совпав­ших слов). Отметку режимов производят под строкой "Страте­гия поиска". В данном примере округляют цифру "I", и информация после поиска будет в 5-м кармане.

Другой разновидностью запроса является такой, который нельзя отнести к категории неделимого (как в примерз, описанном выше). Уже проводимый пример "Рационы для кормления крупного рогатого скота" является запросом, состоящим из 4 самостоятельных подзап­росов:

I. Рационы (А) для кормления (В) крупного (С) рогатого (Д) скота (Е).

2. Рационы для кормления коров (F).

3. Рационы для кормления телят (G).

4. Рационы для кормления быков (Н).

Следовательно, и при поиске следует реализовать не одну, а все четыре функции. Используя буквенные обозначения слов зап­роса, функции, по которым проводят поиск, будут следующими:


для первого подзапроса £1 = АВСДЕ;

для второго подзапроса £2 = ABF;

для третьего подзапроса £3 = АВG;

для четвертого подзапроса £4 = АВН.

Тогда функция для запроса "Рационы для кормления крупного рогатого скота" будет

£ = АВ(СДЕ+F+G+Н).

В приложении 4 функция записана как £ = ABI3 (СДЕ+F+G+H), т.к. в запросе включены ограничения "тип изданий" и "точка зре­ния".

При проведении поиска (как ручного, так и механизированного) в отыскиваемых документах необходимо присутствие признака А и признака В. Что касается остальных признаков, то присутствие одного из них обязательно. Таким образом, знак "+" означает логическую операцию "или". Эта функция может быть решена в маши­не "Квантор" с помощью режима Ш - сортирование по произвольным функциям, причем шумовых документов (ложных комбинаций) при этом режиме не должно быть.

В принципе эту задачу можно решить и при режиме I, но при этом могут быть ложные комбинации» Нерелевантные документы в этом случае удаляют вручную.

В первом режиме для избавления шумовых документов существует ещё подрежим: сортирование по