Документ: информационный анализ

Вид материалаДокументы
Подобный материал:
1   ...   4   5   6   7   8   9   10   11   ...   14
ной информациичто отражается в фактически меньшей разни­це в цене; монтировать в перфокартах микрофотокопии полных текстов, что превращает реферативный каталог в микробиблио­теку; перекодировать получаемые перфокарты в соответствии с языком данной локальной системы, обеспечивая возможность не одноаспектного (как в обычных библиотеках), а многоаспект­ного поиска.

В настоящее время институт перешел на авторефераты оте­чественных журнальных публикаций, составляемых авторами в ходе подготовки рукописей к печати. Этим существенно сократи­лись затраты на реферирование, повысилась достоверность пред­ставляемых в рефератах данных, но при этом ухудшилось общее качество, поскольку на смену опытным референтам пришли не­опытные и не заинтересованные в этом деле авторы. Кроме того, авторефераты стали еще более безадресными: тезаурусы автора и референта соединились, а тезаурус потребителя отделился от них.

Продолжает обсуждаться правомочность и целесообразность дублирования рефератов на уровне ведомственных органов вто­ричной информации. Эти органы оправдывают практику дубли­рования тем, что, во-первых, их продукция является адресной и поэтому более информативной; во-вторых, их штатные сотрудни­ки, являясь одновременно внештатными референтами Всесоюзно­го института научной и технической информации, передают ко­пии сделанных рефератов в свой ведомственный орган, и те пуб­ликуются на несколько месяцев раньше, чем в центральной ре­феративной пресое.

Как видим, проблема реферативного дела далеко не решена и многое зависит от того, как будут развиваться механизирован­ные документальные системы.

3.6. Классификационный индекс

Административно-управленческие и научно-технические доку­менты снабжаются распределительным индексом, представля­ющим собой классификационный номер или дескриптор, либо несколько номеров или дескрипторов одновременно.

Для этой цели могут применяться универсальные иерархи­ческие классификации, разработанные применительно к от­дельным жанрам документов. Наибольшее распространение имеет сейчас Универсальная десятичная классификация (УДК), считающаяся в научно-технической информации (кни­ги, журнальные статьи, отчеты и соответственно рефераты) международной и принятая в нашей стране постановлением Совета Министров СССР. В архивах административно-управ­ленческой документации также рекомендуется применять УДК [24]. В системе Министерства культуры СССР научно-техничес­кая и публицистическая литература индексифицируется по Библиотечно-библиографической классификации (ББК), раз­рабатываемой в Государственной библиотеке им. В. И. Ленина. В области патентной информации действуют несколько нацио­нальных патентных классификаций и Международная класси­фикация изобретений.

Все эти классификации, как указывалось выше (раздел 1.1.), позволяют характеризовать документ с помощью одно­го, реже — нескольких индексов. Такое условие вступает в про­тиворечие с теоретической возможностью бесконечного дробле­ния классификационных рубрик, так как с глубиной информа­

ционного пространства, по закону информационной селектив­ности I [24], взаимоисключающие друг друга признаки все чаще становятся параллельными, т. е. встречающимися одновремен но. Вследствие этого увеличивается средняя сумма поискового образа документа, достигающая на уровне локальных, узкопро­фильных систем десятков признаков, а на уровне более широ­копрофильных—сотен признаков одновременно [114, 136]. Это видно на примере дескрипторных рефератов и приводит к выво­ду, что в больших централизованных фондах для их активной







Рис. 13. Схема комплектования документных фондов по широ­те и глубине информационного пространства

1 — фонд широкого, но неглубокого профиля; 2 — фонд глубокого и уз­кого профиля
ш.

деятельности каждый документ должен получить такое боль­шое число признаков, что даже частично это невозможно осу­ществить.

По-видимому, универсальные иерархические классификации лучше применять на самых верхних уровнях информационного пространства (Совет Министров СССР, издательства широкого профиля, библиотеки районного или городского масштаба, где выборочно собирается учебная, обзорная, научно-популяр­ная, классическая и современная художественная литература) (рис. 13). При этом роль центральных государственных архи­вов и крупнейших универсальных библиотек-хранилищ должна рассматриваться в двух направлениях: по широте нач неболь­шую глубину информационного пространства выделяется ак­тивный субфонд, описываемый с помощью универсальной клас­сификации, и по глубине — пассивный субфонд с целью страхо­вого хранения документов, которые вводятся в оборот не с помощью собственного поискового аппарата, а путем привлече­ния локальных отраслевых фондов, которые можно рассматри­вать в качестве субфондов центрального фонда.

Иными словами, если потребителю нужен документ общего назначения, он получает его непосредственно в центральном'

фонде, тогда как при поиске документа узкого значения в цен­тральном фонде могут указать лишь на соответствующий отрас­левой или территориальный субфонд, в котором по запросу вы­даются либо сами документы, либо их адреса в центральном страховом фонде. Это единственная возможность обеспечить такому фонду приемлемую оборачиваемость. Пока, к сожале­нию, слишком много усилий тратится в библиотеках на состав­ление огромных классификаторов и всеобъемлющих каталогов, допускается много ошибок, так как физиологически человек не может качественно разделять информационный поток более чем на 100 частей.

Вследствие названных недостатков в последнее десяти­летие активизировались работы по составлению отраслевых дескрипторных словарей-тезаурусов с целью их применения при описании профильной документации. При этом, как это бывает часто с новыми методами, дескрипторный язык некоторые по­спешили объявить «панацеей», предложив упразднить универ­сальные классификации как устаревшие. На практике в самые последние годы возникла угроза такой же участи для дескрип­торных языков. Информационные работники стали понимать, что полная «анархия» с отсутствием иерархических связей между дескрипторами не оправдывает себя.

Значительно эффективнее применяются дескрипторные язы­ки в узколокальных системах, в масштабах тематических инте­ресов отдельных учреждений. Здесь рубрики такого словаря могут рассматривать как дела — комплексы документов. Одна­ко и здесь возникли две серьезные проблемы, решение которых открыло путь к примирению сторонников классификационных и дескрипторных языков.

/Первая проблема заключается в том, что по закону селек­тивности на столь большой глубине просто невозможно припи­сывать документу только один признак. Это особенно четко видно в специализированных библиотеках. Но даже и в канце­лярии, где небольшие по информационному объему документы подшиваются каждый в свое дело, они становятся недоступны­ми для других подразделений и требуют обязательного копиро­вания. , • V

Вторая проблема возникла в связи с явной необходимостью по мере углубления языка, насчитывающего сотни признаков, некоторой их иерархической группировки. Так возникли локаль­ные десятичные классификации (ЛДК), насчитывающие обычно 3—4 разряда, которым мы присваиваем условные обозначения — направления, проблемы, темы и тематические вопросы. При этом даже и здесь хорошо проявляется информационная селектив­ность, когда в верхних разрядах документационный поток раз­деляется на рукава с небольшим процентом наложения (для чего вводится параметр чистота селективности), а в нижних

разрядах происходит почти полное совмещение (и здесь опре­деляется частота совместимости).

Опыт типизации блоков ЛДК на низших уровнях народно­хозяйственной иерархии сделал с целью взаимной увязки необ­ходимым создание таких же блоков на более высоких отрасле­вых уровнях для более эффективного распределения получаемой сверху информации.

IПримером служат уже упоминавшиеся в предыдущем разде­ле, распространяемые по подписке реферативные перфокарты. Поисковый образ, закодированный на каждой карте, включает в среднем около 10 дескрипторов по четырехразрядной схеме ЛДК и один индекс УДК, унаследованный от реферативного журнала и наглядно демонстрирующий свои ограниченные возможности. Подписчик, получив перфокарты, естественно, больше не нуж­дается в ЛДК издателя, так как те несколько рубрик, по кото­рым он осуществляет подписку, не могут выполнять поисковые функции. Поэтому, не меняя макет перфокарты, он перекоди­рует ее по своей схеме ЛДК и осуществляет тем самым много­аспектный поиск.

Таким образом, взаимодействие схем ЛДК на разных иерар­хических уровнях как бы отражает многомерное свойство ин­формационного пространства, поскольку из всех блоков ЛДК отнюдь нельзя собрать единую (универсальную) схему. В дей­ствительности это — лишь иерархическая система локальных классификационных схем.

Перечислим некоторые другие преимущества ЛДК: || про­стота составления, принимаем во внимание, в частности, и то, что каждая такая схема приблизительно согласуется с реальной административной структурой; 2) простота в изменении (упра­зднение и ввод новых рубрик и даже блоков ЛДК), без ломки всей системы, что особенно важно в современных условиях бы­стро меняющейся информационной обстановки; 3) простота в об­ращении, в частности простота кодирования (см. стр. 91).

К вопросам практического применения ЛДК мы еще вернемся в главе «Документационные процессы».

3.7. Ссылки

В научной литературе и в некоторых других жанрах докумен­тов (например, в юридических актах) принято делать ссылки на документы, послужившие автору отправным пунктом. Но самое большое развитие институт ссылок получил, конечно, в науке.

Подсчитано, что в среднем каждая научная статья содержит семь библиографических ссылок. Это позволило Д. Прайсу [95] и В. В. Налимову [93] назвать науку семиполой развивающейся системой, где семь особей, как правило, рождают новую особь —* статью.

Научная ссылка составляется по трафарету полного или со­кращенного библиографического описания, включающего фами­лию и инициалы автора, источник (журнал, книжное издатель­ство или архив) и место его нахождения (кроме известных жур­налов и международных издательств), год, номера тома, выпу­ска или единицы хранения, а также часто полное название доку­мента, способ фиксации (для нетипографских изданий) и номера страниц. Ссылки группируются по фамилиям авторов или в по­рядке цитирования причем в отечественной гуманитарной ли­тературе общий список может отсутствовать и ссылки приводят­ся в подстрочных примечаниях. Если же бывает и то и другое, то в подстрочных ссылках автор фиксирует формальные выход­ные данные, иногда по частным поводам, а в конце приводит тщательно подобранную библиографию.

До последнего времени литературные ссылки рассматрива­лись не более как традиция—день уважения предшественни­кам, утверждение приоритетов и авторское намерение показать свой вклад, часто понизив его.

В структуре ссылок прежде всего следует обратить внимание на соотношение жанров. Известно, что в научной периодике принято ссылаться в основном на статьи, а не на книги. На последние приходится їв среднем около 10% ссылок и столько же (или немного более) [37, 136] — на сборники; хотя в нашей стра­не сборники и журналы находятся приблизительно в равном ко­личественном соотношении, но первые разыскивать, конечно, бывает труднее, чем вторые. На патенты в журналах ссылаются в 1% случаев [207]. Что касается исторической литературы, то там нередко разделяют библиографические и архивные источ­ники, неправомочно называя источниками только последние из них.

П. Атанасиу [136] перечисляет следующие мотивы ссылок: 1) оригинальный научный вклад; 2) совпадение взглядов и про­должение идей; 3) изменение, совершенствование и отрицание предшествующих результатов; 4) только библиографический вклад. При этом в одном случае из десяти автор ссылается на свои предыдущие работы, в одном случае из пяти —на публика­ции в этом же журнале и вообще очень часто делает упор на начальников и друзей в ущерб" своим конкурентам. В свою оче­редь данный орган печати оказывает на автора давление в отно­шении общего количества ссылок, работ чисто теоретического или, наоборот, прикладного характера, внеотраслевых, перифе­рийных или зарубежных источников.

В последнее время наметилась явная тенденция чаще ссы­латься на неопубликованные и недокументальные источники.


Это связано отчасти с дея­тельностью незримых науч­ных коллективов из-за меж­отраслевого характера раз­вития современной науки. Незримые коллективы полу­чили свое название потому, что они не вписываются в существующие администра­тивные — ведомственные и даже государственные — структуры: ученые и инже­неры, работающие в разных сферах науки и производ­ства, в разных городах и странах, объединяются для решения важных для них

Рис. 14. График распределения биб- ИШ ТаКЗЯ K00nePaH лиографических ссылок на примере позволяет лучше организо-

вать сбор внешней инфор-

Сплошная линия—отечественные; преры- мации, обмениваться ре-

вистая — иностранные публикации

принтами и препринтами своих работ, а также рабо-

тами, только подготавливаемыми к публикации (препрепринты), для скорейшей апробации и ввода «в научный оборот новых идей. В связи с этим научные нормы, действующие в науке вообще и в каждом незримом коллективе, в частности, не только позволя­ют, но и требуют ссылаться в равной степени на работы опубли­кованные, официально принятые к печати и находящиеся в про­цессе подготовки.

Распределение ссылок по годам позволяет составить график, показывающий: 1) читательский период — время, прошедшее от года максимального использования литературы, которому соот­ветствует пик на графике, до момента чтения; 2 издательский период —- то же время до момента выхода документа в свет; 3) авторский период — то же время до момента окончания рабо­ты по составлению библиографии; 4) период двойного прироста используемой литературы (до пика на графике); 5) период полу старения информации — среднее время, за которое количе­ство ссылок сокращается наполовину («после пика на графике).

На рис. 14 приведен график, составленный по библиографии в конце этой книги. Нетрудно увидеть, что авторский период 'составляет здесь для отече­ственной литературы 2 года, для иностранной — 8 лет, период двойного при­роста — соответственно что-то около Уз и 2 года, период полустарения — не­многим более 1 года.

Такой же график для [91] дает величину авторского периода в 5 лет, период двойного прироста — около 2 лет, период полустарения— около j 2,5 лет.




Ш 70 Ш 66 Щ 62 60 55

данной книги по годам
Более достоверные данные могут быть получены, естественно, для комп­лекса работ по данной тематике.


Продолжительность авторского периода характеризует уме­ние работать с литературой, уровень информационных связей и вообще результативность тех усилий, которые автор тратит на сбор и обработку информации. Эта же величина, рассчитанная для комплекса работ, будет говорить о постановке информацион­ного обслуживания в данной отрасли и, таким образом, являет­ся косвенным экономическим показателем. Нечто подобное мо­жно видеть на графике рис. 2, где степень доступности отрасле­вой информации служит функцией ее относительной ценности.

Разные авторские периоды для отечественной и иностранной литературы указывают на существование информационных барь­еров— географического, государственного, языкового, экономи­ческого. Возрастание в целом авторского периода и соответству­ющей разницы для отечественной и иностранной литературы ха­рактерно для периферийных научных учреждений.

Период полустарения литературы (по аналогии с периодом полураспада атомов радиоактивных элементов) отражает темпы развития данной отрасли знания и, следовательно, ее актуаль­ность.


(17)

(18)
Количество устаревшей информации di за время dt пропор­ционально общему количеству информации і и этому времени

— di—Xidty

где X—коэффициент пропорциональности, константа старения, меняющаяся во времени и в информационном пространстве. Если обозначить начальную информативность документа че­рез Щ а спустя некоторое время t информативность будет it, то

= і0ехр(—Щ

Т — период полустарения, а время теоретического устаревания документа т—1,443Г.

Продолжая аналогию с периодом радиоактивного полураспа­да, следует отметить, что достоверность определяемого на основе его абсолютного возраста горных пород подвергалась большому сомнению из-за грубых расхождений с данными относительного возраста. В действительности оказалось, что сам факт этих рас­хождений дает не менее ценную информацию о геологических событиях, повлиявших на историю данных пород. Также и в отношении периода полустарения можно сказать, что, поскольку не только этот фактор понижает информативность документов, всякое отклонение можно рассматривать как проявление одного из таких факторов (например, несовершенство системы поиска) и, с другой стороны, производить необходимые уточнения вели­чины периода полустарения.

В связи с этим представляет интерес проявление того, что мы называем классикой в науке. Присутствие на кривой умень­шения числа ссылок второго пика служит указанием на наличие

группы авторов, так сказать победивших время и которые поэтому вправе именоваться классиками. Однако в нормальном процессе развития пауки, как 'бы ни были велики заслуги того или иного исследователя, непосредственно на его работы посте­пенно перестают ссылаться. В. В. Налимов назвал это «эффек­том сбрасывания авторитетов» 1136].

Обращаясь к цитированной литературе и в свою очередь к той литературе, к которой отсылает она, мы можем по цепочкам ссылок проследить историю развития тех или иных идей и тот вклад, который сделал автор, либо одна его публикация, в этот процесс.

На рис. 15 показана такая ситуация. В ней участвуют 8 авторов. 1-й из них высказал идею (№ 15), которая была почти в одно и то же время под­хвачена другими; 2-й автор, сославшись вначале (№ 21) на № 15, стал раз­вивать идею самостоятельно и в дальнейшем цитировал только самого себя (№ 15, 8, 3); 3-й автор также, по-видимому, подхватил эту идею и стал раз­вивать ее, но при этом ссылался только на свою первую работу (№ 19); 4-й автор (с № 20) и 5-й (с № 18) ссылались на № 15 и друг на друга. Заслуга 6-го в том, что в своей работе (№ И) он сумел объединить все, что говори­ли 5-й (№ 14) и неизвестный до этого 7-й автор, которому, собственно, и при­надлежит приоритет, так как его первая работа (№ 29) вышла на три года раньше № 15. Параллельно с этим 7-й автор развивал еще одну идею (№28 и 26), которую объединил затем с первоначальной в № 22. Роль 8-го автора і (№ 7) чисто эпизодическая, но 6-й автор * в последующих работах, кончая № 1 (послужившей отправной в данном анализе), раскрыл и объективно представил всю ситуацию, дополнив известные данные собственными иссле­дованиями.





23.


Рис. 15. Модель развития научных идей по данным анализа ссылок




Другой метод основан на противоположном принципе: в ос­нову берется не заключительная, а отправная работа и оценива­ется вклад, который она вносит в последующее развитие идей. Этот метод более трудоемок, так как требует просмотра очень большого числа документов, если принять іво внимание, что ссылки на данную публикацию могут быть не только в отечест­венной, но и в зарубежной печати, не только в пределах данной




Да-

Рис. 16. Метод классификации ученых-авторов на основе биб­лиографических ссылок

/ — частые ссылки автора на самого себя; ii — на других авторов; iii— щщ других авторов на этого автора

1

отрасли, но и в других отраслях. Благодаря действующей в США системе на базе ЭВМ «Scientific Citation Index» [114], ох­ватывающей, однако, далеко не все научные публикации, ока­зывается возможным получать справки, кто, когда и где ссылал­ся на любую научную статью. Подобный анализ, сделанный по всем работам одного лица, позволяет составить его творческую биографию в виде кривой цитируемости, фиксирующей всплески творческой активности и степень устаревания опубликованной информации щ

Таким образом, на основе анализа ссылок, классифицируе­мых с помощью вопросов (рис. 16), выявляются своеобразные черты авторской личности. Много ссылок на других может гово­рить о соблюдении научной этики и о знании литературы, а так­же об известной осторожности, а частые ссылки на самого се­бя — о систематичности и последовательности работы. Отсутст­вие ссылок на работы данного лица может указывать на очень многое: или эти работы не представляют научного интереса, или опубликованы в недоступных изданиях, или их значение только в будущем. Во всех случаях нужен серьезный анализ тех или иных «цитационных» отклонений и следует избегать опрометчи­вых выводов.

Изучение совокупности работ многих авторов позволяет под­няться еще на одну ступень и оценить вклад в мировую науку

отдельных научных коллективов (школ), отраслей и целых стран. Этот фактический вклад нужно отличать от номинального вкла­да, выражаемого 'В таких косвенных параметрах, как объем ас­сигнований, техническое оснащение, число научных работников, количество органов научной печати и общее количество пуб­ликаций. Дело в том, что, изучая научный фронт, мы видим не­равное участие и положение отдельных партнеров: одни идут впереди, вторые все более отстают, третьи догоняют и перего­няют, четвертые занимают стабильное положение за лидером или в конце, пятые более предпочитают покупать -результаты иссле­дований, чем самим заниматься ими.

Классификационно-деокрипторный анализ ссылок—по изме­нениям информационной нагрузки отдельных деекрипторов-руб- рик — позволяет делать краткосрочные прогнозы, выявляя более перспективные и менее перспективные направления в развитии науки и техники. Одновременно с этим можно производить поиск публикаций, особенно по смежным проблемам [162] и когда факт ссылки на данного автора уже многое говорит [37].

Все описанное выше объединяется сейчас в самостоятельную научную дисциплину—наукометрию [37, 93],— находящуюся на стыке математической статистики, теории научно-технической информации, науковедения и документалистики.

3.8. Приложения

Приложениями к документу являются: 1) предисловие или пос­лесловие редактора, переводчика или составителя; 2) коммента­рии; 3) указатели — авторский и предметный; 4) самостоятель­ные документы, служащие дополнительным, объяснительным или подтверждающим материалом к основному документу. Формально приложением можно назвать и описок литературы, но в научной практике он считается неотъемлемым атрибутом законченного сочинения и выделяется лишь тогда, когда библио­графия носит вполне самостоятельный характер и не служит объектом прямых ссылок.

Предисловие и послесловие в качестве приложения иногда дублируют соответствующие элементы авторского текста, сооб­щают необходимые сведения об авторе и его информацион­ном окружении, а также дают критический разбор произведе­ния.

Тем же целям служат комментарии с присовокуплением до­полнительных сведений, повышающих информативность произве­дения, первоначально рассчитанного на несколько иную ауди­торию (в историческом, национальном или общественно-полити­ческом аспекте). При этом выделяются чисто справочные дан­ные: словарь незнакомых терминов и условных обозначений, таблица мер и весов и т. п.

Указателями стараются снабжать крупные монографии и документные комплексы: собрания сочинений, годовые тома журналов, канцелярские дела и целые фонды. В первом случае этим занимается сам автор, формализуя тем самым тезаурус своего произведения. В остальных случаях составители ста­раются подчинить содержание интересам конкретных потре­бителей.

По существу указатель к документу следует рассматривать как его более расширенный поисковый образ (относительно за­головка и оглавления). Если при этом достигнута достаточная степень детализации и удобства в том смысле, что каждый де­скриптор отсылает не только к странице или разделу, а к от­дельному абзацу (при детализованной схеме ЛДК), то читатель получает достаточно эффективное средство поиска и выбороч­ного чтения. Однако в подавляющем большинстве монографий, особенно в последнее время, такие указатели отсутствуют; в журналах (в каждом последнем или первом номере года) они слишком неглубоки, ограничиваются несколькими самыми об­щими рубриками; в реферативных журналах указатели, как правило, ограничиваются несколькими дескрипторами заголов­ка [233] и выходят к тому же с большим опозданием в качестве отдельного издания. В результате, по данным опроса [204], ав­торскими указателями к реферативным журналам пользуются 5% научных работников, предметными указателями — 7% и обоими вместе — еще 6%.

В последние годы получили распространение новые виды вторичной информации: фотокопии оглавлений к журналам и пермутационные указатели, о которых говорилось вначале (раз­дел 1.2.). Недостаточная популярность первых объясняется тем, что некоторые /сводят к ним всю проблему вторичного информа­ционного обслуживания, а вторых —тем, что указатели, состав­ляемые с помощью электронной вычислительной машины в виде поалфавитных списков некоторых дескрипторов из заголовков, способствуют тем самым большим информационным потерям и печатаются неудобочитаемым шрифтом.

Одна из интересных возможностей хорошо составленного указатели — выявление информационной структуры документа. По ссылкам на разделы и подразделы определяется число деск­рипторов (относительно всего дескрипторного словаря), прихо­дящееся на единицу информационного объема (рис. 17). Как правило, величина удельной емкости подвержена существенным колебаниям, обнаруживает тенденцию к увеличению в заключи­тельных подразделах. Что касается новых дескрипторов, отсут­ствующих в предыдущем разделе, то максимум их обычно при­ходится на первый подраздел и затем процесс обновления посте­пенно затухает. По .информационной структуре можно выявлять «сжатые» и «растянутые» участки текста и проверять внутрен­нюю логику изложения,

4* 90







Если документ по своему содержанию соответствует неглу­бокому положению в информационном пространстве, то, соглас­но закону информационной селективности, многие дескрипторы указателя будут иметь небольшое число отсылок, но к крупным кускам текста. С глубиной информационного пространства больше проявляется его многомерность, и при одноканальном характере изложения по разным аспектам автору приходится возвращаться к одному н тому же несколько раз. В результате возрастает численность дескрипторов с многими отсылками, , но к более мелким отрывкам текста. Таким образом, величина отношения числа отсылок к общему объему текста, соответст­вующего данному дескриптору, показывает степень его отклоне­ния от главного аспекта повествования

т

И/.

щ

Отсюда средняя аспектность дескрипторов указателя имеет вид м

ЫдГ' щ

где М—-число дескрипторов в указателе, отражая положение по глубине информационного пространства. Более низкие зна­чения | отвечают взаимоисключающим признакам, характер­ным для небольшой глубины, когда логика изложения очень проста, поскольку объединяет в одну цепь звенья нескольких крупных вопросов. При высоких значениях g налицо параллель-

ню

т


5. 6.
Щт







20



10
Рис. 17. Информационная структура, составленная по предметному указателю (дес- крипторному словарю) на при­мере данной книги

Сплошная линия — процент де­скрипторов в разделе (по двухраз­рядной схеме ЛДК); прерыви­стая — процент новых дескриптооов (относительно предыдущего разде­ла)






90 v;%

ные признаки, характеризующие более глубокую проработку материала и >по достаточно узкому вопросу; здесь логика изло­жения более сложна и требует тонкого подхода, чтобы проло­жить оптимальный путь среди множества разноаспектных воп­росов.

Для более . ясного понимания, по аналогии с примечанием на стр. 90, приведем два разных примера:

<1. Составив указатель к библиографии древнего мыслителя, мы увидим, что дескрипторы характеризуют отдельные этапы его отнюдь не пестрой внешними впечатлениями жизни, выделяемые по местностям, где он прожи­вал, и людьми, с которыми встречался. В противоположность ему современ­ный человек благодаря существующим коммуникациям имеет больше воз­можностей менять обстановку и встречаться со многими людьми, разумеется на более короткие сроки, но, может быть, и по многу раз.


ВО
2. Указатель к реферативному журналу универсального профиля вклю­чает в общем разные и нечасто повторяющиеся дескрипторы. Напротив, в уз­коспециализированном реферативном органе во множестве однотипных рефе­ратов будут часто повторяться одни и те же дескрипторы.

Процесс развития данной отрасли знания отражается также на конфигурации кривой распределения аспектности дескрип­торов. Ранговая расстановка дескрипторов по аопектности и по значимости (информационная нагрузка) довольно верно пред­ставляет картину содержания текста, делая указатель развер­нутым поисковым образом документаК


Документы, выступающие в качестве приложений, часто фигурируют в административно-управленческой практике, где основной — головной — документ выполняет чисто юридическую, сопроводительную функцию, а многолистное приложение — трайлер,-Ш.поступая в другую информационную систему, осво­бождается от его зависимости и приобретает самостоятельное значение. В научно-технической информации такую же роль играют методические прописи, результаты анализов и испыта­ний, производственные дневники, подлинные тексты документов для юридического или исторического доказательства во всех случаях, когда они не вкраплены в текст, что особенно типично для дипломных работ, диссертаций .и отчетов. В периодической печати (в основном художественно-публицистической) прило­жения представляют гипертрофированные рубрики, не соответ­ствующие прямо основному профилю данного органа (экономи­ческое приложение в политическом издании и, наоборот, книж­ное приложение к общественно-художественному журна­лу и т. п.).

♦ * *

В заключение подчеркнем те основные функции, которые вы­полняют элементы традиционного вспомогательного аппарата документа. Адрес или позитивный гриф, классификационный индекс, реферат, аннотация и заголовок служат ориентирами в потоке информации, гарантируя или только повышая вероят­ность попадания документа к потребителю. Внешнее оформле­ние, заголовок, аннотация, оглавление, указатели подготавлива­ют его: психологически настраивают, знакомят с идеей, содер­жанием, допуская в отдельных случаях выборочное чтение. Некоторые другие элементы обеспечивают иные, не менее важ­ные функции, но все это в современных информационных усло­виях признается далеко не достаточным.

4. матричные документы

4.0. Кодовая (поисковая) матрица.—4.1. Карты с краевой перфораци­ей—4.2. Щелевые перфокарты.—4.3. Карты-решетки.—4.4. Просветные (суперпозиционные) перфокарты.— 4.5. Машинные перфокарты и перфо­ленты.—4.6. Фотографические микрофильмы и микрокарты.—4.7. Доку­менты с магнитной матрицей.—4.8. Документы со знаковой матрицей.— 4.9. Сравнительные характеристики матричных документов

4.0. Кодовая (поисковая) матрица

Матричный документ, иногда называемый также «кибернетиче­ским», имеет кодовую матрицу, которая занимает всю его пло­щадь или только часть ее, оставляя место для основной, потре­бительской .информации.

Кодовая матрица состоит из ячеек, с помощью которых про­изводится кодирование информации с целью «поиска, автомати­ческого ввода или вывода из вычислительных, передающих и других устройств. В связи с этим коды разделяются в первую очередь на преобразующие и поисковые.

Преобразование производится при переводе информации из одной недокументальной формы в другую, из недокументальной формы в документальную и наоборот и при перезаписи инфор­мации с одного носителя на другой. При этом используется один и тот же язык либо делается перевод с одного языка на другой, следствием чего являются потери информации.

Поисковые коды в свою очередь различаются по назначению (выборка, разделение, соотнесение, комплектование и др.). Обращенной (инверсной, инвертированной) называют поисковую систему в том случае, когда матрица соотносится не с объектом поиска, а с поисковым признаком и соответственно ячейки фик­сируют не признаки, а объекты. Назначение поисковой матри­цы— осуществлять многоаспектный (многоканальный) поиск, т. е. реализация таблицы с множеством входов. Если же система одноаспектная, то это дает возможность быстро устанавливать наличие данного объекта и быстро извлекать его при беспоря­дочной расстановке всех объектов в системе.

По своему положению на площади документа матрицы бы­вают краевыми и внутренними. Для удобства все ячейки груп­пируются в ряды и колонки. Одна ячейка или группа ячеек, объединяемая общим позиционным кодом, называется позицией. В целом матрица разделяется на изоаспектные поля, соответст-

можности кодировать mj»®™-»— ЩияяЯЮщ ЯВ усту­пая решеткам іпо остальным характеристикам. Я б. Машинные .перфокарты рассчитаны на большие по объе­му массивы и взаимоисключающие признаки с разной чистотой селективности; при этом первое место они занимают по попу­лярности.
  1. Микрофильмы не дают особенно высоких показателей но занимают относительно хорошее положение по надежности и долговечности.
  2. Микрокарты рассчитаны на большие массивы, универ­сальны в отношении типов признаков и видов кодирования, по­зволяют на большой матрице кодировать пространную сумму поискового образа и искать документы.по такой же большой сумме поискового запроса, отличаясь при этом большой долго­вечностью.
  3. Магнитные карты при тех же положительных характери­стиках обладают также хорошей адаптивностью, но-уступают микрокартам по объемам массивов и долговечности.
  4. Знаковые карты — единственные из машинных носите­лей— имеют большой физический объем текстовой зоны и по объему массивов занимают третье место после микрокарт и ма­шинных перфокарт.

Выявление этих особенностей позволило на втором этапе развития матричного метода приступить к разработке комбини­рованных форм документов. В табл. 8 приведены известные 14 вариантов таких сочетаний, из которых самыми популярными являются рейтерные просветные карты, щелевые, просветные и карты-решетки с краевой перфорацией.

Одновременно в связи с неодинаковым распространением разных типов перфокарт уже применявшиеся ранее типы часто используют в качестве других типов: машинные перфокарты с краевой перфорацией Ш как просветные и карты-решетки; щелевые — как просветные и решетки; с краевой перфора­цией — как рейтерные, просветные и решетки и т. д.

Таким образом, главная задача при разработке любой до­кументальной системы — это выбор и надежное обоснование типа матричного носителя.

•g ДОКУМЕНТАЛЬНЫЕ ПРОЦЕССЫ

5 1. Составление документа,—5.2. Репродуцирование и размножение — 5.3. Преобразование,— 5.4. Передача,—5.5. Сбор,—5.6. ЩШстЩ ние — 5.7. Хранение и поиск.

Документальная система представляет собой комплекс вза­имосвязанных процессов составления и последующей обработки документов. На рис. 58 показана общая структура такой си­стемы на основе шести главных процессов. Симметричный характер схемы не является случайным, так как процесс хране­ния можно рассматривать как передачу во времени, а переда­чу— как хранение в пространстве; с другой стороны, поиск является синонимом понятия «прием из массива», а прием, если он не ограничивается адресной информацией, часто носит характер активного поиска; синоним последнего процесса — сбор информации — может соответственно, быть использован и в отношении организованных массивов. Между процессами чте­ния и записи находится важный, но недокументальный про­цесс и поэтому не указанный на схеме — переработка информа­ции — «мозг» системы, функ­ции которого выполняет чело­век или электронная вычисли­тельная машина. И наконец, процесс записи включает три самостоятельных, но тесно свя­занных процесса: составление документа, репродуцирование- размножение и преобразова­ние, которые ниже будут рас­смотрены в отдельности.




Рис. 58-. Схема документальных про­цессов
Специализация докумен­тальных систем заключается в усилении роли отдельных про­цессов— хранения (библио­тека, архив), поиска (справоч­ное бюро), сбора (разведка),


Передачи (почта, телеграф), размножения (типография). Но си­стемы, строго ограничивающие себя каким-нибудь процессом* практически не могут существовать. Так, в библиотеке, напри-' мер, процесс хранения обязательно сочетается со сбором (комп­лектование), поиском (каталог), чтением (читальня), передачей (абонемент).

Соответственно к каждому из этих процессов применим комплекс эксплуатационных параметров (табл. 7), увязываемых между собой и определяющих параметры работы системы | целом.

И еще одно замечание, прежде чем перейти к рассмотрению отдельных процессов. Среди большого круга документальных систем, где информация на всех или только на некоторых эта­пах носит фиксированный, документальный, характер, выделя­ются собственно документные (или документационные) системы с документами в качестве объектов информации, в отличие от других, недокументных систем, где объекты информации — люди, материалы, оборудование, сведения о которых обязатель­но оформляются в виде документов, и поэтому такие системы все-таки называются документальными.

5.1. Составление документа

Возросшая роль документальных систем (и в связи с этим рас­ширение понятия «документ») имеет прямое отношение к эво­люции общественных отношений, когда так называемая «уст­ная» информация почти повсеместно уступает место информа­ции «письменной». При этом происходит перераспределение главных форм документации: резко увеличиваются объемы публикаций, а в составе непубликуемой информации возраста­ет значение машинописных работ.

Однако машинописные работы имеют свою специфику, и как бы ни росла административная система, штаты машинописного бюро не могут прямо коррелироваться с этим и на определен­ном этапе развития должны стабилизироваться за счет перерас­пределения функций печатания, копирования и перепечатки документов.

Небольшие по объему документы на дежурной машин­ке административный работник печатает сам, пространные тексты также печатает, но как черновики, чтобы потом маши­нистка перепечатала их набело — значительно быстрее и с мень­шими ошибками, чем если бы она разбирала рукописный текст.

Существует метод диктофонной записи, когда работник, сняв телефонную трубку, набирает номер службы звукозаписи, включая тем самым свободный диктофон, называет форму до­кумента и диктует текст. При этом записывающий механизм начинает работать только от голоса и при паузах останавлива-

S ЧеМ психологически не травмирует диктующего свбим Г язчивым ожиданием. Машинистки затем печатают по поряд- 11)3в"оКументы, с помощью педали воспроизводя на слух отдель- И,„ куски текста.

[ диктофонная запись производится на гибкий пластиковый I иск или манжету объемом 10—15 мин диктовки (около 5 ар. Машинописного текста), которую можно отправить по почте в ! МоНверте, подшить в дело или хранить в кармане кляссерной Ваоты. Специальные марки диктофонов позволяют повторить I последние 5 мин прерванной записи, путем маркирования быст- I 0 отыскать нужное место, стереть и записать вновь неудачную I La3y в процессе редактирования сделанной ранее записи. Пор- I Дивный диктофон легко можно взять с собою в дорогу и поль- I 3оваться им даже при отсутствии электросети. Непрерывная I диктовка в течение 5'/г час обеспечивает работу четырем ма- I шинисткам.

Диктофонный метод получает сейчас широкое распростра- II неНие и в нашей стране и явно вытесняет стенографию по эко- I комичности, удобствам и быстродействию, так как исключает I процесс промежуточной записи.

г Скорость выполнения собственно машинописных работ по- і вышается, если использовать электрические пишущие маши- I ны — флексорайторы, о которых мы упоминали в разделе 4.5. I Эти машины снабжены кулачковым буквопечатающим механиз- I мом, заменяющим литерные рычаги и исключающим, таким об- I разом, возможность их сцепливания при быстром печатании. I Благодаря этому скорость работы на флексорайторе достигает I 300 ударов в 1 мин или даже больше. Перфолента, на которую і синхронно кодируется текст, может неоднократно автоматиче- I ски воспроизводить его, при этом в 4—5 раз быстрее, чем ма- [ шинистка.

Серьезную проблему представляет процесс вывода инфор­мации из ЭВМ (например, на бумажной ленте —табуляграм­ме), скорость которого, как и скорость ввода, еще не соответ­ствует быстродействию механизма переработки информации.

Рационализация процесса составления документов пресле­дует максимально возможную и целесообразную формализа­цию, с переходом от вольных литературных текстов к произ­вольным анкетам, а в трафаретных текстах — от неполных принудительных к полным анкетам, вплоть до кодовой формы, одинаково удобной для считывания человеком и машиной. Цель J всего этого — уменьшить время на составление и чтение каждо­го документа, по возможности изъять из него бесполезную ин­формацию, обеспечить механизированную и автоматизирован­ную обработку, снизить издержки. Каждое поле трафаретной за­писи можно, таким образом, отождествить с аспектным полем кодовой матрицы, рассчитанным на конечное число параллель­ных или взаимоисключающих признаков.

К вопросу, задаваемому автору записи, предъявляются сщ дующие требования: ясность, простота, целесообразность, ори­гинальность, привлекательность, корректность и простота ответа От этого зависит достоверность фиксируемой в документах особенно в социологических анкетах, информации в отношении полноты, валадности, правдивости и общей надежности системы.

Первое требование предусматривает изменение формулиро вок в зависимости от образовательно-культурного уровня и профессиональной категории опрашиваемых.

Недопустимо, чтобы вопрос был очень ,СЛОЖНЫЙ, требующий продолжительного раздумья и увеличивающий вероятность того что автор ответит неправильно, остановится на первом пришел-' шем в голову варианте или оставит вопрос без ответа.

Ни один вопрос не должен вызывать сомнения в его целе­сообразности. За исключением некоторых юридических форм необходимо обязательное сотрудничество автора анкеты с ав­тором формы. В недоработанной форме всегда присутствуют нелепые по содержанию вопросы, подобранные случайно и ча­сто без критического обоснования позаимствованные из других форм (например, из личного листка по учету кадров в различ­ные учетные формы попадают вопросы о поле, возрасте, нацио­нальности, рабочем стаже без ясного понимания, для чего они нужны).

Вопросы, оригинальные по форме и интересные по содержа­нию, обеспечивают самую высокую надежность ответов.

Корректно поставленные вопросы не содержат в себе ка­кой-либо установки и не затрагивают престижа опрашиваемого. Зачастую установка кроется в утвердительной форме вопроса: «По утрам Вы занимаетесь гимнастикой?» И тогда некоторая часть пассивных авторов говорит неправду, потому что ответ «нет» требует известной принципиальности. На примере дан­ного вопроса установка снимается отрицательной формой: «По утрам Вы не занимаетесь гимнастикой?» Или же предусматри­ваются неальтернативные варианты ответа: «Сколько времени Вы посвящаете утренней гимнастике?—до 5 мин, от 5 до 15, свыше 15 мин.» По той же причине нельзя считать ответом от­сутствие ответа, выражаемого в физической записи (слова, знаки, черта под нужным вариантом), так как пассивные авто­ры при отсутствии должной заинтересованности, будут предна­меренно выбирать вариант, фиксация которого связана с наи­меньшими физическими усилиями.

Престижность тесно связана с установкой, так как здесь также предопределяется ответ. Ниже приведены примеры сня­тия престижности в анкетных вопросах различными методами.

Ц Смягчающая формулировка: Я нравлюсь большинству людей, которые меня знают.— Думаю, что произвожу благо­приятное впечатление на людей, которые меня знают. 2. Отвле­кающий акцент (переакцентировка): Я не люблю командовать

W ми«Jответственность меня пугает.— Ответственность от- RaeT меня, и поэтому я не люблю командовать. 3. Оправды- Ряюшие обстоятельства: Я занимаюсь нетворческой научной аботой.-— Почти все время у меня отнимает нетворческая науч­ая работа. 4. Перефразировка: Миритесь ли Вы с обстоятель- твами? -IНепримиримы ли Вы?

С Если престижность нельзя снять полностью, анкета должна 6Ыть обязательно анонимной.

I высоконадежных тестах для обоснования каждой харак­теристики используются десятки вопросов, половина которых поставлена в утвердительной форме, а другая половина —в отрицательной, чтобы снять установку. Кроме того, одни и те же вопросы повторяются в разных вариантах, чтобы выявить валидность, т. е. насколько автор был внимателен при ответах. Специально подобранный список престижных вопросов с прак­тически одним приемлемым вариантом ответа («ловушкой») J служит «детектором лжи» с целью оценить искренность автора, f Если по искренности и валидности автор не набрал нужного ко- I личества очков, результаты тестирования считаются недействи- [ тельными.

•При небольшом числе вариантов ответов необходимо при- | водить их в трафарете все, чтобы авторы только подчеркивали г выбранные значения. При большом числе вариантов приводят- І ся только наиболее часто встречающиеся, а для остальных отво-