Документ: информационный анализ
Вид материала | Документы |
- О публичном отчете образовательного учреждения, 44.82kb.
- Информационный бюллетень анализ динамики наркоманий, хронического алкоголизма и алкогольных, 258.01kb.
- 1. Затвердити державні санітарні правила "Основні анітарні правила забезпечення радіаційної, 3053.42kb.
- Опубликовано: ноябрь 2008, 1823.52kb.
- Функционально-стоимостной анализ и имитационное моделирование, 681.58kb.
- Перечень документов, необходимых для начала проведения аудиторской проверки, 130kb.
- Вопросы к экзамену по дисциплине «Анализ финансово-хозяйственной деятельности», 57.22kb.
- «Россия: ценности современного общества» инсор, 993.55kb.
- План рекламы документ, определяющий порядок проведения рекламных мероприятий в рамках, 151.75kb.
- Генеральный план стратегический документ территориального планирования 4 2 Анализ использования, 369.26kb.
В настоящее время институт перешел на авторефераты отечественных журнальных публикаций, составляемых авторами в ходе подготовки рукописей к печати. Этим существенно сократились затраты на реферирование, повысилась достоверность представляемых в рефератах данных, но при этом ухудшилось общее качество, поскольку на смену опытным референтам пришли неопытные и не заинтересованные в этом деле авторы. Кроме того, авторефераты стали еще более безадресными: тезаурусы автора и референта соединились, а тезаурус потребителя отделился от них.
Продолжает обсуждаться правомочность и целесообразность дублирования рефератов на уровне ведомственных органов вторичной информации. Эти органы оправдывают практику дублирования тем, что, во-первых, их продукция является адресной и поэтому более информативной; во-вторых, их штатные сотрудники, являясь одновременно внештатными референтами Всесоюзного института научной и технической информации, передают копии сделанных рефератов в свой ведомственный орган, и те публикуются на несколько месяцев раньше, чем в центральной реферативной пресое.
Как видим, проблема реферативного дела далеко не решена и многое зависит от того, как будут развиваться механизированные документальные системы.
3.6. Классификационный индекс
Административно-управленческие и научно-технические документы снабжаются распределительным индексом, представляющим собой классификационный номер или дескриптор, либо несколько номеров или дескрипторов одновременно.
Для этой цели могут применяться универсальные иерархические классификации, разработанные применительно к отдельным жанрам документов. Наибольшее распространение имеет сейчас Универсальная десятичная классификация (УДК), считающаяся в научно-технической информации (книги, журнальные статьи, отчеты и соответственно рефераты) международной и принятая в нашей стране постановлением Совета Министров СССР. В архивах административно-управленческой документации также рекомендуется применять УДК [24]. В системе Министерства культуры СССР научно-техническая и публицистическая литература индексифицируется по Библиотечно-библиографической классификации (ББК), разрабатываемой в Государственной библиотеке им. В. И. Ленина. В области патентной информации действуют несколько национальных патентных классификаций и Международная классификация изобретений.
Все эти классификации, как указывалось выше (раздел 1.1.), позволяют характеризовать документ с помощью одного, реже — нескольких индексов. Такое условие вступает в противоречие с теоретической возможностью бесконечного дробления классификационных рубрик, так как с глубиной информа
ционного пространства, по закону информационной селективности I [24], взаимоисключающие друг друга признаки все чаще становятся параллельными, т. е. встречающимися одновремен но. Вследствие этого увеличивается средняя сумма поискового образа документа, достигающая на уровне локальных, узкопрофильных систем десятков признаков, а на уровне более широкопрофильных—сотен признаков одновременно [114, 136]. Это видно на примере дескрипторных рефератов и приводит к выводу, что в больших централизованных фондах для их активной
Рис. 13. Схема комплектования документных фондов по широте и глубине информационного пространства
1 — фонд широкого, но неглубокого профиля; 2 — фонд глубокого и узкого профиля
ш.
деятельности каждый документ должен получить такое большое число признаков, что даже частично это невозможно осуществить.
По-видимому, универсальные иерархические классификации лучше применять на самых верхних уровнях информационного пространства (Совет Министров СССР, издательства широкого профиля, библиотеки районного или городского масштаба, где выборочно собирается учебная, обзорная, научно-популярная, классическая и современная художественная литература) (рис. 13). При этом роль центральных государственных архивов и крупнейших универсальных библиотек-хранилищ должна рассматриваться в двух направлениях: по широте нач небольшую глубину информационного пространства выделяется активный субфонд, описываемый с помощью универсальной классификации, и по глубине — пассивный субфонд с целью страхового хранения документов, которые вводятся в оборот не с помощью собственного поискового аппарата, а путем привлечения локальных отраслевых фондов, которые можно рассматривать в качестве субфондов центрального фонда.
Иными словами, если потребителю нужен документ общего назначения, он получает его непосредственно в центральном'
фонде, тогда как при поиске документа узкого значения в центральном фонде могут указать лишь на соответствующий отраслевой или территориальный субфонд, в котором по запросу выдаются либо сами документы, либо их адреса в центральном страховом фонде. Это единственная возможность обеспечить такому фонду приемлемую оборачиваемость. Пока, к сожалению, слишком много усилий тратится в библиотеках на составление огромных классификаторов и всеобъемлющих каталогов, допускается много ошибок, так как физиологически человек не может качественно разделять информационный поток более чем на 100 частей.
Вследствие названных недостатков в последнее десятилетие активизировались работы по составлению отраслевых дескрипторных словарей-тезаурусов с целью их применения при описании профильной документации. При этом, как это бывает часто с новыми методами, дескрипторный язык некоторые поспешили объявить «панацеей», предложив упразднить универсальные классификации как устаревшие. На практике в самые последние годы возникла угроза такой же участи для дескрипторных языков. Информационные работники стали понимать, что полная «анархия» с отсутствием иерархических связей между дескрипторами не оправдывает себя.
Значительно эффективнее применяются дескрипторные языки в узколокальных системах, в масштабах тематических интересов отдельных учреждений. Здесь рубрики такого словаря могут рассматривать как дела — комплексы документов. Однако и здесь возникли две серьезные проблемы, решение которых открыло путь к примирению сторонников классификационных и дескрипторных языков.
/Первая проблема заключается в том, что по закону селективности на столь большой глубине просто невозможно приписывать документу только один признак. Это особенно четко видно в специализированных библиотеках. Но даже и в канцелярии, где небольшие по информационному объему документы подшиваются каждый в свое дело, они становятся недоступными для других подразделений и требуют обязательного копирования. , • V
Вторая проблема возникла в связи с явной необходимостью по мере углубления языка, насчитывающего сотни признаков, некоторой их иерархической группировки. Так возникли локальные десятичные классификации (ЛДК), насчитывающие обычно 3—4 разряда, которым мы присваиваем условные обозначения — направления, проблемы, темы и тематические вопросы. При этом даже и здесь хорошо проявляется информационная селективность, когда в верхних разрядах документационный поток разделяется на рукава с небольшим процентом наложения (для чего вводится параметр чистота селективности), а в нижних
разрядах происходит почти полное совмещение (и здесь определяется частота совместимости).
Опыт типизации блоков ЛДК на низших уровнях народнохозяйственной иерархии сделал с целью взаимной увязки необходимым создание таких же блоков на более высоких отраслевых уровнях для более эффективного распределения получаемой сверху информации.
IПримером служат уже упоминавшиеся в предыдущем разделе, распространяемые по подписке реферативные перфокарты. Поисковый образ, закодированный на каждой карте, включает в среднем около 10 дескрипторов по четырехразрядной схеме ЛДК и один индекс УДК, унаследованный от реферативного журнала и наглядно демонстрирующий свои ограниченные возможности. Подписчик, получив перфокарты, естественно, больше не нуждается в ЛДК издателя, так как те несколько рубрик, по которым он осуществляет подписку, не могут выполнять поисковые функции. Поэтому, не меняя макет перфокарты, он перекодирует ее по своей схеме ЛДК и осуществляет тем самым многоаспектный поиск.
Таким образом, взаимодействие схем ЛДК на разных иерархических уровнях как бы отражает многомерное свойство информационного пространства, поскольку из всех блоков ЛДК отнюдь нельзя собрать единую (универсальную) схему. В действительности это — лишь иерархическая система локальных классификационных схем.
Перечислим некоторые другие преимущества ЛДК: || простота составления, принимаем во внимание, в частности, и то, что каждая такая схема приблизительно согласуется с реальной административной структурой; 2) простота в изменении (упразднение и ввод новых рубрик и даже блоков ЛДК), без ломки всей системы, что особенно важно в современных условиях быстро меняющейся информационной обстановки; 3) простота в обращении, в частности простота кодирования (см. стр. 91).
К вопросам практического применения ЛДК мы еще вернемся в главе «Документационные процессы».
3.7. Ссылки
В научной литературе и в некоторых других жанрах документов (например, в юридических актах) принято делать ссылки на документы, послужившие автору отправным пунктом. Но самое большое развитие институт ссылок получил, конечно, в науке.
Подсчитано, что в среднем каждая научная статья содержит семь библиографических ссылок. Это позволило Д. Прайсу [95] и В. В. Налимову [93] назвать науку семиполой развивающейся системой, где семь особей, как правило, рождают новую особь —* статью.
Научная ссылка составляется по трафарету полного или сокращенного библиографического описания, включающего фамилию и инициалы автора, источник (журнал, книжное издательство или архив) и место его нахождения (кроме известных журналов и международных издательств), год, номера тома, выпуска или единицы хранения, а также часто полное название документа, способ фиксации (для нетипографских изданий) и номера страниц. Ссылки группируются по фамилиям авторов или в порядке цитирования причем в отечественной гуманитарной литературе общий список может отсутствовать и ссылки приводятся в подстрочных примечаниях. Если же бывает и то и другое, то в подстрочных ссылках автор фиксирует формальные выходные данные, иногда по частным поводам, а в конце приводит тщательно подобранную библиографию.
До последнего времени литературные ссылки рассматривались не более как традиция—день уважения предшественникам, утверждение приоритетов и авторское намерение показать свой вклад, часто понизив его.
В структуре ссылок прежде всего следует обратить внимание на соотношение жанров. Известно, что в научной периодике принято ссылаться в основном на статьи, а не на книги. На последние приходится їв среднем около 10% ссылок и столько же (или немного более) [37, 136] — на сборники; хотя в нашей стране сборники и журналы находятся приблизительно в равном количественном соотношении, но первые разыскивать, конечно, бывает труднее, чем вторые. На патенты в журналах ссылаются в 1% случаев [207]. Что касается исторической литературы, то там нередко разделяют библиографические и архивные источники, неправомочно называя источниками только последние из них.
П. Атанасиу [136] перечисляет следующие мотивы ссылок: 1) оригинальный научный вклад; 2) совпадение взглядов и продолжение идей; 3) изменение, совершенствование и отрицание предшествующих результатов; 4) только библиографический вклад. При этом в одном случае из десяти автор ссылается на свои предыдущие работы, в одном случае из пяти —на публикации в этом же журнале и вообще очень часто делает упор на начальников и друзей в ущерб" своим конкурентам. В свою очередь данный орган печати оказывает на автора давление в отношении общего количества ссылок, работ чисто теоретического или, наоборот, прикладного характера, внеотраслевых, периферийных или зарубежных источников.
В последнее время наметилась явная тенденция чаще ссылаться на неопубликованные и недокументальные источники.
Это связано отчасти с деятельностью незримых научных коллективов из-за межотраслевого характера развития современной науки. Незримые коллективы получили свое название потому, что они не вписываются в существующие административные — ведомственные и даже государственные — структуры: ученые и инженеры, работающие в разных сферах науки и производства, в разных городах и странах, объединяются для решения важных для них
Рис. 14. График распределения биб- ИШ ТаКЗЯ K00nePaH лиографических ссылок на примере позволяет лучше организо-
вать сбор внешней инфор-
Сплошная линия—отечественные; преры- мации, обмениваться ре-
вистая — иностранные публикации
принтами и препринтами своих работ, а также рабо-
тами, только подготавливаемыми к публикации (препрепринты), для скорейшей апробации и ввода «в научный оборот новых идей. В связи с этим научные нормы, действующие в науке вообще и в каждом незримом коллективе, в частности, не только позволяют, но и требуют ссылаться в равной степени на работы опубликованные, официально принятые к печати и находящиеся в процессе подготовки.
Распределение ссылок по годам позволяет составить график, показывающий: 1) читательский период — время, прошедшее от года максимального использования литературы, которому соответствует пик на графике, до момента чтения; 2 издательский период —- то же время до момента выхода документа в свет; 3) авторский период — то же время до момента окончания работы по составлению библиографии; 4) период двойного прироста используемой литературы (до пика на графике); 5) период полу старения информации — среднее время, за которое количество ссылок сокращается наполовину («после пика на графике).
На рис. 14 приведен график, составленный по библиографии в конце этой книги. Нетрудно увидеть, что авторский период 'составляет здесь для отечественной литературы 2 года, для иностранной — 8 лет, период двойного прироста — соответственно что-то около Уз и 2 года, период полустарения — немногим более 1 года.
Такой же график для [91] дает величину авторского периода в 5 лет, период двойного прироста — около 2 лет, период полустарения— около j 2,5 лет.
Ш 70 Ш 66 Щ 62 60 55
данной книги по годам
Более достоверные данные могут быть получены, естественно, для комплекса работ по данной тематике.
Продолжительность авторского периода характеризует умение работать с литературой, уровень информационных связей и вообще результативность тех усилий, которые автор тратит на сбор и обработку информации. Эта же величина, рассчитанная для комплекса работ, будет говорить о постановке информационного обслуживания в данной отрасли и, таким образом, является косвенным экономическим показателем. Нечто подобное можно видеть на графике рис. 2, где степень доступности отраслевой информации служит функцией ее относительной ценности.
Разные авторские периоды для отечественной и иностранной литературы указывают на существование информационных барьеров— географического, государственного, языкового, экономического. Возрастание в целом авторского периода и соответствующей разницы для отечественной и иностранной литературы характерно для периферийных научных учреждений.
Период полустарения литературы (по аналогии с периодом полураспада атомов радиоактивных элементов) отражает темпы развития данной отрасли знания и, следовательно, ее актуальность.
(17)
(18)
Количество устаревшей информации di за время dt пропорционально общему количеству информации і и этому времени
— di—Xidty
где X—коэффициент пропорциональности, константа старения, меняющаяся во времени и в информационном пространстве. Если обозначить начальную информативность документа через Щ а спустя некоторое время t информативность будет it, то
= і0ехр(—Щ
Т — период полустарения, а время теоретического устаревания документа т—1,443Г.
Продолжая аналогию с периодом радиоактивного полураспада, следует отметить, что достоверность определяемого на основе его абсолютного возраста горных пород подвергалась большому сомнению из-за грубых расхождений с данными относительного возраста. В действительности оказалось, что сам факт этих расхождений дает не менее ценную информацию о геологических событиях, повлиявших на историю данных пород. Также и в отношении периода полустарения можно сказать, что, поскольку не только этот фактор понижает информативность документов, всякое отклонение можно рассматривать как проявление одного из таких факторов (например, несовершенство системы поиска) и, с другой стороны, производить необходимые уточнения величины периода полустарения.
В связи с этим представляет интерес проявление того, что мы называем классикой в науке. Присутствие на кривой уменьшения числа ссылок второго пика служит указанием на наличие
группы авторов, так сказать победивших время и которые поэтому вправе именоваться классиками. Однако в нормальном процессе развития пауки, как 'бы ни были велики заслуги того или иного исследователя, непосредственно на его работы постепенно перестают ссылаться. В. В. Налимов назвал это «эффектом сбрасывания авторитетов» 1136].
Обращаясь к цитированной литературе и в свою очередь к той литературе, к которой отсылает она, мы можем по цепочкам ссылок проследить историю развития тех или иных идей и тот вклад, который сделал автор, либо одна его публикация, в этот процесс.
На рис. 15 показана такая ситуация. В ней участвуют 8 авторов. 1-й из них высказал идею (№ 15), которая была почти в одно и то же время подхвачена другими; 2-й автор, сославшись вначале (№ 21) на № 15, стал развивать идею самостоятельно и в дальнейшем цитировал только самого себя (№ 15, 8, 3); 3-й автор также, по-видимому, подхватил эту идею и стал развивать ее, но при этом ссылался только на свою первую работу (№ 19); 4-й автор (с № 20) и 5-й (с № 18) ссылались на № 15 и друг на друга. Заслуга 6-го в том, что в своей работе (№ И) он сумел объединить все, что говорили 5-й (№ 14) и неизвестный до этого 7-й автор, которому, собственно, и принадлежит приоритет, так как его первая работа (№ 29) вышла на три года раньше № 15. Параллельно с этим 7-й автор развивал еще одну идею (№28 и 26), которую объединил затем с первоначальной в № 22. Роль 8-го автора і (№ 7) чисто эпизодическая, но 6-й автор * в последующих работах, кончая № 1 (послужившей отправной в данном анализе), раскрыл и объективно представил всю ситуацию, дополнив известные данные собственными исследованиями.
23.
Рис. 15. Модель развития научных идей по данным анализа ссылок
Другой метод основан на противоположном принципе: в основу берется не заключительная, а отправная работа и оценивается вклад, который она вносит в последующее развитие идей. Этот метод более трудоемок, так как требует просмотра очень большого числа документов, если принять іво внимание, что ссылки на данную публикацию могут быть не только в отечественной, но и в зарубежной печати, не только в пределах данной
Да-
Рис. 16. Метод классификации ученых-авторов на основе библиографических ссылок
/ — частые ссылки автора на самого себя; ii — на других авторов; iii— щщ других авторов на этого автора
1
отрасли, но и в других отраслях. Благодаря действующей в США системе на базе ЭВМ «Scientific Citation Index» [114], охватывающей, однако, далеко не все научные публикации, оказывается возможным получать справки, кто, когда и где ссылался на любую научную статью. Подобный анализ, сделанный по всем работам одного лица, позволяет составить его творческую биографию в виде кривой цитируемости, фиксирующей всплески творческой активности и степень устаревания опубликованной информации щ
Таким образом, на основе анализа ссылок, классифицируемых с помощью вопросов (рис. 16), выявляются своеобразные черты авторской личности. Много ссылок на других может говорить о соблюдении научной этики и о знании литературы, а также об известной осторожности, а частые ссылки на самого себя — о систематичности и последовательности работы. Отсутствие ссылок на работы данного лица может указывать на очень многое: или эти работы не представляют научного интереса, или опубликованы в недоступных изданиях, или их значение только в будущем. Во всех случаях нужен серьезный анализ тех или иных «цитационных» отклонений и следует избегать опрометчивых выводов.
Изучение совокупности работ многих авторов позволяет подняться еще на одну ступень и оценить вклад в мировую науку
отдельных научных коллективов (школ), отраслей и целых стран. Этот фактический вклад нужно отличать от номинального вклада, выражаемого 'В таких косвенных параметрах, как объем ассигнований, техническое оснащение, число научных работников, количество органов научной печати и общее количество публикаций. Дело в том, что, изучая научный фронт, мы видим неравное участие и положение отдельных партнеров: одни идут впереди, вторые все более отстают, третьи догоняют и перегоняют, четвертые занимают стабильное положение за лидером или в конце, пятые более предпочитают покупать -результаты исследований, чем самим заниматься ими.
Классификационно-деокрипторный анализ ссылок—по изменениям информационной нагрузки отдельных деекрипторов-руб- рик — позволяет делать краткосрочные прогнозы, выявляя более перспективные и менее перспективные направления в развитии науки и техники. Одновременно с этим можно производить поиск публикаций, особенно по смежным проблемам [162] и когда факт ссылки на данного автора уже многое говорит [37].
Все описанное выше объединяется сейчас в самостоятельную научную дисциплину—наукометрию [37, 93],— находящуюся на стыке математической статистики, теории научно-технической информации, науковедения и документалистики.
3.8. Приложения
Приложениями к документу являются: 1) предисловие или послесловие редактора, переводчика или составителя; 2) комментарии; 3) указатели — авторский и предметный; 4) самостоятельные документы, служащие дополнительным, объяснительным или подтверждающим материалом к основному документу. Формально приложением можно назвать и описок литературы, но в научной практике он считается неотъемлемым атрибутом законченного сочинения и выделяется лишь тогда, когда библиография носит вполне самостоятельный характер и не служит объектом прямых ссылок.
Предисловие и послесловие в качестве приложения иногда дублируют соответствующие элементы авторского текста, сообщают необходимые сведения об авторе и его информационном окружении, а также дают критический разбор произведения.
Тем же целям служат комментарии с присовокуплением дополнительных сведений, повышающих информативность произведения, первоначально рассчитанного на несколько иную аудиторию (в историческом, национальном или общественно-политическом аспекте). При этом выделяются чисто справочные данные: словарь незнакомых терминов и условных обозначений, таблица мер и весов и т. п.
Указателями стараются снабжать крупные монографии и документные комплексы: собрания сочинений, годовые тома журналов, канцелярские дела и целые фонды. В первом случае этим занимается сам автор, формализуя тем самым тезаурус своего произведения. В остальных случаях составители стараются подчинить содержание интересам конкретных потребителей.
По существу указатель к документу следует рассматривать как его более расширенный поисковый образ (относительно заголовка и оглавления). Если при этом достигнута достаточная степень детализации и удобства в том смысле, что каждый дескриптор отсылает не только к странице или разделу, а к отдельному абзацу (при детализованной схеме ЛДК), то читатель получает достаточно эффективное средство поиска и выборочного чтения. Однако в подавляющем большинстве монографий, особенно в последнее время, такие указатели отсутствуют; в журналах (в каждом последнем или первом номере года) они слишком неглубоки, ограничиваются несколькими самыми общими рубриками; в реферативных журналах указатели, как правило, ограничиваются несколькими дескрипторами заголовка [233] и выходят к тому же с большим опозданием в качестве отдельного издания. В результате, по данным опроса [204], авторскими указателями к реферативным журналам пользуются 5% научных работников, предметными указателями — 7% и обоими вместе — еще 6%.
В последние годы получили распространение новые виды вторичной информации: фотокопии оглавлений к журналам и пермутационные указатели, о которых говорилось вначале (раздел 1.2.). Недостаточная популярность первых объясняется тем, что некоторые /сводят к ним всю проблему вторичного информационного обслуживания, а вторых —тем, что указатели, составляемые с помощью электронной вычислительной машины в виде поалфавитных списков некоторых дескрипторов из заголовков, способствуют тем самым большим информационным потерям и печатаются неудобочитаемым шрифтом.
Одна из интересных возможностей хорошо составленного указатели — выявление информационной структуры документа. По ссылкам на разделы и подразделы определяется число дескрипторов (относительно всего дескрипторного словаря), приходящееся на единицу информационного объема (рис. 17). Как правило, величина удельной емкости подвержена существенным колебаниям, обнаруживает тенденцию к увеличению в заключительных подразделах. Что касается новых дескрипторов, отсутствующих в предыдущем разделе, то максимум их обычно приходится на первый подраздел и затем процесс обновления постепенно затухает. По .информационной структуре можно выявлять «сжатые» и «растянутые» участки текста и проверять внутреннюю логику изложения,
4* 90
Если документ по своему содержанию соответствует неглубокому положению в информационном пространстве, то, согласно закону информационной селективности, многие дескрипторы указателя будут иметь небольшое число отсылок, но к крупным кускам текста. С глубиной информационного пространства больше проявляется его многомерность, и при одноканальном характере изложения по разным аспектам автору приходится возвращаться к одному н тому же несколько раз. В результате возрастает численность дескрипторов с многими отсылками, , но к более мелким отрывкам текста. Таким образом, величина отношения числа отсылок к общему объему текста, соответствующего данному дескриптору, показывает степень его отклонения от главного аспекта повествования
т
И/.
щ
Отсюда средняя аспектность дескрипторов указателя имеет вид м
ЫдГ' щ
где М—-число дескрипторов в указателе, отражая положение по глубине информационного пространства. Более низкие значения | отвечают взаимоисключающим признакам, характерным для небольшой глубины, когда логика изложения очень проста, поскольку объединяет в одну цепь звенья нескольких крупных вопросов. При высоких значениях g налицо параллель-
ню
т
5. 6.
Щт
20
10
Рис. 17. Информационная структура, составленная по предметному указателю (дес- крипторному словарю) на примере данной книги
Сплошная линия — процент дескрипторов в разделе (по двухразрядной схеме ЛДК); прерывистая — процент новых дескриптооов (относительно предыдущего раздела)
90 v;%
ные признаки, характеризующие более глубокую проработку материала и >по достаточно узкому вопросу; здесь логика изложения более сложна и требует тонкого подхода, чтобы проложить оптимальный путь среди множества разноаспектных вопросов.
Для более . ясного понимания, по аналогии с примечанием на стр. 90, приведем два разных примера:
<1. Составив указатель к библиографии древнего мыслителя, мы увидим, что дескрипторы характеризуют отдельные этапы его отнюдь не пестрой внешними впечатлениями жизни, выделяемые по местностям, где он проживал, и людьми, с которыми встречался. В противоположность ему современный человек благодаря существующим коммуникациям имеет больше возможностей менять обстановку и встречаться со многими людьми, разумеется на более короткие сроки, но, может быть, и по многу раз.
ВО
2. Указатель к реферативному журналу универсального профиля включает в общем разные и нечасто повторяющиеся дескрипторы. Напротив, в узкоспециализированном реферативном органе во множестве однотипных рефератов будут часто повторяться одни и те же дескрипторы.
Процесс развития данной отрасли знания отражается также на конфигурации кривой распределения аспектности дескрипторов. Ранговая расстановка дескрипторов по аопектности и по значимости (информационная нагрузка) довольно верно представляет картину содержания текста, делая указатель развернутым поисковым образом документаК
Документы, выступающие в качестве приложений, часто фигурируют в административно-управленческой практике, где основной — головной — документ выполняет чисто юридическую, сопроводительную функцию, а многолистное приложение — трайлер,-Ш.поступая в другую информационную систему, освобождается от его зависимости и приобретает самостоятельное значение. В научно-технической информации такую же роль играют методические прописи, результаты анализов и испытаний, производственные дневники, подлинные тексты документов для юридического или исторического доказательства во всех случаях, когда они не вкраплены в текст, что особенно типично для дипломных работ, диссертаций .и отчетов. В периодической печати (в основном художественно-публицистической) приложения представляют гипертрофированные рубрики, не соответствующие прямо основному профилю данного органа (экономическое приложение в политическом издании и, наоборот, книжное приложение к общественно-художественному журналу и т. п.).
♦ * *
В заключение подчеркнем те основные функции, которые выполняют элементы традиционного вспомогательного аппарата документа. Адрес или позитивный гриф, классификационный индекс, реферат, аннотация и заголовок служат ориентирами в потоке информации, гарантируя или только повышая вероятность попадания документа к потребителю. Внешнее оформление, заголовок, аннотация, оглавление, указатели подготавливают его: психологически настраивают, знакомят с идеей, содержанием, допуская в отдельных случаях выборочное чтение. Некоторые другие элементы обеспечивают иные, не менее важные функции, но все это в современных информационных условиях признается далеко не достаточным.
4. матричные документы
4.0. Кодовая (поисковая) матрица.—4.1. Карты с краевой перфорацией—4.2. Щелевые перфокарты.—4.3. Карты-решетки.—4.4. Просветные (суперпозиционные) перфокарты.— 4.5. Машинные перфокарты и перфоленты.—4.6. Фотографические микрофильмы и микрокарты.—4.7. Документы с магнитной матрицей.—4.8. Документы со знаковой матрицей.— 4.9. Сравнительные характеристики матричных документов
4.0. Кодовая (поисковая) матрица
Матричный документ, иногда называемый также «кибернетическим», имеет кодовую матрицу, которая занимает всю его площадь или только часть ее, оставляя место для основной, потребительской .информации.
Кодовая матрица состоит из ячеек, с помощью которых производится кодирование информации с целью «поиска, автоматического ввода или вывода из вычислительных, передающих и других устройств. В связи с этим коды разделяются в первую очередь на преобразующие и поисковые.
Преобразование производится при переводе информации из одной недокументальной формы в другую, из недокументальной формы в документальную и наоборот и при перезаписи информации с одного носителя на другой. При этом используется один и тот же язык либо делается перевод с одного языка на другой, следствием чего являются потери информации.
Поисковые коды в свою очередь различаются по назначению (выборка, разделение, соотнесение, комплектование и др.). Обращенной (инверсной, инвертированной) называют поисковую систему в том случае, когда матрица соотносится не с объектом поиска, а с поисковым признаком и соответственно ячейки фиксируют не признаки, а объекты. Назначение поисковой матрицы— осуществлять многоаспектный (многоканальный) поиск, т. е. реализация таблицы с множеством входов. Если же система одноаспектная, то это дает возможность быстро устанавливать наличие данного объекта и быстро извлекать его при беспорядочной расстановке всех объектов в системе.
По своему положению на площади документа матрицы бывают краевыми и внутренними. Для удобства все ячейки группируются в ряды и колонки. Одна ячейка или группа ячеек, объединяемая общим позиционным кодом, называется позицией. В целом матрица разделяется на изоаспектные поля, соответст-
можности кодировать mj»®™-»— ЩияяЯЮщ ЯВ уступая решеткам іпо остальным характеристикам. Я б. Машинные .перфокарты рассчитаны на большие по объему массивы и взаимоисключающие признаки с разной чистотой селективности; при этом первое место они занимают по популярности.
- Микрофильмы не дают особенно высоких показателей но занимают относительно хорошее положение по надежности и долговечности.
- Микрокарты рассчитаны на большие массивы, универсальны в отношении типов признаков и видов кодирования, позволяют на большой матрице кодировать пространную сумму поискового образа и искать документы.по такой же большой сумме поискового запроса, отличаясь при этом большой долговечностью.
- Магнитные карты при тех же положительных характеристиках обладают также хорошей адаптивностью, но-уступают микрокартам по объемам массивов и долговечности.
- Знаковые карты — единственные из машинных носителей— имеют большой физический объем текстовой зоны и по объему массивов занимают третье место после микрокарт и машинных перфокарт.
Выявление этих особенностей позволило на втором этапе развития матричного метода приступить к разработке комбинированных форм документов. В табл. 8 приведены известные 14 вариантов таких сочетаний, из которых самыми популярными являются рейтерные просветные карты, щелевые, просветные и карты-решетки с краевой перфорацией.
Одновременно в связи с неодинаковым распространением разных типов перфокарт уже применявшиеся ранее типы часто используют в качестве других типов: машинные перфокарты с краевой перфорацией Ш как просветные и карты-решетки; щелевые — как просветные и решетки; с краевой перфорацией — как рейтерные, просветные и решетки и т. д.
Таким образом, главная задача при разработке любой документальной системы — это выбор и надежное обоснование типа матричного носителя.
•g ДОКУМЕНТАЛЬНЫЕ ПРОЦЕССЫ
5 1. Составление документа,—5.2. Репродуцирование и размножение — 5.3. Преобразование,— 5.4. Передача,—5.5. Сбор,—5.6. ЩШстЩ ние — 5.7. Хранение и поиск.
Документальная система представляет собой комплекс взаимосвязанных процессов составления и последующей обработки документов. На рис. 58 показана общая структура такой системы на основе шести главных процессов. Симметричный характер схемы не является случайным, так как процесс хранения можно рассматривать как передачу во времени, а передачу— как хранение в пространстве; с другой стороны, поиск является синонимом понятия «прием из массива», а прием, если он не ограничивается адресной информацией, часто носит характер активного поиска; синоним последнего процесса — сбор информации — может соответственно, быть использован и в отношении организованных массивов. Между процессами чтения и записи находится важный, но недокументальный процесс и поэтому не указанный на схеме — переработка информации — «мозг» системы, функции которого выполняет человек или электронная вычислительная машина. И наконец, процесс записи включает три самостоятельных, но тесно связанных процесса: составление документа, репродуцирование- размножение и преобразование, которые ниже будут рассмотрены в отдельности.
Рис. 58-. Схема документальных процессов
Специализация документальных систем заключается в усилении роли отдельных процессов— хранения (библиотека, архив), поиска (справочное бюро), сбора (разведка),
Передачи (почта, телеграф), размножения (типография). Но системы, строго ограничивающие себя каким-нибудь процессом* практически не могут существовать. Так, в библиотеке, напри-' мер, процесс хранения обязательно сочетается со сбором (комплектование), поиском (каталог), чтением (читальня), передачей (абонемент).
Соответственно к каждому из этих процессов применим комплекс эксплуатационных параметров (табл. 7), увязываемых между собой и определяющих параметры работы системы | целом.
И еще одно замечание, прежде чем перейти к рассмотрению отдельных процессов. Среди большого круга документальных систем, где информация на всех или только на некоторых этапах носит фиксированный, документальный, характер, выделяются собственно документные (или документационные) системы с документами в качестве объектов информации, в отличие от других, недокументных систем, где объекты информации — люди, материалы, оборудование, сведения о которых обязательно оформляются в виде документов, и поэтому такие системы все-таки называются документальными.
5.1. Составление документа
Возросшая роль документальных систем (и в связи с этим расширение понятия «документ») имеет прямое отношение к эволюции общественных отношений, когда так называемая «устная» информация почти повсеместно уступает место информации «письменной». При этом происходит перераспределение главных форм документации: резко увеличиваются объемы публикаций, а в составе непубликуемой информации возрастает значение машинописных работ.
Однако машинописные работы имеют свою специфику, и как бы ни росла административная система, штаты машинописного бюро не могут прямо коррелироваться с этим и на определенном этапе развития должны стабилизироваться за счет перераспределения функций печатания, копирования и перепечатки документов.
Небольшие по объему документы на дежурной машинке административный работник печатает сам, пространные тексты также печатает, но как черновики, чтобы потом машинистка перепечатала их набело — значительно быстрее и с меньшими ошибками, чем если бы она разбирала рукописный текст.
Существует метод диктофонной записи, когда работник, сняв телефонную трубку, набирает номер службы звукозаписи, включая тем самым свободный диктофон, называет форму документа и диктует текст. При этом записывающий механизм начинает работать только от голоса и при паузах останавлива-
S ЧеМ психологически не травмирует диктующего свбим Г язчивым ожиданием. Машинистки затем печатают по поряд- 11)3в"оКументы, с помощью педали воспроизводя на слух отдель- И,„ куски текста.
[ диктофонная запись производится на гибкий пластиковый I иск или манжету объемом 10—15 мин диктовки (около 5 ар. Машинописного текста), которую можно отправить по почте в ! МоНверте, подшить в дело или хранить в кармане кляссерной Ваоты. Специальные марки диктофонов позволяют повторить I последние 5 мин прерванной записи, путем маркирования быст- I 0 отыскать нужное место, стереть и записать вновь неудачную I La3y в процессе редактирования сделанной ранее записи. Пор- I Дивный диктофон легко можно взять с собою в дорогу и поль- I 3оваться им даже при отсутствии электросети. Непрерывная I диктовка в течение 5'/г час обеспечивает работу четырем ма- I шинисткам.
Диктофонный метод получает сейчас широкое распростра- II неНие и в нашей стране и явно вытесняет стенографию по эко- I комичности, удобствам и быстродействию, так как исключает I процесс промежуточной записи.
г Скорость выполнения собственно машинописных работ по- і вышается, если использовать электрические пишущие маши- I ны — флексорайторы, о которых мы упоминали в разделе 4.5. I Эти машины снабжены кулачковым буквопечатающим механиз- I мом, заменяющим литерные рычаги и исключающим, таким об- I разом, возможность их сцепливания при быстром печатании. I Благодаря этому скорость работы на флексорайторе достигает I 300 ударов в 1 мин или даже больше. Перфолента, на которую і синхронно кодируется текст, может неоднократно автоматиче- I ски воспроизводить его, при этом в 4—5 раз быстрее, чем ма- [ шинистка.
Серьезную проблему представляет процесс вывода информации из ЭВМ (например, на бумажной ленте —табуляграмме), скорость которого, как и скорость ввода, еще не соответствует быстродействию механизма переработки информации.
Рационализация процесса составления документов преследует максимально возможную и целесообразную формализацию, с переходом от вольных литературных текстов к произвольным анкетам, а в трафаретных текстах — от неполных принудительных к полным анкетам, вплоть до кодовой формы, одинаково удобной для считывания человеком и машиной. Цель J всего этого — уменьшить время на составление и чтение каждого документа, по возможности изъять из него бесполезную информацию, обеспечить механизированную и автоматизированную обработку, снизить издержки. Каждое поле трафаретной записи можно, таким образом, отождествить с аспектным полем кодовой матрицы, рассчитанным на конечное число параллельных или взаимоисключающих признаков.
К вопросу, задаваемому автору записи, предъявляются сщ дующие требования: ясность, простота, целесообразность, оригинальность, привлекательность, корректность и простота ответа От этого зависит достоверность фиксируемой в документах особенно в социологических анкетах, информации в отношении полноты, валадности, правдивости и общей надежности системы.
Первое требование предусматривает изменение формулиро вок в зависимости от образовательно-культурного уровня и профессиональной категории опрашиваемых.
Недопустимо, чтобы вопрос был очень ,СЛОЖНЫЙ, требующий продолжительного раздумья и увеличивающий вероятность того что автор ответит неправильно, остановится на первом пришел-' шем в голову варианте или оставит вопрос без ответа.
Ни один вопрос не должен вызывать сомнения в его целесообразности. За исключением некоторых юридических форм необходимо обязательное сотрудничество автора анкеты с автором формы. В недоработанной форме всегда присутствуют нелепые по содержанию вопросы, подобранные случайно и часто без критического обоснования позаимствованные из других форм (например, из личного листка по учету кадров в различные учетные формы попадают вопросы о поле, возрасте, национальности, рабочем стаже без ясного понимания, для чего они нужны).
Вопросы, оригинальные по форме и интересные по содержанию, обеспечивают самую высокую надежность ответов.
Корректно поставленные вопросы не содержат в себе какой-либо установки и не затрагивают престижа опрашиваемого. Зачастую установка кроется в утвердительной форме вопроса: «По утрам Вы занимаетесь гимнастикой?» И тогда некоторая часть пассивных авторов говорит неправду, потому что ответ «нет» требует известной принципиальности. На примере данного вопроса установка снимается отрицательной формой: «По утрам Вы не занимаетесь гимнастикой?» Или же предусматриваются неальтернативные варианты ответа: «Сколько времени Вы посвящаете утренней гимнастике?—до 5 мин, от 5 до 15, свыше 15 мин.» По той же причине нельзя считать ответом отсутствие ответа, выражаемого в физической записи (слова, знаки, черта под нужным вариантом), так как пассивные авторы при отсутствии должной заинтересованности, будут преднамеренно выбирать вариант, фиксация которого связана с наименьшими физическими усилиями.
Престижность тесно связана с установкой, так как здесь также предопределяется ответ. Ниже приведены примеры снятия престижности в анкетных вопросах различными методами.
Ц Смягчающая формулировка: Я нравлюсь большинству людей, которые меня знают.— Думаю, что произвожу благоприятное впечатление на людей, которые меня знают. 2. Отвлекающий акцент (переакцентировка): Я не люблю командовать
W ми«Jответственность меня пугает.— Ответственность от- RaeT меня, и поэтому я не люблю командовать. 3. Оправды- Ряюшие обстоятельства: Я занимаюсь нетворческой научной аботой.-— Почти все время у меня отнимает нетворческая научая работа. 4. Перефразировка: Миритесь ли Вы с обстоятель- твами? -IНепримиримы ли Вы?
С Если престижность нельзя снять полностью, анкета должна 6Ыть обязательно анонимной.
I высоконадежных тестах для обоснования каждой характеристики используются десятки вопросов, половина которых поставлена в утвердительной форме, а другая половина —в отрицательной, чтобы снять установку. Кроме того, одни и те же вопросы повторяются в разных вариантах, чтобы выявить валидность, т. е. насколько автор был внимателен при ответах. Специально подобранный список престижных вопросов с практически одним приемлемым вариантом ответа («ловушкой») J служит «детектором лжи» с целью оценить искренность автора, f Если по искренности и валидности автор не набрал нужного ко- I личества очков, результаты тестирования считаются недействи- [ тельными.
•При небольшом числе вариантов ответов необходимо при- | водить их в трафарете все, чтобы авторы только подчеркивали г выбранные значения. При большом числе вариантов приводят- І ся только наиболее часто встречающиеся, а для остальных отво-