Документ: информационный анализ
Вид материала | Документы |
Содержание1. Документальная информация |
- О публичном отчете образовательного учреждения, 44.82kb.
- Информационный бюллетень анализ динамики наркоманий, хронического алкоголизма и алкогольных, 258.01kb.
- 1. Затвердити державні санітарні правила "Основні анітарні правила забезпечення радіаційної, 3053.42kb.
- Опубликовано: ноябрь 2008, 1823.52kb.
- Функционально-стоимостной анализ и имитационное моделирование, 681.58kb.
- Перечень документов, необходимых для начала проведения аудиторской проверки, 130kb.
- Вопросы к экзамену по дисциплине «Анализ финансово-хозяйственной деятельности», 57.22kb.
- «Россия: ценности современного общества» инсор, 993.55kb.
- План рекламы документ, определяющий порядок проведения рекламных мероприятий в рамках, 151.75kb.
- Генеральный план стратегический документ территориального планирования 4 2 Анализ использования, 369.26kb.
1. ДОКУМЕНТАЛЬНАЯ ИНФОРМАЦИЯ
1.1. Природа и свойства информации.—1.2. Жанры документов.— 1.3. Человек и документальная информация
1.1. Природам свойства информации
Пока еще нет единого, универсального определения информации, а существующие определения стараются отразить сначала философскую сущность, а затем самые важные ее свойства [15, 41, 51,52, 125, 147, 151].
Можно говорить, что информация наряду с массой и энергией характеризует материю и является мерой ее неоднородности в пространстве и во времени. Единица информации бит — тот минимум сведений, который несет в себе разница между «да» и «нет», 0 и 1, белым и черным. Сам по себе белый цвет нам ни о чем не говорит, пока мы не увидим рядом другого цвета или, по крайней мере, представим его мысленно. Именно поэтому утверждают: «Не верьте ошибочному мнению, что факты говорят сами за себя...» [221]; "на самом деле «один факт, взятый вне связи с другими фактами, обычно не имеет никакого смысла» [111]. Образно говоря, «правда не пишется в серых тонах. Она состоит из черных и белых пятен» [252]. Следовательно, информация проявляется в сравнении и сопоставлении, в контрастности и возмущениях относительно окружающей среды. С другой стороны, отсутствие таких возмущений — это тоже информация. «Если вы возьмете достаточное количество «ничего», то в сумме получите «нечто» [111].
По А. Д. Урсулу [147], информация — отраженное, разнообразие, т. е. только то разнообразие, которое отражающий объект воспринимает об отражаемом объекте. Отсюда информация-— это особая форма связи между элементами в системе, и если нас интересуют именно эти связи, то всякую систему мы можем называть информационной.
Поток информации между двумя элементами возникает лишь при наличии некоторого потенциала со стороны источника, приемника или обоих вместе [37]. Если потенциал отсутствует или один из элементов создает отрицательный потенциал, равный либо превосходящий по значению положительный потенциал другого элемента, информационная связь между ними нарушается. В связи с этим необходимо ввести понятие информационных барьеров, т. е. тех естественных или искусственных препялч ствий, которые нужно преодолеть, чтобы обеспечить информационную связь. Для этого необходимы информационные потенциалы. Существуют три группы барьеров, которые на практике сочетаются Друг с другом: 1) объективные — независимце от источника и приемника, 2) трансмиссионные — связанные с источником и 3) рецивионные*— связанные с приемником. Графически их можно изобразить так:
Выражая распространенное мнение, Л. Стоковский как-то' сказал (JI. Стоковский. Музыка для всех нас. М., «Советский композитор», 1959), что горный цветок несет миру эстетическую информацию независимо от того, увидел ли его случайный пут- ник. Попробуем возразить на это, что в данной информационной системе мир в целом не может выполнять функций приемника; связь возникает у цветка на биологическом уровне с конкретной окружающей средой и на интеллектуальном уровне с прохожим при условии, что последний обладает некоторым комплексом (тезаурусом) эстетических потребностей — в противном случае он не обратил бы на цветок никакого внимания. Правда, однако, заключается в том, что цветок можно рассматривать в качестве потенциального носителя эстетической информации, т. е.: вне процесса передачи. Ведь в таком же положении может оказаться и книга без читателя, в которой информация все-таки есть.
Отсюда важное свойство информации — находиться в одном из двух состояний: 1) в динамике, в потоке, т. е. в процессе передачи (хранение в пространстве), и 2) в статике, в массиве, т. е. в процессе хранения (передача во времени).
С этим связана еще одна характерная черта — этимологическая двойственность: информация — вообще любое сообщение или же только новость. Примером первого подхода служит следующая цитата: «Фоторепортер — если он хочет действительно чего-то добиться,— как правило, не может удовлетвориться одним лишь сообщением. От него ждут большего: чего-то оригинального, самобытного, ждут инициативы, опыта, способности утонченного видения и выражения; все вышеприведенные требования относятся и к эстетическому уровню фотокартин. Здесь на одной информации не выедешь...» [83].
С другой стороны, такие известные грамматические конструкции, как «информационное сообщение», «информационное письмо», «информация и объявления», подчеркивают оперативность
1.1. Природа и свойства информации.—1.2. Жанры документов.— 1.3. Человек и документальная информация
1.1. Природам свойства информации
Пока еще нет единого, универсального определения информации, а существующие определения стараются отразить сначала философскую сущность, а затем самые важные ее свойства [15, 41, 51,52, 125, 147, 151].
Можно говорить, что информация наряду с массой и энергией характеризует материю и является мерой ее неоднородности в пространстве и во времени. Единица информации бит — тот минимум сведений, который несет в себе разница между «да» и «нет», 0 и 1, белым и черным. Сам по себе белый цвет нам ни о чем не говорит, пока мы не увидим рядом другого цвета или, по крайней мере, представим его мысленно. Именно поэтому утверждают: «Не верьте ошибочному мнению, что факты говорят сами за себя...» [221]; "на самом деле «один факт, взятый вне связи с другими фактами, обычно не имеет никакого смысла» [111]. Образно говоря, «правда не пишется в серых тонах. Она состоит из черных и белых пятен» [252]. Следовательно, информация проявляется в сравнении и сопоставлении, в контрастности и возмущениях относительно окружающей среды. С другой стороны, отсутствие таких возмущений — это тоже информация. «Если вы возьмете достаточное количество «ничего», то в сумме получите «нечто» [111].
По А. Д. Урсулу [147], информация — отраженное, разнообразие, т. е. только то разнообразие, которое отражающий объект воспринимает об отражаемом объекте. Отсюда информация-— это особая форма связи между элементами в системе, и если нас интересуют именно эти связи, то всякую систему мы можем называть информационной.
Поток информации между двумя элементами возникает лишь при наличии некоторого потенциала со стороны источника, приемника или обоих вместе [37]. Если потенциал отсутствует или один из элементов создает отрицательный потенциал, равный либо превосходящий по значению положительный потенциал другого элемента, информационная связь между ними нарушается. В связи с этим необходимо ввести понятие информационных барьеров, т. е. тех естественных или искусственных препялч ствий, которые нужно преодолеть, чтобы обеспечить информационную связь. Для этого необходимы информационные потенциалы. Существуют три группы барьеров, которые на практике сочетаются Друг с другом: 1) объективные — независимце от источника и приемника, 2) трансмиссионные — связанные с источником и 3) рецивионные*— связанные с приемником. Графически их можно изобразить так:
- L_(—■
- Шш
- /-н(г.
Выражая распространенное мнение, Л. Стоковский как-то' сказал (JI. Стоковский. Музыка для всех нас. М., «Советский композитор», 1959), что горный цветок несет миру эстетическую информацию независимо от того, увидел ли его случайный пут- ник. Попробуем возразить на это, что в данной информационной системе мир в целом не может выполнять функций приемника; связь возникает у цветка на биологическом уровне с конкретной окружающей средой и на интеллектуальном уровне с прохожим при условии, что последний обладает некоторым комплексом (тезаурусом) эстетических потребностей — в противном случае он не обратил бы на цветок никакого внимания. Правда, однако, заключается в том, что цветок можно рассматривать в качестве потенциального носителя эстетической информации, т. е.: вне процесса передачи. Ведь в таком же положении может оказаться и книга без читателя, в которой информация все-таки есть.
Отсюда важное свойство информации — находиться в одном из двух состояний: 1) в динамике, в потоке, т. е. в процессе передачи (хранение в пространстве), и 2) в статике, в массиве, т. е. в процессе хранения (передача во времени).
С этим связана еще одна характерная черта — этимологическая двойственность: информация — вообще любое сообщение или же только новость. Примером первого подхода служит следующая цитата: «Фоторепортер — если он хочет действительно чего-то добиться,— как правило, не может удовлетвориться одним лишь сообщением. От него ждут большего: чего-то оригинального, самобытного, ждут инициативы, опыта, способности утонченного видения и выражения; все вышеприведенные требования относятся и к эстетическому уровню фотокартин. Здесь на одной информации не выедешь...» [83].
С другой стороны, такие известные грамматические конструкции, как «информационное сообщение», «информационное письмо», «информация и объявления», подчеркивают оперативность
Рис. 2. Полнота использования научно-технической информации по различным отраслям знаний после выхода в свет (по Л. Кофновецу [60])
1 to
СП) >
/ — химическая технология: 2 — металлургия; 3—химия: 4— математика
информации, хотя и сами по себе сообщения, письма, объявления— тоже информация.
Информация в смысле «новость» может со временем устареть, т. е. потерять свою актуальность. В области науки и техники этот процесс происходит различными темпами: более медленно в таких науках, как геология, ботаника, математика (через 10 лет после опубликования устаревает 50—60% литературы), и более быстро в прикладных технических науках (соответственно 70—75%) [207]. На рис. 1 приведены графики старения военной информации [111], показывающие, что некоторые ее виды устаревают исключительно быстро.
Однако, чтобы достичь необходимой полноты и степени достоверности, требуется время. Это хорошо видно на примере газетной информации, оперативность которой можно повысить только за счет достоверности или дополнительных материальных затрат, которые могут вступить в противоречие с общей ценностью собираемой информации и издательскими доходами. На рис. 2 показаны графики полноты поступающей к потребителю информации по различным отраслям науки [60]. Эти расхождения связаны с разной актуальностью отраслей, а также с трудоемкостью процессов получения, транспортировки, хранения и поиска информации, что находит отражение в любом наниональ-
f"odb>
Рис. 1. Темпы старения военной информации (по В. Плэтту [Ml]) Информация: / — оперативно-тактиче- ская разведывательная. II — стратегической разведки во время войны, III ~ стратегической разведки в мирное время. IV — о сравнительно . неизменяемых объектах (дорогах, мостах, ресурсах)
Я Годы
■
даШРОПЕТРОЗГС1 -лік gg
ном бюджете, определяющем соотношение затрат на промышленность, науку и культуру. В свою очередь разный уровень ассигнований влияет на полноту и оперативность сбора и распространения информации в разных отраслях.
На том же рис. 2 видно, что научно-техническая информация становится относительно доступной через 40—50 лет после выхода в свет, т. е. при активной жизни одного поколения. После этого, собственно, и начинается исторический период: доступность информации вновь уменьшается, в процессе преодоления информационного барьера времени часть ее теряется, соответственно уменьшается достоверность и увеличивается ценность. Этот необратимый процесс хорошо виден на примере сравнительного анализа исторической, геологической и космогонической информации в отношении количества, точности оценок и готовности понести затраты, чтобы получить дополнительные сведения.
На доступность информации в пределах географического пространства влияет комплекс информационных барьеров. Назовем важнейшие из них [37].
Барьер расстояния (географический) определяется в первую очередь расстоянием между t и г, во вторую очередь — географическими условиями и условиями транспортировки. Последнее хорошо проявляется в организации авиаперевозок с использованием двигателей разной мощности, вследствие чего продолжительность полета далеко не всегда коррелируется с расстоянием. Разные виды информации по-разному чувствительны к барьеру расстояния. Так, в области искусства лучше всего преодолевает этот барьер музыка, значительно хуже — живопись и скульптура и совсем плохо — архитектура.
Государственный барьер связан не только с государственными границами, предоставляющими различную степень свободы в обмене информацией между странами, но и с государственной административной структурой, вследствие чего даже между республиками, находящимися в рамках одной федерации при полностью открытых границах, он может проявляться достаточно четко.
Ведомственный барьер аналогичным образом связан с административной структурой данного ведомства и в отличие от государственного барьера имеет слабо оконтуриваемые географические границы. В капиталистических странах этот барьер называется фирменным и в условиях конкурентной борьбы приобретает большое значение.
Режимный барьер —типично трансмиссионный, возводимый в одностороннем порядке во избежание утечки так называемой секретной информации в рамках государственной (в капиталистических странах — и ведомственной) структуры. Против этого барьера, собственно, и направлены каналы политического, военного и экономического шпионажа, устанавливающие режим при- иудительного обмена информацией. Высота режимного барьера имеет свои разумные пределы, чтобы от него в первую очередь не страдали собственные специалисты. Последнее объясняется одним из важных свойств трансмиссионных и рецивионных барьеров, когда элементы связи в системе выполняют одновременно функции t и г: барьер, возводимый против потока собственной информации, одновременно служит препятствием для встречной информации и способствует самоизоляции.
Экономический барьер вызывается недостаточным потенциалом со стороны приемника информации (т. е. отсутствием достаточных средств), поскольку в общественных отношениях информация играет роль товара и сопровождается соответствующими экономическими и правовыми аксессуарами.
Языковый барьер в широком смысле — это семантическая несовместимость при взаимодействии разных типов систем — биологических, общественных и машинных. Ограничив наше рассмотрение только лингвистическим аспектом, отметим, что в настоящее время люди говорят на 3100 языках. В научно-технической литературе удельный вес английского языка составляет 50%; далее следуют немецкий, русский, французский, составляющие вместе, 88%; в гуманитарных науках английский язык составляет 30%, французский—-13%, испанский—12%, русский— 6% и т. д. [20]. Перевод с одного языка на другой обходится в среднем 15—30 руб за журнальную страницу. В настоящее время языковая проблема не сглаживается, а усугубляется в результате введения в оборот языков развивающихся стран в ущерб языкам, претендующим на роль международных. По-видимому, высота языкового барьера также должна иметь разумные пределы, и если с развитием национальной культуры создается национальный информационный фонд без связи с общемировым фондом, если в маленькой стране научная статья, больше рассчитанная на международную, чем на внутреннюю, аудиторию, печатается только на национальном языке, то все это имеет отрицательное значение и способствует информационной самоизоляции.
Кроме аспектов времени и расстояния информация должна рассматриваться и в тематическом (содержательном) аспекте — по широте и глубине.
Смена так называемого дифференциального закона развития наших знаний интегральным законом связана с природой информационного .пространства, многомерность которого увеличивается с глубиной.
Моделями дифференциальных структур являются существующие универсальные иерархические классификации, пытающиеся более или менее удачно делить все сферы человеческой деятельности, используя при этом чисто цифровой (Универсальная десятичная классификация) или буквенно-цифровой (Библио- течно-библиографическая классификация) (принципы индексиро- пани я [10, 27]. По такой модели каждая отрасль знания должна получить определенный индекс, длина которого зависит от положения в информационном пространстве по глубине. Возможность бесконечного дробления классификационных рубрик и получения индексов неограниченной длины создало иллюзию действительно универсального применения данных схем. Трудности практического их применения сводились только к следующему: І) к большим затратам на разработку схем с привлечением к этой работе огромного числа специалистов; 2) к сравнительно быстрому устареванию отдельных блоков; 3) к трудностям индексирования неспециалистами-библиографами, оперирующими сложным рубрикатором и в связи с этим допускающими многочисленные ошибки | 4) к недостаточному раскрытию содержания документа, сводящемуся обычно к одному, реже двум—трем индексам.
Последнее обстоятельство оказалось роковым, когда дифференциальный закон развития сменился интегральным: усиленное развитие лолучили не традиционные научные дисциплины и их подразделения, а науки, возникшие на стыках двух или более, часто далеко отстоявших друг от друга дисциплинI; выбор классификационных индексов для них оказался более или менее произвольнымII; к тому же эти индексы оказались значительно более длинными по сравнению с индексами для старых, часто менее актуальных дисциплин; и наконец, еще более'усилилась необходимость раскрывать содержание документов с использованием многих десятков индексов одновременно, в чем универсальные иерархические .классификации явно проигрывали. Прибавим, что эти классификации .получили сейчас распространение только в области научно-технической литературы и патентной информации, в области архивного дела вопрос их применения был только поставлен [24]; что касается других областей (библиотеки художественной литературы, музеи и пр.), то там этот вопрос вообще не ставился.
Отмеченные выше трудности не преминули сказаться на практике. Так называемая оборачиваемость книжных фондов (общее число выдач книг, поделенное на число книг) оказалась в обратной пропорциональной зависимости от величины этих фондов и в крупнейших библиотеках с универсальным профилем комплектования составила ничтожную величину [20, 60].
Ухудшился профиль комплектования < специальных библиотекIII; при этом до 50—60% "каждого фонда в соответствии с запросами читателей составляет литература по смежной тематике [250, 253]. Уменьшается относительное число подписчиков на специальные журналыIV, так как интересы каждого специалиста распределены сейчас между десятками и сотнями журналов одновременно, причем в каждом из них содержится больший или меньший объем бесполезной (непрофильной) для него информации V. По той же причине отраслевые реферативные сборники предлагают 'каждому читателю 99% ненужных ему рефератов, причем этот процент можно снизить-до 97—98, разбив сборник на отдельные разделы-тетради, но не менее, -поскольку читательские интересы распределяются между многими разделами и даже многими сборниками. Между тем, по идее дифференциального закона, каждый специалист должен иметь свой печатный орган или, по крайней мере, один раздел в нем.
Такое распределение научной информации, когда частота появления .полезных статей в журнале обратно пропорциональна числу журналов, получило название закона Брэдфорда [169]. Последний вместе с законом информационной селективности, показывающим увеличение многомерности информационного пространства с глубиной [24], .может рассматриваться как частный случай более общего интегрального закона.
Описанное положение имеет место не только в области науч- но-технической информации, а везде, где используются большие объемы данных и на большую глубину. В частности, увеличенные штаты многих 'канцелярий и отделов кадров объясняются устаревшими формами одноаспёктного учета. В области искусства происходит усиленная интеграция жанров и разрабатываются формы, сочетающие временную и пространственную многоаспект- ность. Закон интеграции не затронул только небольшие документные формы универсального профиля типа районных библиотек, где собрана популярная литература по всем отраслям науки и культуры и где универсальные иерархические классификации вполне оправдывают себя.
Раскрытие новых свойств информации потребовало серьезного изучения объективных барьеров, связанных с широтой и глубиной информационного пространства, с целью успешного и у преодоления.
Один из них — профессиональный (терминологический) барьер, который можно рассматривать так же как частный случай языкового барьера. Поиски новых и приложение своих идей в смежных отраслях знания сталкивают специалистов с трудностями терминологического плана. Возникает необходимость в упорядочении терминологического языка и создании специальных органов печати, в которых авторы-специалисты предлагают профессиональные экскурсы в свои области, но не дилетантам, а специалистам из других областей [213].
Одновременно с этим с целью более успешного преодоления образовательного барьера стали разрабатываться научные основы учебно-популярной литературы с тем, чтобы сгладить трудный переход от слишком «детского» языка детских кн-ижек к слишком «взрослому» языку многих школьных учебников. Здесь необходимо отметить также, что распространенное мнение об особом математическом или музыкальном «складе» ума связано с недостатками существующих методов обучения, когда слишком высокий образовательный барьер в состоянии преодолеть только таланты. В действительности оптимальная система обучения может и обязана научить каждого основам музыкальной культуры и математического мышления.
В заключение остановимся еще на одном важном свойстве информации как форме функциональной связи между элементами в системах, усложняемой по мере усложнения самих систем.
Самая простая — это элементарная связь, которой ограничиваются информационные процессы в неживой природе. Это число электронов, свидетельствующее о составе ядра атома, и валентность как отражение строения молекулы, и магнитная буря в атмосфере Земли как отзвук процессов, происходящих на Солнце.
В живой природе элементарная информация сочетается с биологической, что позволяет организму реагировать на внешние условия и приспосабливаться к ним. При этом жизнь невозможна в информационном вакууме, т. е. без непрерывного процесса информационного обмена. В ходе жизнедеятельности организм приобретает условные/рефлексы, закрепляя их в виде безусловных рефлексов и затем передавая информацию последующим поколениям в молекулярных структурах ъ виде генетического «ода.
Следующий вид — информация семантическая (интеллектуальная), присущая мыслящему существу — человеку — и тем отличающая его от других существ. Так же, как и на биологическом уровне, человеку противопоказан семантический информационный вакуум. В процессе своей деятельности он усовершенствовал язык звуков животных, превратив его в речь, и научил- ся закреплять получаемую информацию в двух формах памяти — оперативной и основной,— причем последнюю на первом этапе развития можно было рассматривать как основной информационный фонд данной популяции. Однако при всех неиспользуемых возможностях емкость человеческой памяти небезгранична, и на последующем этапе развития объем информации, полученный популяцией, превысил возможности индивидуума. Возникла необходимость в профессиональной специализации и создании внешних органов памяти — библиотек и архивов. Для этого появились первые письменные документы, но им предшествовало, конечно, изобретение письменности.
Документальная информация считается высшей формой информации, а документальные системы — высшей формой информационных систем. При этом связь t—г существенно усложнилась, потому что документ I хотя и взял на себя формальную роль посредника в этой связи, но в действительности стал самостоятельным источником информации, так же как и образованный совокупностью документов документный фонд, D. В результате мы имеем систему тезаурусов как элемент большой информационной системы
Шш