Р. С. Гиляревский основы информатики курс лекций
Вид материала | Курс лекций |
СодержаниеЦитирование, библиографическое сочетание, социтирование Библиографическое сочетание |
- С. Н. Постовалов Программирование в системе 1С: Предприятие 7 (компонента "Бухгалтерский, 899.42kb.
- Программа № «Математические основы информатики» (элективный курс) образовательная,, 124.66kb.
- Лекция №11 Сжатие изображений Курс лекций «Алгоритмические основы машинной графики», 54.41kb.
- Основы семейной психопедагогики (курс лекций), 11111.59kb.
- О. В. Свидерская Основы энергосбережения Курс лекций, 2953.76kb.
- Курс лекций введение в профессию "социальный педагог", 4415.45kb.
- Пояснительная записка 3 Содержание разделов и тем 5 Элективный курс «Математические, 106.07kb.
- Курс лекций по дисциплине " основы компьютерных технологий" Часть I. Microsoft Word, 432.92kb.
- Урок на тему «Решение логических задач с помощью электронных таблиц ms excel\ Раздел, 149.53kb.
- Это нескучное делопроизводство, 58.75kb.
Цитирование, библиографическое сочетание, социтирование
Принцип цитирования1 был использован Институтом научной информации США, основанным в 1958 г. Ю. Гарфилдом, для создания принципиально нового вида информационного обслуживания. При поиске информации он взял в качестве индексов библиографические ссылки в документах. В выпускаемых им указателях цитированной литературы, называемых также "индексами цитирования", эти ссылки располагаются по алфавиту фамилий авторов цитированных работ с указанием сведений о документах, в которых они упоминаются. Произведения, использованные при написании статьи, составляют как бы координатную сетку для ее поиска. Если статья написана по совсем новой проблеме, не нашедшей рубрики в классификации наук, с еще не устоявшейся и малоизвестной терминологией, найти ее в потоке мировой литературы другими методами очень трудно. Указатель цитированной литературы можно представить себе как многоуровневую систему библиографических описаний документов, находящихся в обратной связи друг с другом.
Указатели цитированной литературы позволяют искать информацию по совершенно новым межотраслевым или комплексным проблемам под фамилиями пионеров и наиболее известных специалистов каждой из таких проблем. Например, для поиска литературы по цитированию достаточно знать фамилию Ю. Гарфилда, так как почти в каждой работе по этой проблеме есть упоминание о нем и его статьях. Фамилии авторов найденных работ могут в свою очередь служить входами в указатель, и за 1–5 таких итераций (последовательных поисков) все сведения об отраженной в указателе литературе по проблеме оказываются найденными.
Индексы цитирования предоставляют уникальную возможность проследить за всеми случаями применения какой-либо идеи или метода, за их критикой и обсуждением, оценить информационный вклад того или иного ученого или научной школы, степень и динамику популярности их работ. Известны случаи, когда по этим указателям предсказывали нобелевских лауреатов. Институт научной информации США выпускает указатели цитированной литературы по точным, естественным и прикладным наукам (с 1964 г.), по общественным наукам (с 1969 г.), по искусству и гуманитарным наукам (с 1976 г.), для чего просматривается около 6 тыс. научных журналов и ежегодно до 1,5 тыс. названий книг. Большинство указателей распространяется не только в обычном (бумажном), но и в машиночитаемом виде (на магнитной ленте, дискетах, оптических дисках). Нужно ли говорить о том, что осуществление принципа, положенного в основу этих изданий, стало возможным лишь благодаря компьютерам. Ведь речь идет о ежегодном библиографировании почти 10 млн ссылок.
В двух статьях E и F, например, (см. рис. 10) имеются библиографические ссылки, которые устанавливают прямую библиографическую связь между ними (цитирующими документами) и статьями A, B, C и D, которые в них упоминаются (цитируемыми документами). В указателе цитированной литературы эти ссылки, по алфавиту которых упорядочивается его массив ("цитации" по терминологии Г. Я. Узилевского, которому принадлежит данный пример), обозначают цитируемые документы, а под ними располагаются "библиограммы", т. е. описания цитирующих документов.
A C
E E
B F
E D
F F
Цитирующие документы
E
F
Библиографическое
сочетание
Цитирование
A
B
C
D
Социтирование
Цитируемые документы
Рис. 10. Схема цитирования, социтирования
и библиографического сочетания документов
Понимание потенциальных возможностей комплексирования документов по признаку общих ссылок и стремление максимально использовать накопленный массив в машиночитаемой форме повели к поискам новых путей применения метода цитирования. Еще в 1963 г. М. Кесслер в Массачусетском технологическом институте предложил считать связанными по смыслу документы, авторы которых ссылаются на одни и те же работы, а числом совпадающих ссылок измерять степень такой связанности. Этот метод, который он назвал библиографическим сочетанием документов, долгое время не имел широкого практического применения, но в 1968 г. Ю. Гарфилд использовал его для создания ретроспективной поисковой системы на компакт дисках.
По-другому подошли к этой проблеме сотрудник Института научной информации США Г. Смолл и тогдашняя аспирантка ВИНИТИ И. В. Маршакова. Они одновременно и независимо друг от друга в 1972 г. предложили считать связанными по смыслу и тематике работы, на которые совместно ссылаются авторы нескольких документов. Этот метод, чаще всего называемый социтированием, имеет другую коммуникационную основу. В каждой исследовательской области имеется некоторый набор важных работ, отражающих познавательную основу этой области. Данные работы цитируются многими исследователями и поэтому принадлежат к числу высоко цитируемых. Больше того, они часто цитируются вместе, образуя таким образом социтирование. Другими словами, социтированием принято называть одновременное упоминание любых двух или большего числа публикаций в какой-либо последующей.
Для лучшего представления разницы в этих методах выше приведена схема, на которой E и F являются цитирующими документами текущего года, а A, B, C и D – цитируемыми документами более ранних годов. Сплошными стрелками показаны связи по цитированию, т. е. E цитирует A, B и C, а F цитирует B, C и D . Тогда между цитирующими работами E и F образуется библиографическое сочетание, а между цитируемыми работами B и C – социтирование (обозначено пунктиром). Для простоты и наглядности степень связанности на схеме минимальная, хотя на практике она значительно больше (т. е. для признания библиографического сочетания между двумя работами или кластера социтирования в каждом отдельном случае устанавливается определенный минимальный порог, который тем выше, чем интенсивнее цитирование).
Между характером этих методов установления связи и областью их применения имеется существенная разница. Библиографическое сочетание – это однократно произошедший факт, поскольку E и F были однажды опубликованы со своими ссылками, и с ними в дальнейшем ничего уже произойти не может. Именно поэтому данный метод применяется для ретроспективного поиска документов, связанных между собой единством тематики, исследовавшейся их авторами.
Совсем по-другому обстоит дело с социтированием, так как связь между цитируемыми B и C может сохраняться (увеличиваться или уменьшаться) в последующие годы в зависимости от того, насколько часто они будут попарно цитироваться в новых работах. Частое социтирование указывает на их концептуальную близость, поскольку они используются как единый комплекс. Между этими работами как бы возникают невидимые связи, которые после наглядного их выражения образуют смысловые сгустки (кластеры). Совокупность таких кластеров ключевых работ, отражающих исследовательские области, представляют собой как бы карту определенной научной области, а совокупность карт – атлас науки на данный момент.
При регулярном выпуске подобных атласов (выходили атласы по биологии, биохимии, геологии, математике, вычислительной технике) появляется возможность регулярно следить за динамикой развития научных дисциплин, школ, направлений, коллективов, а, следовательно, и целенаправленно воздействовать на это развитие, т. е. управлять им. Методы библиографического сочетания и кластеризации социтирования моделируют содержательные отношения между документами, используя практику цитирования, сложившуюся при публикации научных работ. Но это не единственный возможный подход к установлению таких связей между документами, заложенных в их библиографических элементах и фрагментах текстов. В следующей лекции об информационных системах вы познакомитесь с методом логико-смыслового моделирования, а теперь мы перейдем к более традиционным видам информационно-поисковых языков.