Р. С. Гиляревский основы информатики курс лекций
Вид материала | Курс лекций |
СодержаниеРеферирование и библиографирование |
- С. Н. Постовалов Программирование в системе 1С: Предприятие 7 (компонента "Бухгалтерский, 899.42kb.
- Программа № «Математические основы информатики» (элективный курс) образовательная,, 124.66kb.
- Лекция №11 Сжатие изображений Курс лекций «Алгоритмические основы машинной графики», 54.41kb.
- Основы семейной психопедагогики (курс лекций), 11111.59kb.
- О. В. Свидерская Основы энергосбережения Курс лекций, 2953.76kb.
- Курс лекций введение в профессию "социальный педагог", 4415.45kb.
- Пояснительная записка 3 Содержание разделов и тем 5 Элективный курс «Математические, 106.07kb.
- Курс лекций по дисциплине " основы компьютерных технологий" Часть I. Microsoft Word, 432.92kb.
- Урок на тему «Решение логических задач с помощью электронных таблиц ms excel\ Раздел, 149.53kb.
- Это нескучное делопроизводство, 58.75kb.
Реферирование и библиографирование
Основой информационных изданий служат библиографические описания и рефераты. Методику их составления трудно излагать на лекциях, поэтому она изучается на практических занятиях. Здесь хотелось бы обсудить некоторые проблемы, связанные с эти и важными видами информационной деятельности. Они свидетельствуют о том, что это не просто рутинная техника, а сложные интеллектуальные процессы.
Даже самый беглый взгляд на историю реферирования, которая уходит корнями в глубокую древность, показывает, что этот вид информационной деятельности возник из потребности кратко изложить существо, основное смысловое содержание того, что мы теперь называем первичным документом. Его развитие шло от простого извлечения наиболее содержательных фрагментов текста к концентрированному изложению его определенных аспектов. К настоящему времени мы располагаем арсеналом специализированных методов как самого реферирования, включая использование формализованных схем (анкетное и избирательное реферирование), содержательного изложения текста (экстрагирование, перефразирование, интерпретацию), так и оценки рефератов. Продолжают совершенствоваться статистические, логические и лингвистические методы автоматизации реферирования.
Однако грандиозный и все возрастающий объем реферирования, исчисляемый миллионами документов в год, заставляет задуматься о целях реферирования и их возможной модификации в будущем. В соответствии с известным принципом оценивать перспективы развития как разрешение существующих противоречий, нужно эти противоречия выявить. Одним из них является многофункциональность реферата, в которой основные его функции – служить средством текущего оповещения о новых достижениях и одновременно средством ретроспективного поиска – выдвигают противоречивые требования.
При использовании реферата как средства текущего оповещения он составляется в расчете на узкий круг специалистов, занятых разработкой проблемы, которой посвящено основное содержание реферируемого документа. Состав извлекаемых из документов фактических сведений и логика изложения нацелены на решение конкретных текущих задач исследования, известных и понятных референту, который чаще всего сам принадлежит к числу активных исследователей данной проблемы.
При этом реферат является не просто индикатором необходимости обратиться к первичному документу. Он становится как бы консолидированной информацией, облегчающей принятие того или иного научного, технического или иного решения. Внимательный анализ деятельности специалиста меняет традиционный взгляд на реферат. Он выступает не как промежуточный этап на пути к первоисточнику, а наоборот, как документ, который ближе к конечному продукту информационного обеспечения, чем первоисточник.
Как средство ретроспективного поиска информации, реферат, напротив, не имеет определенного адреса и должен быть рассчитан на длительное использование и непредвиденно широкий круг специалистов, по преимуществу исследующих смежные проблемы. В этом случае для реферата важен охват всех, в том числе и побочных линий содержания реферируемого документа, а его ценность тем выше, чем более общее представление он дает не только о методах и результатах исследования или разработки, но и о позиции автора первичного документа, ходе его рассуждений и т.п.
Возникает явное противоречие, связанное с тем, что первая функция тяготеет к аспектному, анкетному, специализированному, формализованному реферированию, а вторая – к реферированию общенаучному, системому, понятийному, интерпретационному, Для первого нужен в качестве референта узкий специалист, а для второго специалист более широкого профиля и высокого уровня.
Другое важное противоречие связано с тем, что издание реферативных журналов становится частью. интегральных автоматизированных систем НТИ, их побочным продуктом при генерировании машиночитаемых баз данных. Как мы убедились, прогресс в информационной технологии в последние десятилетия намного опережает совершенствование интеллектуальных процессов. Методы реферирования не являются исключением. В течение долгого времени они развивались в расчете на логику человеческого восприятия. и до сих пор продукция реферативных служб целиком состоит из рефератов, предназначенных для традиционных реферативных журналов, т. е. исключительно для чтения их человеком (с их рубрикацией, расположением материала, дублированием рефератов в разных разделах и рубриках и т. п.).
Реферативный журнал и другие информационные издания на машиночитаемых носителях (не вполне правомерно называемые базами данных) должны быть рассчитаны, в первую очередь, как показывает и их название, на переработку электронными машинами, для которых не только не имеет смысла порядок расположения рефератов и их дублирование, но требуются и определенные правила составления. В настоящее время остро встал вопрос о необходимости автоматического извлечения из рефератов сведений для пополнения специализированных баз данных и автоматизированных интеллектуальных информационных систем (экспертных, диагностических и т. п.). Это предполагает разработку особых методов реферирования и представления данных в реферате, которые могут существенно отличаться от традиционных.
Вместе с тем реферативные журналы и в машиночитаемой форме сохраняют многие функции, которые пока не может взять на себя никакое другое издание и никакой другой вид информационного обслуживания. Они делают для исследователя обозримой не только ту область, которой он непосредственно занимается, но и смежные области, компенсируют рассеивание информации, способствуя интеграции и сохранению единства науки, служат средством косвенной оценки научного качества публикаций. Выполнение этих функций предполагает совершенствование традиционных методов реферирования и издания реферативных журналов.
Дальнейшее развитие реферирования и реферативных служб будет происходить в преодолении этих противоречий. Можно констатировать, что общенаучные функции реферативных журналов все больше превалируют над их оперативными и специальными функциями. Это может повести к разделению этих изданий на специализированные (машиночитаемые) и общенаучные (человекочитаемые), подготавливаемые в рамках единых реферативных центров по разной методике. Следует подчеркнуть, что изучение этого вопроса должно стать одной из "горячих" точек современной информатики.
Аналогичное положение наблюдается и в области библиографирования, где теория библиографического описания, в течение многих лет развивавшаяся под влиянием библиотечной каталогизации, пришла в противоречие с новой информационной технологией. Основные принципы книгоописания, сложившиеся к настоящему времени, нацелены на выбор сведений, которые содержат самые важные для идентификации данного документа признаки и определяют место его библиографического описания в алфавитном ряду других описаний.
Библиографическое описание в научно-информационной деятельности выполняет ряд важных функций, из которых две считались до сих пор основными – адресная и сигнальная. Функция адресности выполняется благодаря тому, что описание содержит необходимые и достаточные сведения для отыскания и отождествления определенных документов по их основным библиографическим признакам: фамилиям авторов и других лиц, принимавших участие в создании документа, наименованиям учреждений, ответственных за содержание и издание документа, первым словам заглавия.
При использовании традиционных библиотечно-библиографических средств информационного поиска – каталогов, картотек и указателей – обычно приходится ограничивать число авторов, имена которых служат характеристиками для поиска документов. Необходимость в таком ограничении отпадает, когда информационный поиск ведется при помощи компьютера. Это дает возможность отразить в описании и использовать в качестве признаков для поиска не только имена всех авторов, но и имена других лиц, участвовавших в создании документа – составителей, авторов отдельных глав или статей, редакторов, переводчиков и т. п.
Сигнальная функция описания заключается в том, что оно может использоваться в качестве средства оповещения о появлении документа, имеющего определенное научное содержание. Из всех элементов описания этой цели в наибольшей степени служат заглавия и подзаголовочные данные, хотя они и не всегда в достаточной мере раскрывают содержание документа. Новая информационная технология позволяет использовать значимые слова заглавия в качестве поисковых признаков, а также снимает жесткость требований к строгой после последовательности элементов описания. Однако все эти соображения, давно предвиденные в связи с использованием компьютеров, далеко не исчерпывают круга проблем, встающих перед информационными работниками в связи с необходимостью перехода на новую информационную технологию.
Новейшие исследования показывают, что сформулированные нами десятилетия назад основные функции описания сохраняются и поныне, независимо от предложений называть их по-другому: поисковую функцию – идентификационной, а сигнальную – информационной. Долгое время казалось, что книгоописание развивалось под влиянием только интеллектуальных потребностей социальной коммуникации. Лишь теперь пришло понимание того, как много для него значила ориентированность на определенные технические средства – карточные каталоги и указатели в форме списков. Именно под влиянием широкого внедрения компьютеров стали по-новому подходить к обоснованию функций библиографического описания, определению факторов, влияющих на его структуру.
Прежде всего, функция идентификации до настоящего времени выполнявшаяся всеми элементами описания, теперь во многих процессах удовлетворяется международным стандартным номером для книг и периодических изданий (ISBN и ISSN). Это в значительной мере снимает идентификационную нагрузку с других элементов описания. Новшество состоит и в том, что заголовок описания, в течение целого столетия составлявший главную заботу профессиональных каталогизаторов, исключается из состава библиографического описания и переносится во вспомогательные элементы библиографической записи, т.е. попадает в один разряд с классификационными индексами, предметными заголовками, дескрипторами и ключевыми словами.
Однако в практическом применении этого положения остается некоторая неясность. Все хорошо, пока мы не выходим за пределы применения описания в каталогах, указателях и других поисковых системах. Но ведь мы забываем обширную область литературного, так сказать, использования описания: упоминание произведений печати в тексте и подстрочных примечаниях других произведений. Здесь роль заголовка как привычного элемента в начале описания и как связующего элемента "бытового" описания с "профессиональным" (т.е. для связи ссылок в тексте и описаний в каталоге) настолько велика, что полное исчезновение заголовка из описания в будущем представляется сомнительным.
Есть еще один , на первый взгляд мелкий, но на самом деле важный аспект библиографического описания, связанный с автоматизацией библиографирования. Это пунктуация библиографического описания, выраженная ныне сложной системой так называемых разделительных знаков. Традиционно роль этих знаков, отделяющих один элемент библиографического описания от другого, исполняли обычные знаки препинания: точка, запятая, тире, скобки. На первых этапах автоматизации появилась необходимость обозначать каждое поле различающимися метками, которые заменили обычные разделительные знаки. Эти метки (разделительные знаки) были взяты из англо-американских правил каталогизации, которые восходят к первым печатным каталогам библиотеки Британского музея. В наборных кассах середины прошлого века не было достаточного числа обычных знаков препинания, и тогдашний директор Британского музея А. Паницци решил употребить для этой цели неиспользуемые литеры наборных касс: "косую" черту", "знак равенства", "плюс" и т.п. По традиции они перешли в Британскую национальную библиографию, а оттуда в международные правила книгоописания.
В нашей стране эта система разделительных знаков, которая имеет тенденцию усложняться, была введена государственным стандартом. В аналитическом описании, например, сведения о статье отделяются от названия источника знаком "двойная косая черта" (что можно видеть и в сносках этой книги). Мотивы, которыми оправдывают необходимость этих нелепых знаков, малоубедительны. Из требования автоматизации иметь при каждом элементе описания метку при вводе его в машину вовсе не вытекает необходимость выводить аналог этой метки в человекочитаемую форму описания.
Что же касается стремления сделать описание на малопонятных языках доступным для различения элементов, то это может иметь значение лишь для каталогизаторов, да и то в редких случаях. И ради этого мы заставляем миллионы людей составлять и читать тексты, в которых "неграмотно" употребляются знаки препинания. Нам эти мотивы не представляются достаточными для превращения описания в искусственную и неудобочитаемую запись. По всей вероятности, профессиональные каталогизаторы руководствуются в своей нормативной деятельности принципами, которые не в полной мере учитывают общекультурное значение библиографического описания и его фактическую роль в научной и деловой прозе. Следует заметить, что в условиях новой информационной технологии, когда масштабы библиографирования измеряются десятками и сотнями миллионов записей в год, эти мелочи оборачиваются серьезными экономическими потерями.
Этот частный пример свидетельствует о том, что и в нашей сфере развитие не всегда происходит по прямой линии целесообразности, что в нем возможны такие несообразности, как стандартизация практики, восходящей к историческим анекдотам, дань консерватизму, фетишизация узких технических требований, ослепление международной всеобщностью и т.п.
Говоря о перспективах развития этого наиболее древнего вида информационной деятельности, долгое время развивавшегося в рамках библиотеко и библиографаведения, необходимо остановиться на тенденции, наметившейся в последние годы, рассматривать библиографическое описание как особый информационно поисковый язык. Такого рода предложения неоднократно высказывались как в советской, так и в зарубежной литературе.
Изучение библиографического описания как особого информационного языка (библиографического языка) сделалось по-настоящему актуальным после того как библиографическая информация стала служить материалом для создания поисковых систем нетрадиционного типа, в которых элементы описания позволяют искать информацию по содержанию документов, воссоздавать структуру научных коммуникаций, строить кластеры научных сообществ и дисциплин.
Методы семиотики позволяют исследовать подобные знаковые системы в разных аспектах. С точки зрения синтактики (отношения знаков и их систем межцу собой) выявляются правила построения библиографического языка. В новых стандартах описания, в отличие от прежних каталогизационных правил, знаки препинания имеют не разделительный, а различительный смысл, т. е. не отделяют один элемент описания от другого, а маркируют следующий за знаком элемент. Однако это осуществляется весьма непоследовательно и с нарушением законов семиотики.
В аспекте семантики (отношения знаков к их смыслу) используют семиотические понятия денотата (обозначаемого знаком конкретного объекта) и концепта (смысла этого знака). Сравнение в этом плане библиографического языка с дескрипторным и классификационным выявляет то преимущество первого, что только библиографическое описание однозначно соответствует своему денотату, тогда как дескриптор и классификационная рубрика находятся со своими денотатами в размытых отношениях.
В плане прагматики (отношения знаковой системы к обозначенной ею реальной действительности) библиографический язык позволяет моделировать структуру научных публикаций, коллективов и коммуникаций, примеры чего были неоднократно представлены в этой лекции.