Технологія автоматизованого формування баз даних довідково-бібліографічної інформації

Вид материалаДокументы
Подобный материал:


Технологія автоматизованого формування баз даних довідково-бібліографічної інформації


В цей час попит на бібліографічну інформацію значно випереджає швидкість її накопичення в базах даних. Новий час висуває нові вимоги до повноти і якості інформації. Змінюються методики обробки даних і форми їхнього збереження, зростає асортимент бібліотечних послуг, але незмінним залишається кадрове питання : яким повиннен бути штат співробітників, здатний задовольнити цей попит.

Як правило, у бібліотеках вузів кількість співробітників відділу довідково-бібліографічної обробки - це 1-2бібліографи, у зв'язку з цим постатейний розпис складає тільки 25-30% бажаного обсягу.

Питання кооперації, інтеграції, координації і т.п. останнім часом піднімаються постійно. Можливо, вони колись будуть вирішені, але повна і своєчасна інформація необхідна користувачам вже сьогодні.

Для рішення цих проблем авторами запропонована комплексна методологія автоматизованого формування довідково-бібліографічної інформації і розроблений програмний продукт, що :
  • забезпечує 100%-ий постатейний розпис заданого джерела;
  • наближає якість бібліографічного запису до ідеального;
  • знижує працевтрати до мінімуму.

Тому що гібридна бібліотека містить різні форми надання інформації, у програмі передбачені режими роботи з документами, представленими як у друкованій формі, так і в електронній.

У першому режимі сканується зміст документа-джерела. У результаті розпізнавання відбувається заповнення полів аналітичного бібліографічного опису для всіх елементів змісту (чи будь-якої його відібраної групи). Складним у технології розпізнавання є неоднорідність поліграфічного оформлення документів друку.

Усі типи видань, що є у фонді бібліотеки, були проаналізовані на відповідність міждержавному ГОСТу 7-5.98 "Журналы, сборники, информационные издания, издательское оформление публикуемых материалов". У першу чергу дослідженню підлягали видання, що найбільш цікавлять вузи і науку в цілому, а тому вимагають повного постатейного розпису:
  • галузеві збірники наукових праць;
  • вузівські збірники, що входять у перелік ВАК;
  • матеріали конференцій, нарад і семінарів;
  • навчальні і методичні матеріали;
  • довідкові видання.

У результаті аналізу було з'ясовано, що всі різновиди видавничого оформлення документів розділилися на 3 нерівномірні групи:

  1. 90% відповідають міждержавному ГОСТу 7-5.98 і перед розпізнаванням проходять тільки незначний контроль оператора.
  2. 7% мають невеликі відхилення від ГОСТу, але піддаються формалізації з використанням обумовлених технологічних прийомів.
  3. 3% супроводжуються барвистими поліграфічними ефектами, але мають істотні відхилення від ГОСТ. До них відносяться такі популярні журнали як "Комп'ютер Пресс", "Мотор" і ін. На жаль, саме ці документи з технологічного циклу нами виключені. На даному етапі вони підлягають обробці традиційним способом.

На початку дослідної експлуатації кожен етап обробки даних - від моменту сканування до одержання остаточного бібліографічного опису - хронометрувався. Після одержання 100%-ого розпису Праць Шостої Міжнародної Конференції "Крим - 1999" за 2 людино-дні доцільність упровадження технології уже не викликала сумнівів.

В другому режимі, у випадку представлення документа в електронній формі, процес формування бібліографічного запису вимагає від бібліографа більш інтелектуального підходу і зводиться, в основному, до наповнення полів з окремих частин електронного документа.

Нова розробка являє собою розширення функціональних можливостей програмного комплексу АІСТ, абревіатура якого розшифровується як Автоматизована Інформаційна Система Типова. Розроблений АІСТ на базі ППП CDS/ISIS і більш 6 років функціонує в бібліотеках ХДАДТУ, НУА, ІЕКВМ, ХДАУ ім. Докучаєва.

Безсумнівний виграш у швидкості формування аналітичного опису документів поряд з якістю представлення даних, на нашу думку, міг би бути корисний і іншим бібліотекам, проблеми яких на сьогоднішній день практично нічим не відрізняються від наших.
Після появи перших результатів у бібліографів з'явилося багато цінних пропозицій. Одна з самих цікавих полягала у тім, щоб оформити цю технологію у вигляді окремого програмного пакета, не прив'язаного до конкретної пошукової системи, але забезпечуючого експорт вихідних даних у вигляді iso-файлу у міжнародних форматах (Unimarc та ін.). Ця пропозиція знаходиться зараз у стадії реалізації. Ми сподіваємося, що перші результати застосування даної технології зможуть наблизити нас до вирішення проблем інтеграції спільних ресурсів.