Читайте данную работу прямо на сайте или скачайте

Скачайте в формате документа WORD


Различные классы баз данных по предметным областям использования

TOC o "1-2" Вступление........................................................................................................................ 2

1. РАЗЛИЧНЫЕ КЛАССЫ БАЗ ДАННЫХ ПО ПРЕДМЕТНЫМ ОБЛАСТЯМ ИСПОЛЬЗОВАНИЯ...................................................................................................................................................... 3

1.1. Документальные и документографические БД.................................................. 3

1.2. Система баз данных о продукции........................................................................ 6

1.3. Экономическая и конъюнктурная информация............................................... 10

1.4.Фактографические базы социальных данных................................................... 11

1.5.Базы данных транспортных систем страны....................................................... 14

1.6. Справочные базы для населения и организаций.............................................. 16

1.7.Система ресурсных баз данных........................................................................... 17

1.8. Фактографические базы и банки научных данных.......................................... 19

1.9. ФБД в области культуры и искусства............................................................... 23

1.10. Лингвистические БД......................................................................................... 24

Заключение...................................................................................................................... 26

Список использованной литературы............................................................................ 27


Вступление

В данной работе я постарался классифицировать существующие базы данных, так же оценить перспективы их развития в нашей стране. Классификационным признаком является предметная область использования. Целью данной работы является так же анализ наиболее распространенных классов БД, получивших распространение и применение как в нашей стране, так и за рубежом.

В данной работе не акцентируется проблема передачи данных между БД, лишь исследуется архитектура и общая организация самих БД.

Рассмотрим классы БД, получившие к настоящему времени наибольшее развитие в нашей стране. Это:

- документографические и документальные БД, создаваемые в органах НТИ и средствах массовой информации;

- БД по промышленной, строительной и сельскохозяйственной продукции;

- БД по экономической и конъюнктурной информации (статистическая, кредитно-финансовая, внешнеторговая);

- фактографические базы социальных данных, включающие асведения о населении и о социальной среде;

- БД транспортных систем;

- справочные данные для населения и чреждений (энциклопедии и справочники, расписания самолетов и поездов, адреса и телефоны граждан и организаций и др.);

- ресурсные БД, включающие фактографическую информацию о априродных ресурсах (земля, вода, недра, биоресурсы, гидрометеорология, вторичные ресурсы и отходы, экологическая аобстановка);

- фактографические базы и банки научных данных, обеспечивающие фундаментальные научные исследования;

- фактографические БД в области культуры и искусства;

- лингвистические БД, т.е. машинные словари разного типа и аназначения.

1.1. Документальные и документографические БД

Документографические БД содержат описания документов. В азависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными.

Документографические системы, как правило, строятся по двуконтурной схеме: первый контур содержит документографическую БД и используется для автоматизированного поиска документов, второй контур в случае необходимости обеспечивает выдачу полного текста документа в виде копии первоисточника на бумаге, микрофильме или выводит текст на экран с оптического диска (в некоторых случаях с жесткого магнитного диска большой емкости).

В составе данного класса выделены следующие виды БД:

- по публикуемым научно-техническим документам ;

- по публикуемым документам в области общественных анаук;

- по патентным документам;

- по отчетам по НИР, ОКР, программным средствам ;

- по материалам межотраслевого обмена (научно-техническим достижениям, ППТО, ИЛ, каталожная, выставочная информация и т.п.);

- по стандартам и другой нормативно-техническойа документации;

- библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях;

- реферативные и полнотекстовые БД по общественно-политической информации, создаваемые средствами массовой информации;

- БД законодательной и правовой информации;

- документографические документографические по специальным видам документов ;

- БД по архивным документам. Анализ состояния дела с ДБД различных видов в стране показывает, что в настоящее время наибольшее развитие получили ДБД документографического типа, главным образом, по опубликованным документам в области научнотехнической информации, общественных наук, патентным документам, отчетам по НИР, ОКР и другим видам документов, созданные в рамках системы научно-технической информации.

В системе НТИ создан распределенный автоматизированный банк данных (БнД) общим объемом более 20 млн. записей.

Порядка 30-40% записей относятся к отечественным первоисточникам, остальные - к зарубежным. В рамках БнД созданы абонентские сети даленных пользователей, охватывающие все столицы союзных республик и основные областные центры.

Доступ к БД предоставляется частями по жесткому расписанию. Доля одновременно доступных БД составляет 20% общего объема БнД системы НТИ.

БнД поддержан вторым контуром, обеспечивающим выдачуа пользователям исходных текстов документов. Однако, функционирование второго контура системы НТИ в настоящее время не соответствует современным требованиям, так как не обеспечивает гарантированного получения копии любого первоисточника в приемлемые сроки.

Не в полной мере соответствует современным требованиям и актуальность записей в БнД системы НТИ, так как сроки поступления первоисточников в России, обработки их и ввода в БД в совокупности составляют несколько месяцев.

К документографическим БД НТИ тесно примыкают библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях. Функции этих систем совпадают почти полностью, что делает целесообразным их объединение.

Крупным недостатком сложившейся системы следует признать полное отсутствие полнотекстовых БД научно-технической информации, в особенности, полнотекстовых БД стандартов и нормативно-технической документов. Однако широкое распространение полнотекстовых БД общенормативного и нормативно-правового характера радует.

Средствами массовой информации (в основном центральны ми) создан и ведется ряд БнД по общественно-политической информации. Основная проблема БнД средств массовой информации заключается в полном отсутствии координации их создания и ведения, откуда проистекает разнобой в технологии, технических решениях, подходах к отбору и обработке информации.

Документографические БД по специальным видам документова функционируют для документов следующих видов:

Картографические документы - в ГБЛ и ГУГК. Эти документографические БД представляют собой, в сущности, обычные библиографические БД. В настоящее время объем совокупного БнД картографических документов незначителен.

- Чертежно-конструкторские и проектные документы. Документографические БД по документам этого вида существуют н отдальных предприятиях, где они разрабатываются, как правило, самостоятельно с использованием имеющихся программно-аппаратных средств. В результате полученные массивы, как правило, не совместимы между собой. Кроме того, эти массивы создаются в интересах правления деятельностью самого предприятия, и заинтересованность предприятия-генератора ва предоставлении доступа к ним внешних потребителей обычно отсутствуют.

По-видимому, в настоящее время вопрос о включении этиха документов в систему БД и БнД не стоит.

- Аудиовизуальные документы. В телекомпаниях существуета документографическая БД по аудиовизуальным документам Центрального телевидения, используемая в интересах этих организаций. Теледоступ внешних потребителей к этой БД технически осуществим, но в настоящее время не предусматривается руководством этой организации. Формирование документографического БнД по архивным документам фактически только началось. Основная проблема в этом виде БнД состоита в очень большом объеме данных, подлежащих переработке и вводу в БнД, что потребует больших затрат и длительного времени. Задача облегчается наличием четкой структуры архивных органов и существованием координации этой работы между ними.

В целом можно отметить, что в стране существует несколько отдельных, не связанных между собой систем документографических БнД и отдельных БД этого класса, между которыми не всегда обеспечивается совместимость даже по данным. Планомерное и скоординированное развитие таких систем можно отметить только внутри следующих подсистем: документов научно-технической информации; по общественным наукам; патентных документов; отчетных документов; документов межотраслевого обмена; стандартов и нормативно-технической документов; законодательных документов; архивных документов. Между этими подсистемами координация слаба или отсутствует.

В других подсистемах нет и внутренней координации. Вместе с тем, и в тех подсистемах, которые развиваются планомерно, имеет место совершенно неоправданное дублирование функций, связанное с искусственным разделением информационных потоков по отрасли-источнику на общие документальныеа потоки и потоки группы отраслей промышленности. Применительно к открытой информации такое разделение излишне (а другая информация не относится к области рассмотрения настоящей концепции).

Сопоставление состояния дел в стране и за рубежом в области документографических БнД позволяет также отметить отсутствие или слабое развитие, неорганизованность и разрозненность в России некоторых видов документографических и документальных БнД, в том числе:

-реферативных и полнотекстовых БнД по статьям из центральных и региональных периодических изданий (имеются Да по статьям "Правды" и "Известий", не доступные внешним пользователям, а так же интернет-БД, касающиеся некоторых московских коммерческих изданий);

- БнД обзорной и прогнозной экономической информации;

- БнД по научным статьям с индексами цитирования ;

- БнД по правительственным документам незаконодательного характера (заявлениям, сообщениям для прессы, выступлениям государственных деятелей и т.п.);

- БнД по программному обеспечению;

- БнД деловой и коммерческой информации;

- БнД по зарегистрированным торговым маркам и другие.

1.2. Система баз данных о продукции

Информация о продукции является основным видом технико-экономической информации. Данные о продукции характеризуются:

- огромной и зачастую неупорядоченной номенклатурой (ота 10 млн. до 1 млрд. наименований ), только в ОКП содержится 25 млн. позиций, в системе чертежного хозяйства насчитывается до 16 млн. крепежных изделий, имеются сведения более чем о 6 млн. химических соединений и т.п.;

- разнородностью и многофункциональностью применения и описания продукции на всех этапах ее жизненного цикла;

- обилием свойств (признаков), характеризующих отдельные группы продукции(до 200 признаков);

- многообразием областей применения продукции, охватывающих все сферы народнохозяйственной деятельности;

- многочисленными и разнообразными связями между продукцией и другими видами информации (связь с предприятиями-разработчиками и изготовителями, комплектующими изделиями, сырьем и ресурсами, технологическими процессами, работами и слугами, состоянием окружающей среды и т.п.);

- большим количеством и разнообразием категорий групп пользователей;

- наличием большого числа различающихся и неувязанныха между собой систем классификации и кодирования продукции (ОКП, ЕСКД, ЕТНВТ, гармонизированная система описания и кодирования товаров, система штрихового кодирования, отраслевые и локальные системы и т.п.);

Число пользователей системы баз данных по продукции достигает десятков тысяч (предприятий промышленности и сельского хозяйства свыше 100 тыс., правляющих и исполнительных органов - свыше 50 тыс., кооперативы, арендные и индивидуальные предприятия и т.п.).

Все это обусловлено тем, что с созданием продукции связано большинство работ и слуг в области материального производства.

Состав и объем действующих баз данных о продукции. Отдельные информационные массивы (баз данных, файлов ) по продукции создаются и функционируют практически в рамках любой автоматизированной системы правления, которые разрабатывались в последние 20-25 лет на общегосударственном, отраслевом и республиканском ровнях и на уровне отдельных предприятий.

По мере роста числа решаемых АСУ задач и в процессе иха объединения во взаимосвязанные комплексы в большей степени обнаруживались недостатки позадачного подхода, причем особые трудности возникали в стране с вязкой и совместныма применением различных баз данных о продукции.

Дело в том, что в настоящее время многие министерства иа ведомства, предприятия и организации страны осуществляют сбор, хранение и обработку информации, характеризующей отдельные стороны продукции и ее производства (данные о наличие запасов, остатках, об излишнем оборудовании, по ресурсосбережению, коммерческая информация, сведения о продукции реализуемой в порядке оптовой торговли, экономические показатели производства и поставок продукции, основные характеристики продукции и цены на нее, данные о рекламациях и конъюнктуре рынка товаров народного потребления, сведения об экспорте и импорте продукции, рекламациях инозаказчиков, основные характеристики продукции зарубежных фирм, предлагаемой на мировом рынке, сведения об отечественных, международных и зарубежных стандартах), так же бухгалтерский ее чет.В связи с этима построение системы баз данных на основе сложившихся ва стране совокупности АСОД требует решения проблемы их ин формационной совместимости, например, в виде специальных, стандартизированных, интерфейсов.

Основные принцыпы создания СБД по продукции Целью СДа по продукции является оперативное обеспечение ей достоверной и актуальной информацией о продукции для решения их практических задач.

СБД по продукции - это совокупность территориально распределенных БД, содержащих взаимоувязанную информацию о различных аспектах продукции на всех стадиях ее жизненного цикла, объединенных в информационно-вычислительную сеть и основанную на унифицированной информационной технологииа сбора и обработки информации и обшесистемных методах и средствах описания данных.

Базы данных о продукции организуются по однородныма группам(видам)продукции и другим объектам (предриятиям, регионам) и включают:

- номенклатуру, эксплуатационно-технические, экономические, эргономические и другие характеристики(показатели) изделий, отражающих их потребительские свойства, область и словия применения, влияние на человека и окружающую среду, заменяемость и взаимозаменяемость и т.п.;

- сведения о предприятиях-разработчиках и изготовителяха продукции;

- данные о ценах и условиях поставок;

- другие данные, представляющие интерес для частников

рынка продукции.

СБД о продукции создается в целях демонополизации информационного рынка и контроля за ценами на информацию о продукции с четом словий перехода к рыночной экономике.

Система баз данных реализуется в виде 2 классов БД:

- государственных БД, строящихся на основе системы государственной каталогизации продукции, создаваемых для целей планирование и налогообложения;

- коммерческих БД.

Государственная система каталогизации включает продукцию, выпускаемую государственными организациями и ведомствами (министерство обороны, министерство энергетики, министерство транспорта и др.).

Поступление информации о продукции в системе каталогизации может строится как на административной, так и на экономической основе.

Коммерческие БД создаются на базе товарных бирж, предприятий оптовой торговли, центров НТИ и других негосударственных предприятий.

При создании БД о продукции необходимо выделить организации, которые порождают информацию, т.е. являются генераторами информации. Эта информация и должна собираться и поддерживаться в актуальном состоянии в системе БД. В качестве таких организаций могут выступать предприятия-изготовители продукции. В системе СБД по продукции целесообразно организовать БнД по группам однородной продукции на основе наиболее оснащенных вычислительных центров, как существующих в отраслях и регионах, так и в создаваемых ассоциациях, центрах и т.п.

Информационное обслуживание БД по продукции могут осуществлять непосредственно генераторы информации, хотя целесообразней осуществлять обслуживание в специализированных интегрированных БнД, как правило региональных, которые также нужно создавать в существующих вычислительных центрах субъекта федерации, наиболее подготовленных для ведения БнД. Необходимо обеспечить доступ к существующим БнД по потребляемой продукции инистерства обороны (с четом режимных ограничений).

Координацию создания СБД по продукции должен осуществлять государственный центр каталогизации продукции, который выполняет следующие функции:

- организационно-методическое и нормативно-техническое обеспечение системы ;

-         

-         

В целях обеспечения совместимости и облегчения выхода на зарубежный рынок и облегчения экспортно-импортных операций в основу создания СБД по продукции предлагается положить ин формационную технологию по каталогизации и международные соглашения по информационному обмену данными (типа EDIFAKTа и системы обмена электронными документами).

Основным способом решения проблемы информационной совместимости действующих баз и банков данных о продукции является комплексная нификация и стандартизация средства описания данных (структур, форматов, лексики и т.д.).

1.3. Экономическая и конъюнктурная информация

Создание баз и банков экономической и конъюнктурной информации является важным фактором функционирования общества в словиях перехода к регулируемой рыночной экономике.

В предшествующие годы базы экономических данных создавались и функционировали в составе АСПР Госплана Р, ЕСИС Госкомстата России, АСФР Минфина России, АСУ Госснаба Р, оСУ Госбанка, других министерств и ведомств, территориальных органов правления предприятий и организаций.

Развитие информационного обеспечения регулируемой рыночной экономики будет происходить с учетом 2 основныха факторов:

1.Сокращение объема отчетных данных, представляемых предприятиями и организациями органам управления и государственной статистики.

2.Существенное возрастание информационных потребностей Совета федерации, предприятий, организаций, населения, органов территориального и межотраслевого правления в социально-экономической информации.

Основным направлением развития БД социально-экономической и конъюнктурной информации является создание следующих интегрированных БД:

1.Регистры и БД учетно-статистических единиц:

-         

-         

- регистры строек.

2.Интегрированные БД для комплексного анализа состояния и развития отраслей экономики.

3.БД годовых балансов деятельности, предприятий, организаций и их объединений, территорий и регионов.

4.БД массовых переписей, единовременных четов и выборочных обследований.

5. БД по банковским трансфертам.

6.БД по доходам и расходам населения, включая БД по семейным бюджетам.

Дальнейшее развитие должны получить работы по созданию БД, обеспечивающих международное сопоставление социально-экономического и научно-технического развития России, субъектов федерации, отдельных регионов, международные валютно-финансовые сопоставления и планируемых валютных курсов, изучение эффективности внешней торговли, платежеспособности страны.

В этих целях предусмотрено создание следущих баз данных:

- по частникам внешнеэкономических связей;

- по лицензированию;

- грузовых таможенных деклараций;

- межправительственных соглашений и протоколов;

- конъюнктурно-коммерческой информации;

- нормативных документов, регулирующих внешнеэкономическую деятельность;

- нормативно-справочная база. Создаваемые интегрированные БД должны формироватся с четом интересов органов правления различного ровня, включая законодательные и исполнительные органы, налоговые органы, государственные и коммерческие банки, также в целях информирования общественных организаций и населения.

Методологической основой создания интегрированных Да социально-экономической и конъюнктурной информации должна служить единая система национальных счетов, сопряженная с международными номенклатурами и стандартами.

Создание и функционирование баз экономических данных должно осуществляться на основе развитой системы информации, включающей систему классификации, кодирования и стандарты в области экономической информации.

Большинство БД социально-экономической информации должно создаватся преимущественно на основе финансирования иза государственного и местного бюджетов, конъюнктурной информации-с привлечением средств заинтересованных коммерческих и некоммерческих организаций.

Политика в области цен и налогов на использование Да данного класса должна включаться в число мер антимонопольного характера и должна регулироваться Антимонопольным комитетом. При этом возможно и целесообразно создание коммерческих БД и БнД, конкурирующих с же сущенствующими.

1.4.Фактографические базы социальных данных

К социальным данным относятся данные о населении и социальной среде. Сведения о населении включают половые, социальные, медицинские и любые другие персональные данные об отдельных личностях, также сводные данные о населении страны в целом и ее отдельных территориях и об определенных группах населения: пенсионерах, квартиросъемщиках, детях школьного возраста, женщинах и др.

Сведения о социальной среде включают данные о вакансиях, градостроительстве, городском хозяйстве, городском пассажирском транспорте, законах, нарушениях общественного порядка и др.

К социальным фактографическим данным отнесены такжеа другие данные сферы здравоохранения : о заболеваниях и их последствиях, лекарственных средствах, медицинском оборудовании и медицинских чреждениях и т.д.

Данные о градостроительстве включают сведения о зданияха и сооружениях, дорогах, зеленых насаждениях и транспортныха маршрутах города.

Данные о городском хозяйстве содержат сведения о жилома фонде, тепло и энергосети, водопроводной сети, электро и автотранспорте, предприятиях, занятых переработкой отходов, ремонтом дорог и другими функциями коммунального хозяйства.

Подавляющее большинство баз социальных данных формируется в рамках систем местных органов власти. Источниками таких данных являются, как правило, формализованные документы.

Потребителями баз социальных данных являются население, органы правления различных ровней и сфер, начиная от жилищно-эксплуатационных контор и правлений и кончая Презитдентом и Федеральным Собранием, также научные работники.

Все данные о личностях имеют ограниченный доступ, их содержание контролируется населением, о чем во многих государствах были изданы законы.

Базы данных о градостроительстве и городском хозяйствеа создаются за рубежом при городских муниципалитетах и службах. Сведения о жилом и нежилом фонде используются налоговыми органами.

Информация о зданиях, дорогах, зеленых насаждениях и транспорте предназначена для работников служб градостроительства и экологических служб, информация о водо-, тепло-, энергосетях города - для работников служб, правляющиха этими сетями.

В нашей стране создание баз демографических и паспортных данных о населении находится в начальной стадии.

Довольно спешно развивается создание баз данных в системах чета и выплаты пенсий. В 130 центрах функционируют такие системы, обслуживающие до 70% пенсионеров страны. Системы в большинстве случаев обеспечивают прямой экономический и социальный эффект, и он возрастает при решении задача по расчету и перерасчету пенсий непосредственно в низовыха звеньях системы социального обеспечения. Для функционирования правоохранительных органов в г.г. Москве, Красноярске созданы и функционируют базы данных о криминогенном контингенте населения, о преступлениях (событиях) и о похищенных ценностях. В г.Москве закончилась разработка системы "Патруль", обеспечивающая оперативный доступ к этима базам данных по радиоканалу и телефонным каналам. Наиболее крупной сетью баз социальных данных является сеть баз данных о населении. Ее объем, включая медицинские и кадровые данные, в перспективе составит для всей страны с четома дублирования при хранении 1, 8 тыс.Гбт. Объем баз основных

демографических и паспортных данных без чета дублирования составит 150 Гбт. Трудности создания сети БД "Население" заключаются в больших начальных затратах по заполнению. За рубежом персональный учет населения окупается за счет более полного сбора налогов. В будущем и у нас появится этот эффект. Прямой экономический эффект ота базы данных о населении на современном этапе вряд ли будет достигнут. Вместе с тем социальный эффект может быть значительным. Поэтому проблема создания такой базы может быть решена только на государственном уровне. Эти же трудности возникают при создании баз данных о вакансиях и жилом фон де, также достаточно крупных.

В ближайшие годы следует ожидать изменения отношения к БД о населении в связи с появлением новых тенденций в налоговой политике и изменением финансового положения территориальных органов правления.

На предприятиях на базе ПЭВМ создаются многочисленныеа системы по чету кадров, имеющие базы кадровых данных. Иха количество в нашей стране нигде не фиксируется и работы не координируются. Экономическая эффективность таких систем у нас часто не достигается вследствие высокой этой координации.

В течение ряда лет в Минздраве России функционирует система баз статистических медицинских данных. Создание баз персональных медицинских данных в поликлиниках и больницах ведется в нашей стране в порядке эксперимента в Москве, Екатеринбурге и других городах.

Закончено создание баз данных о свойствах лекарственныха средств и о наличии их в аптеках города в г.г.Москве, Санкт-Петербурге и Рязани. Планируется создание баз данных о запросах донорской крови и органов трансплантации. Создана база медицинских данных, финансируемая органами здравоохранения на всех ровнях.

В городах Москве, Красноярске и других созданы базы данных о жилом фонде. Наиболее дачным следует признать создание базы данных о жилом и нежилома фондах на основе автоматизации функций бюро технической инвентаризации.

Большое социальное значение приобретают базы данных о вакансиях, используемые для задач трудоустройства. Такие базы созданы в ряде городов. Опыт их создания показал, что в городе целесообразно иметь центральный государственный городской банк вакансий.

Базы данных о городском хозяйстве и градостроивельстве. В последнее время в связи с появлением персональных ЭМа стали создаватся базы, необходимые для работы служб, занятых четом, ремонтом, оперативным правлением в тепло- и энергосетях и др.

При создании баз социальных данных важны следующиеа принципы:

1.Генератором базы является, как правило, организация-владелец документов-источников, которая может передавать функции распространения информации другим БнД.

2.Создание баз социальных данных необходимо производить на основе централизованного частичного финансирования при словии финансовой поддержки этих работ федеральными и местными органами правления. В первую очередь следует финансово поддержать эти работы в опорных зонах информатизации.

3.Для обеспечения унификации записей в базах данных и запросов целесообразно создать систему баз данных в социальной сфере, совмещенную с системой словарно-справочныха служб.

4.Основное внимание следует делить созданию баз детальных данных об элементарных объектах, таких как отдельный человек, конретное лекарство, конкретная квартира. Эти базы следует создавать в местах их наиболее интенсивного использования. Так, базы данных о населении следует создавать в ДЗах или РЭУ, отделениях милиции, центральном адресном бюро. Базу данных о квартирах и строениях следует создавать в бюро технической инвентаризации и в ДЗах. Сводные данные о жителях и квартирах следует хранить в базах данных районных и городских органов управления. Допускается дублирование данных при хранении, если это оправдано экономически.

5.В фактографических базах социальных данных велика интенсивность их обновления (15-25% в год).Вследствие этого каналы актуализации должны тщательно отрабатываться до на чала загрузки базы данных.

1.5.Базы данных транспортных систем страны

Исходным пунктом проектирования сети баз данных является оценка ее современного состояния.

В рамках отдельных видов транспорта и их АСУ созданы и афункционируют как отдельные базы и банки данных, так и мощные информационные системы.

На воздушном транспорте функционирует сеть ЭВМ "Сирена", обеспечивающая автоматизацию продажи авиабилетов. Сеть развивается и должна охватить всю территорию страны.

На железнодорожном транспорте создана система "Экспресс". В ее функции входит не только резервирование и продажа железнодорожных билетов, но и выдача справок о наличии мест.

На морском транспорте в рамках информационно-поисковых асистем "Пароходства", "Порты", "Судоремотные заводы". "Суда" афункционируют базы данных для планирования и регулирования работы флота и портов, базы данных о техническом состоянии афлота.

На автомобильном транспорте в рамках информационно-поисковых систем функционируют как документографические базы данных АСНТИ, "Изобретения", "Нормы", "Стандарты", "Директивы", так и фактографические-"Гаро", "Автотранспорт", "Неликвиды", "Экономика", "Строительство".

анализ существующей структуры правления функционированием транспортной системы России, анализ взаимосвязи ее объектов показывает, что тематическую сеть баз данных "Транспортная система РФ" целесообразно создавать в виде двухуровневой системы. В следствие привязки многих транспортных объектов к экономическим районам страны, закрепления иха на конкретных территориях в республиках, областях, районах и городах, генерация сети баз данных на низших уровнях имеет ярко выраженный региональный характер, на верхнем ровне требует формирования всероссийских банков данных.

Учитывая особенности транспорта, как отрасли экономики (охват всей территории страны, технологическая связь), в качестве возможных центров опорных зон предлагается рассмотреть пункты размещения правлений железных дорог РФ, т.к. железные дороги имеют специальную связь и большой опыт использования ее для передачи информации на значительные расстояния.

Для каждого региона предлагается создать следующие основные базы данных о транспортной системе РФ:

1."Перевозки" о фактических грузо и пассажиропотоках.

2."Транпортная сеть"- о составе и технической вооруженности транспортной сети всех видов транспорта.

3."Транспортные предприятия" и "Транспортные средства" соответственно о технико-экономических характеристиках транспортных предприятий и транспортных средств.

4."Расписание движения"- о движении пассажирских поездов, самолетов, судов, автобусов.

Перечисленные базы данных должны составить низший ровень тематической сети базы данных "Транспортная система РФ". На федеральном ровне предлагается создать следующие базы данных:

"Транспортные тарифы", "Перевозки", "Транспортная сеть".

На транспорте можно выделить порядка 100-120 тыс. ин формационныха объектов (железнодорожные и автобусные станции, морские и речные порты, аэропорты, транспортные предприятия в городаха и поселках).

На транспорте насчитывается около 20 тыс. железнодорожных станций, аэропортов, морских и речных портов, автобусных станций. Имеется более 25 тыс. железнодорожных частков, морских и речных путей, автомобильных дорог и авиалиний.

Около 60 тыс. насчитывается предприятий ведомственного транспорта и транспорта общего пользования. Можно выделить порядка 5 тыс. наименований перевозочных средств транспорта.

Доля федерального и местных бюджетов в общем финансировании сети БнД должна составить около 40%.

1.6. Справочные базы для населения и организаций.

В развитых странах существует практика использования БнД для информационно-справочного обслуживания населения и чреждений. Для этого организуется доступ к БнД авиаперевозчиков с целью выдачи справок, например, о расписании самолетов и поездов ; об адресах и телефонах граждан и организаций; о программах радио и телевидения;о проведении выставок и т.д. Кроме того, создаются специальные информационно-справочные БнД, в числе которых можно выделить следующие виды:

- энциклопедии и справочники;

- казатели фирм, предприятий и организаций;

- биографические данные ("Кто есть кто");

- описания новых видов потребительских товаров;

- казатели правительственных контрактов, супсидий и др.

В нашей стране этот вид БнД в настоящее время развится крупные справочные службы предоставляют подобные слуги, в основном с использованием ручных или автоматизированных катротек. Некоторые виды справочных БнД отсутствуют.

Развитие справочных БнД для населения и чреждений будет происходить в основном на коммерческой основе, однако ряд видов таких БнД целесообразно полностью или частично финансировать за счет государства. К таким БнД относится, например, БнД энциклопедического характера, который можно рассматривать как электронный вариант национальной энциклопедии. Кроме того, целесообразно предусмотреть государственное финансирование или субсидирование создания центров справочно-информационного обслуживания населения, организующих доступ к БД, полученным от ведомственных служб.

1.7.Система ресурсных баз данных

Проблемы природных ресурсов занимают особое место ва развитии любого государства, определяя степень его независимости и процветания.

Полная, достоверная информированность ва данном вопросе са целью контроля, анализа и прогнозирования состояния ресурсов является одной из приоритетных потребностей в интересах объективных, научно-обоснованных оценок возможных путей развития общества.

Существующее положение с данными о ресурсах экономики РФ можно охарактеризовать наличием разрозненных информационных массивов в отдельных ведомственных и отраслевых системах (некоторые республик и отраслей), также в базах данных отдельных предприятий и организаций.

Большое количество фактографической информации о при родных ресурсах сосредоточено в базах научно-технической информации.

Отсутствует централизованный чет этих информационныха массивов и их систематизация.

Можно тверждать, что сейчас в стране нет полных и достоверных данных о земельных и водных ресурсах (полноценных централизованных кадастров), о растительном и животном мире, о состоянии лесов; нет данных о нетрадиционных энергоресурсах и вторичных ресурсах, крайне разрозненна и неполна информация по экологической обстановке и т.п. Требует систематизации и пополнения информации по топливно-энергетическим ресурсам, необходимо обновление базы данных по гидроэнергетическим ресурсам.

Систему БД природных ресурсов отличает ряд особенностейа, в том числе:

- разнообразие видов объектов ресурсов БД;

- взаимозависимость и взаимозаменяемость различных видов ресурсов, следовательно, необходимость обеспечения информационной взаимосвязи и сопоставимости информации о них;

- существование большого числа как централизованных, так и региональных и ведомственных источников информации;

- различные формы представления информации в информационных потоках (цифровой, текстовой, графической, картографи ческой и т.д.);

- большой диапазон объемов и временных параметров ин формационных потоков, получаемых как с помощью датчиков, така и ручным вводом;

- влияние состояния ресурсов и окружающей среды одного региона на другие.

В соответствии с изложенным систему БД о ресурсах целесообразно проектировать в виде распределенной сети БД кака в разрезе регионов, так и видов ресурсов и их совокупностей. При этом возникает необходимость обеспечения взаимодействия БД в процессе их функционирования. При этом должн учитываться многоспектность классификаций как регионов, так и вмдов ресурсов, следовательно характер информационных взаимосвязей.

Необходимо определить ряд общесистемных требований для возможностей интеграции и информационной целостности совокупности ресурсных БД во времени.

Одним из системных требований является регламентирование процесса актуализации информации во времени. Целесообразно выделить два режима: регламентированный и нерегламентированный, обеспечивающий актуализацию БД в реальном времени.

Для обеспечения взаимодействия и сопоставимости данныха необходимо создание и ведение баз данных, содержащиха сведения о конкретных БД системы и структурах и режимаха данных.

Подводя итог изложенного можно сформулировать следующиеа основные положения концепции построения ресурсных баз данных:

1.Ресурсные БД должны создаватьвся как территориально-распределенные с интеграцией в общую сеть БД по признакам назначения, взаимозаменяемости, взаимозависимости. Это обуславливает следующую группировку ресурсных данных по направлениям:

- земли, воды и водные источники, атмосфера;

- биоресурсы (животный и растительный мир, биопродуктивность земли и вод;

- гидрометеорология;

- полезные ископаемые и энергоресурсы;

- вторичные ресурсы и отходы;

- экологическая обстановка;

- технология производства (добыча) и использования ресурсов. Приоритетность направлений определяется на местах в зависимости ота преобладающих видов ресурсов и технологий.

2.Формирование ресурсных БД целесообразно осуществлять силами регионов, имея в виду развивающуюся заинтересован ность местных мунициполитетов в определении имеющейся собственности. При этом на первой стадии данные о ресурсах могут быть включены в более информационные массивы, например, массивы паспортов территорий, городов, предприятий. Финансирование работ по БД должно осуществлятся в основном за счет средств местных органов власти (нецентрализованных источников).Финансирование работ по интеграции БД в сеть должно осуществлятся в основном за счет нецентрализованных источников (межрегиональные связи заинтересованных регионов), так и за счет централизованных (связи регион-центр). При этом ассигнования из центральных источникова могут выделяться в рамках соответствующей научно-технической программы и/или как плата за пользование региональной информацией.

3.При формировании и развитии сети источников информации для ресурсных БД необходимо использовать наряду с имеющимися источниками возможности конверсии.При этом имеется в виду как создание и тиражирование первичных средств сбора информации (датчики, сигнализаторы, другие средств контроля), так и использование некоторых систем наблюдения

и связи и транспортных средств.

4.Интегрированные БД по регионам должны создаваться c максимально возможным использованием сложившихся ведомственных информационных систем ресурсных, экологических и других служб и организаций, но общую ответственность за эти БД должны взять на себя региональные органы.

5.На общегосударственном уровне целесообразно создавать специализированные БД, содержащие данные о проблемах и объектах, имеющих международное, общероссийское, межрегиональное значение, также об никальных объектах природы и ресурсов.

1.8. Фактографические базы и банки научных данных

Современный этап развития науки характеризуется переходом на качественно новый ровень исследований, что определяется широким использованием методов и средств информатики - науки о законах и методах накопления, обработки и передачи информации. В науке применение методов и средств информатики должно не только освободить исследователя от рутинной работы по поиску и подготовке к использованию известной информации, но и обеспечить реализацию единой линии математической технологии решения задач - от формулировки математических моделей и их полного информационного обеспечения всеми необходимыми данными до формирования программных комплексов и проведения решения поставленныха задач. Важно, чтобы эта линия была непрерывной и оперативно действующей, без технологических разрывов в обработке данных. По существу, это определяется решительным превращением разрозненной информации, отдельных наборов данных и индивидуальных программ в единый информационный и программный продукт, также всесторонним применением современных приемов манипулирования такими продуктами с использованием средств вычислительной техники.

К середине 90-ых годов в РФ в области фактографическиха баз данных в науке сложилась ситуация, характеризующая следующими особенностями:

1. Существует значительное количество практически неа связанных друг с другом информационно-решающих систем и банков фактографических данных. Имеется дублирование ва разработке БД и БнД, и в то же время появление БД в такиха областях знаний, где ими пользуется только зкий круг специалистов. Эти банки данных создаются давно сложившимися научными коллективами и поддерживаются ими прежде всего для информационного обеспечения собственных нужд (новые технологии подготовки справочников, работы в рамках между народного сотрудничества и т.д.). В отраслевых НИИ фактографические БД создавались в интересах поддержания того или иного рабочего места (АРМ) технолога, конструктора и т.п.

Такие БД имеют очень ограниченную доступность, использование их для широкого круга пользователей проблематично, их чет и регистрация затруднены.

2. Развиваются как большие фактографические БД (например, по структурам химических веществ, спектроскопии и т.д.), так и специальные БД, например, по химии особо чистых веществ, физико-химической кинетике газовых реакций и т.п.). Эта тенденция в полной мере отвечает и зарубежному опыту.

3. Отсутствуют по большей части мотивы к кооперации иа интеграции разработчиков БнД. Расширение зкоспециальныха БнД, приспособленных к решению только одного класса за дач, на другую предметную область требует заново решать проблему выбора программных средств, т.к. при этом меняются структуры фактографических данных.

4. Фактографические БД формируются двумя способами:

1) на основенакопленных разработчиками больших массивов одно родной информации; 2) на основе документальных потоков существующих документографических БД.

5. Понижено доверие специалистов к фактографическим, прежде всего численным данным, получаемым из БнД, вследствие большой вероятности ошибок при вводе значений. Проблема проверки достоверности информации перед ее загрузкой в БД является актуальной и за рубежом, и в РФ. Для отечественных фактографических БнД она решена только в части единичных функционирующих БД. Для большинства отечественных фактографических БнД эта проблема остается актуальной в силу отсутствия финансирования и других ресурсов.

Представление научной информации в фактографических Да имеет следующие особенности:

- трудная формализуемость многих типов данных;

- актуальность многих, прежде всего, экспериментальныха данных в течение длительного времени (часто многими десятилетиями);

- использование аналитических форм представления данныха (уравнения состояния, равнения термодинамического подобия и другие зависимости), необходимым компонентом БнД в науке, как правило, является модель предметной области, вне связи с которой, данные теряют смысл;

- наличие нескольких видов данных, отличающихся способом обработки. Несмотря на общность подходов к информации в науке, формируются представлением непосредственно полученных или выявленных из литературных источников численных и структурных данных, графической информации, тем не менее наблюдаются и значительные отличия в различных областях знания: степень систематизации данных, ровень достоверности данных и возможности их экспертной проверки, традиционные способы представления информации, степень вариабельности данных и т.д.

К настоящему времени выделились два подхода к созданиюа фактографических БД. словно их можно назвать "исследовательским" и "библиотечным".

Наиболее характерная черта "исследовательских" БД - целенаправленный отбор информации для решения заранее сформулированной исследовательской задачи.

При "библиотечном" подходе сбор информации, как правило, непосредственно не связан с ее использованием. БД формируются преимущественно в ходе централизованной работы крупных научных и информационных центров и пополняются новыми данными без изменения же существующей структуры информационного массива.

Свертывание научной информации, которое связано с функционированием БД, позволяет пользователю в более сжатые сроки и в концентрированном виде получить интересующие его сведения, в большинстве своем прошедшие экспертную проверку на достоверность. Таким образом, разработка и эксплуатация БД в той или иной области науки или техники позволяет значительно величить доступную пользователю долю информационных ресурсов и, в конечном итоге, приводит к по лучению нового знания.

С распостранением персональной техники с современным сервисным обеспечением появляется возможность создания локальных баз данных, необходимых для научных исследований.

Информация для таких баз заимствуется из обзоров, справочников, отдельных оригинальных работ и других источников, и значительно реже - из банков данных. Однако качество информации, предлагаемой пользователям банками данных, существенно выше, поскольку эта информация проходит экспертный анализ на достаточно высоком уровне - в среде специалистова по данному вопросу, и оперативно обновляется.

Появление значительного числа проблемоориентированныха локальных БД в различных областях науки, реализованных как правило, на ПЭВМ, особенно остро ставит задачу координацииа работ в области информационного обеспечения научных исследований. За последние годы во многих странах возникли специальные организации, деятельность которых направлена, са одной стороны, на сбор, систематизацию и распространение информации о функционирующих или только проектирующихся Да (объеме и содержании информационного массива и комплексеа информационных слуг), а, с другой стороны, на стимулирование и финансирование проектов, связанных с созданием БД, совершенствованием их программного и лингвистического обеспечения, также разработкой единых стандартов при переводе данных в машиночитаемую форму.

При объединении локальных БД в информационную сеть одн из основных задач - обеспечение прямой и надежной связи между банками данных и личными локальными базами данных, оперативное наполнение таких локальных баз информацией из банков данных. Такая связь и поддержка локальных база данных же хорошо освоена в США (например, система STN) и Западной Европе. Банки данных, не включенные в сети, имеюта возможность оперативно передавать данные по инетрнету. Ва связи с этим необходимо обеспечить организацию современных методов передачи информации банков фактографических данных по сетям. Помимо решения техническиха проблем это потребует от системной организации банков данных обеспечения возможности формирования передаваемых файлов данных независимо от конкретной СУБД и типа машинной реализации, ведения гибких форматов и соответствующих интерфейсов средств обмена данными в разных форматах.

База данных может быть централизованной или распределенной. Централизованная база поддерживается одной ЭВМ. Распределенные базы можно разделить на два типа. В од ном случае каждый пользователь имеет почти все данные на своей ЭВМ, в другом случае каждый вид данных находится ва каком-то одном месте и центральная ЭВМ поддерживает только каталог всех данных с казанием местонахождения конкретныха данных. По-видимому, наиболее перспективной является последняя система организации.

При проектировании в систему, помимо трдиционного хранилища информации, могут входить также следущие подсистемы:

- библиотека научных программ для обработки данных (моделирование, вычислительный эксперимент и др.);

- библиотека статистической обработки данных (регрессионный анализ, сглаживание, оценка достоверности, получение значений коэффичиентов эмпирических и теоретических зависимостей, графический пакет и т.д.);

- буфер получаемых данных для их предварительного анализа (возможно и архив результатов);

- ряд служебных подсистем, таких, как вводи коррекция данных, обмен данными между хост-машиной и локальными системами и др.

Форма вывода данных определяется потребностью конкретных пользователей. БнД должен выполнять широкий спектр запросов от простейших информационных до слжных, требующих расчетов по прикладным программам.

БнД может быть использован также как программная основ автоматизированного рабочего места исследователя с правома доступа к справочным данным и внесением собственных данныха в имеющуюся БД.

Особое внимание следует обратить на открытость систем, особенно в частности возможности включения программ математической обработки данных.

БнД в области науки должны обладать возможностью восполнения недостающих данных при помощи баз моделей, алгоритмов и программ расчета и т.п.

Пользователю БнД должна быть предоставлена возможность доступа к любым имеющимся в нашей стране и за рубежом документографическим системам.

Интеграцию разнородных БД в общие мультидисциплинарныеа банки должны обеспечивать мировые центры данных и БнД специальных проектов. При этом БД верхнего ровня должны выполнять роль баз данных и содержать информацию о наличии данных в банках нижнего ровня.

Одной из важнейших проблем, решаемых в ходе разработкиа БнД, является создание экспертной службы (ЭС). ЭС выполняют три функции: сигнальную, аналитическую и справочную. Типичными формами ЭИ являются:

- для сигнальной информации - экспертные рефераты;

- для аналитической информации - текущие и ретроспективные аналитические обзоры;

- для справочной информации - таблицы фактографическиха данных. Экономический механизм создания и развития БнДа в наукеа механизмом финансирования исследований, в результате которых формируется БнД (через научные фонды, ассоциации и т.п.).В особых случаях БнД в науке могут финансироваться государством. Обслуживание по таким БнД должно производиться на бесприбыльной основе (например, в образовании).

БнД в науке представляют собой национальное достояние и подлежат экспортному лицензированию.

1.9. ФБД в области культуры и искусства

Существующие и разрабатываемые в настоящее время базы фактографических данных в области культуры и искусства могут быть разделены на две группы:

- ФБД статистической и справочной информации, эксплуатируемые в рамках отраслевой автоматизированной информационно-справочной системы оИСС-КУЛЬТУРА;

- ФБД тематически ориентированных автоматизированныха информационных систем, создаваемых в рамках АИС "ПАМЯТ НИК".

В рамках оИСС-КУЛЬТУРА эксплуатируются следующие предметные базы данных:

- БД учетно-статистической информации (деятельность театрально-зрелищных предприятий, музеев, клубов, парков, библиотек);

- БД по репертуару театров и по концертной деятельности;

- БД по кадрам;

- БД о деятельности промышленных предприятий;

- БД о культурных связях с зарубежными странами;

Фактографические БД, работающие в рамках оИСС, используют стандартные решения, характерные для применения ва экономической сфере.

Существующие в настоящее время ФБД по памятникам культуры и исскуства служат, как правило, целям инвентаризации, не научного описания и изучения.

Очевидно, что коммерческий эффект от информационно-справочной деятельности по заказам российских и зарубежных организаций, связанных с культурной, туристской, научной деятельностью может быть весьма существенным.

1.10. Лингвистические БД

Лингвистические БД (ЛБД) содержат данные о языковыха единицах различных ровней (от морфемы до текста) и разно образную информацию об этих единицах.

ЛБД имеют три основные сферы применения:

- обеспечение функционирования различных автоматизированных систем, связанных с обработкой текста и речи (информационные, экспертные, обучающие системы, системы анализ речи, машинного перевода и др.);

- автоматизация лексикографической деятельности массового и специального назначения, то есть подготовка словарей различного типа (учебных, переводческих, нормативных, толковых и др.);

- автоматизация труда исследователей: лингвистов, преподавателей языков и других филологов.

Финансирование обеспечивающих ЛБД обычно осуществляется в рамках соответствующих автоматизированных систем.

ЛБД для автоматизации лексикографии могут приносить значительный экономический эффект в случае интеграции ЛДа с автоматизированными издательскими системами, что имеета за рубежом массовое применение.

Следует иметь в виду, что ЛБД всех трех типов существенно пересекаются между собой по составу данных, хотя и имеют многие специфические свойства. В то же время многие ЛБД имеют достаточно большие объемы (до сотен тысяч и дажеа миллионов записей), поэтому их создание и ведение требуета значительных средств и трудозатрат.


Заключение

Итак на основе вышеизложенного можно сделать следующие выводы.

Поскольку на данный момент перед нашим государством стоит проблема более глубокого регулирования экономики, вновь вспомнили о необходимости создания разнообразных баз данных, начиная от автоматизированных кадастров и заканчивая персонифицированными базами данных финансовых потоков граждан.

Как говорилось выше, для обеспечения гарантированной конфиденциальности этих БД необходимо финансировать, по крайней мере, 46% затрат на их создание именно из федерального бюджета. Остальную часть (54%) следует финансировать из бюджетов субъектов и местных бюджетов.

Кроме того, проблема передачи данных в рамках мультимашинных баз дынных должна решаться именно на федеральном ровне, так как частные (негосударственные) связисты не могут гарантировать бесперебойность и конфиденциальность информации.

К счастью в нашей стране существует немало специалистов, занимавшихся ранее САПР, организацией БД и СУБД, поэтому перспективы развития информатизации в РФ целиком зависят от правового аспекта данной проблемы.


Список использованной литературы

1.     

2.     

3.     

4.     

5.