Рассказы об информации

Вид материалаРассказ

Содержание


Совершенствование Рубрикатора
Алфавитно-предметный указатель Рубрикатора (АПУ)
Тезаурус терминов Рубрикатора
Автоматическое рубрицирование
Расширение содержания рубрикатора
Общая часть
Тематический классификатор
Многоязычный словарь правовой терминологии
Многоязычный словарь правовой терминологии
Перечень аббревиатур и сокращений
Вспомогательные словари
Статистическая информация
Банк юридических терминов
Подобный материал:
1   2   3   4   5   6   7   8

^ Совершенствование Рубрикатора

Совершенствование Рубрикатора имеет целью повышение его поисковых свойств. Идеального рубрикатора вообще не существует, так как он в упрощенном формализованном виде пытается отразить богатую живую реальность, а в нашем нестабильном обществе все проблемы многократно усугубляются.

Несмотря на это, необходимо стараться создать рубрикатор, качественно выполняющий свои основные функции, в наибольшей степени приближенный к современной ситуации в законодательстве, позволяющий как стандартизовать подход к решению многих проблем, так и гибко реагировать на изменения в жизни общества.

Для этого имеются два основных направления - совершенствование традиционного пути создания рубрикатора и новые подходы к принципам его формирования. К традиционному подходу можно отнести совершенствование членения массива законодательства на привычные для ученых юристов элементы - отрасли, подотрасли, более полное прямое перечисление тематик. Менее стандартным является использование координации нескольких элементов рубрикатора, представляющих собой не доктринальные, а реальные формулировки, взятые непосредственно из конкретных текстов. Также совершенствованию рубрикатора может способствовать стандартизация его структуры - выделение блоков общих для разных разделов элементов, однотипное кодирование семантически близких тематик.

Вообще в любой работе должна просматриваться основная цель. Классификатор должен устанавливать взаимно-однозначное соответствие наименования рубрики и элемента действительности, регулируемого законодательством. Только тогда он будет выполнять информационные функции, служить задачам организации и поиска правовой информации. Для проверки правильности формулировки рубрики можно мысленно добавлять в ее начало слова ПРАВОВОЕ РЕГУЛИРОВАНИЕ - вопроса, проблемы или деятельности, например, "правовое регулирование ... деятельности политических партий" или "... проблемы беженцев". Возможность такого добавления характеризует однородность объектов, составляющих классификатор, невозможность же этого - демонстрирует нарушение основного требования к классификаторам. Правда, практический классификатор имеет свою специфику, так что некоторые отступления возможны, если они решают частные задачи.

Конкретные замечания к любому классификатору всегда могут составить объем, сравнимый с его собственным объемом - любая классификация субъективна, она так или иначе загоняет богатую действительность в жесткие рамки. Но некоторые принципиальные отклонения от правил составления классификаций необходимо отметить.

Выделение крупных политематических разделов, связывающих рубрики только на основе доктрины, традиции - является неинформационным подходом, вносящим путаницу и дублирование в весь Классификатор. Рубрикатор предназначен для обработки конкретных текстов, что не всегда подчинено доктринальному пониманию.

Неоправданно узкие формулировки рубрик затрудняют возможность установления их взаимно-однозначного соответствия текстам актов.

Нарушение требования равномерности - одинаковой степени подробности и расчлененности классов объектов - наблюдается во многих случаях.

Для качественного Классификатора необходима одинаковая значимость рубрик одного уровня, аналогичность представления близких по типу рубрик - унификация их представления

Невыверенность ссылочного аппарата, гипертекстовых возможностей ухудшает показатели рубрикатора как поискового аппарата.

Итак, понятно, что рубрикатор - вещь в принципе несовершенная, он членит многообразный и многоаспектный мир достаточно примитивными способами, поэтому избежать недочетов можно только абсолютно четко осознавая цель, для которой он предназначен. Чем цель уже, тем точнее может быть рубрикатор, для нее созданный. Общеправовая же нацеленность любого рубрикатора предоставляет неограниченные возможности для его критики. Главная задача такого рубрикатора - объединительная, его существование оправдано в случае, если ему удастся создать общую платформу для различных информационно-поисковых систем. А это скорее задача организационная. Конкретно же каждый новый рубрикатор должен быть опробован на представительном массиве нормативных актов, сравнить с результатами обработки с помощью других классификаторов. Плюс - экономическое обоснование необходимости замены одного рубрикатора другим.

^ Алфавитно-предметный указатель Рубрикатора (АПУ)

Рубрикатор является средством поиска в информационных массивах, а АПУ - средством поиска в Рубрикаторе. Алфавитно-предметный указатель - алфавитный перечень наименований понятий, отраженных в рубриках Рубрикатора, с соответствующими кодами (обозначенными справа от наименований). АПУ весьма необходим в случае сравнения различных рубрикаторов, приведения их в соответствие и перекодировки.

^ Тезаурус терминов Рубрикатора

Как было сказано выше, Тезаурус - мощное, но трудоемкое лингвистическое средство. На базе Рубрикатора и АПУ можно попытаться создать квазитезаурус, который послужит цели более комфортной работы пользователя. Тезаурус терминов Рубрикатора является средством поиска и организации информации в алфавитно-предметном указателе и может быть,в принципе, использован в этом качестве на массиве законодательных текстов. Его употребление расширяет возможности системы, предоставляя пользователю дополнительную информацию о терминах, выражающих интересующую его тему. Элементами тезауруса являются термины Рубрикатора, включенные в состав АПУ. Включение терминов Расширенного рубрикатора резко повысит поисковую ценность квазитезауруса, приблизив его к функциям тезауруса терминов НА.

^ Автоматическое рубрицирование

как перспективный способ обработки текстов

В основе решения задачи автоматического рубрицирования лежит формализованное установление соответствия содержания рубрики рубрикатора лексическим единицам текста.

Рубрицирование нормативных правовых актов производится высококвалифицированными специалистами, которые владеют как правовыми знаниями, так и информационным аппаратом. Таких работников сложно найти, да еще необходимо настроить их на специфику работы. Однако и в этом случае высока доля субъективизма в отнесении темы акта к той или иной рубрике. Часто, боясь пропустить информацию, специалист приписывает фрагменту текста все мыслимые и немыслимые ассоциации с рубрикатором, в связи с чем одной правовой норме ставится в соответствие целый список индексов и этим усложняется поиск необходимой информации и ухудшается его качество. Иной раз наблюдается обратная картина: норме приписана первая подходящая рубрика, а другие рубрики, также соответствующие комплексному содержанию нормы, отсутствуют, что вызывает потерю информации.

Кроме того, рубрицирование актов - кропотливая и длительная работа, и при огромных объемах просматриваемого материала она может отнять большую долю рабочего времени и задержать другие технологические операции.

Из сказанного следует, что желательно искать новые пути семантической обработки нормативных документов. Одним из них является автоматическое рубрицирование правовых норм.

Решение данной задачи лежит в русле формализации установления соответствия каждой рубрике лексических единиц текста нормативного правового акта. А для этого необходимо:

- иметь текст, расчлененный на тематически однородные фрагменты. В большой степени такому членению соответствует официальное разбиение текста на структурные единицы (во всяком случае, это декларируется во всех материалах, посвященных законодательной технике), но зачастую на практике это не так, поэтому текст должен быть подготовлен с позиций этих требований;

- иметь возможность вычленять в тексте значимые слова и словосочетания;

- иметь рубрикатор, расширенный лексическими единицами, отражающими содержание рубрики.

^ Расширение содержания рубрикатора

Содержание рубрики Рубрикатора может быть раскрыто списком понятий, высокая степень конкретности которых не позволяет использовать их в основном составе Рубрикатора. В противном случае это приведет к неоправданной громоздкости Рубрикатора, слишком длинным кодам, что чрезвычайно затрудняет использование Рубрикатора, особенно рубрицирование и поиск по нему - увеличиваются затраты времени и количество ошибок. Наличие уточняющих понятий в составе рубрики позволяет повышать качество рубрицирования и поиска и, что очень важно, увеличивать степень взаимно-однозначного соответствия между информацией, заключенной в нормативно-правовых актах, и содержанием рубрик Рубрикатора.

Расширение рубрики конкретными терминами позволяет формальным образом описать ее содержание во всех аспектах, а следовательно - с достаточной точностью установить соответствие рубрики значимым лексическим единицам текста нормативного акта.

Содержание рубрики Рубрикатора раскрывается списком понятий, высокая степень конкретности которых не позволяет использовать их в основном составе Рубрикатора. В противном случае это приведет к неоправданной громоздкости Рубрикатора, слишком длинным кодам,что чрезвычайно затрудняет использование Рубрикатора, особенно индексирование и поиск по нему.

Пример раскрытия содержания рубрики:

070.070.000 Время отдыха

070.070.010 Выходные и праздничные дни

- Новый год 1-2 января

- Рождество 7 января

- Международный женский день 8 Марта

- День Победы 9 Мая

- День России 12 июня

Однако представление уточняющей лексики в виде простого списка не всегда является идеальным решением. Термины, приписанные к рубрике, должны быть систематизированы. Лучший способ - организация данной лексики в виде тезаурусных статей. Это позволяет пользователю получать дополнительную информацию об интересующей его теме.

070.210.090 Медицинские работники

Врачи

- Терапевт

- Педиатр

- Хирург

- Окулист

- Стоматолог

- Психиатр

- Нарколог и др.

Средний медицинский персонал

- Медицинская сестра

- Фельдшер и др.

Младший медицинский персонал

- Санитар и др.

Фармацевтические работники

- Провизор

- Фармацевт и др.

Содержание фрагмента текста характеризуется совокупностью значимых слов и словосочетаний, входящих в него, а также терминами, выражающими латентную информацию. Данная лексика включается в информационный словарь. Лексика для раскрытия содержания рубрик также выделяется из текстов нормативных актов, т.е. из состава информационного словаря.

Процесс определения необходимых терминов происходит следующим образом. Прежде всего, из текста удаляются незначимые слова и неинформативные словосочетания. С помощью программных средств в оставшемся тексте выделяются одиночные термины и словосочетания. Они и проверяются на соответствие лексике, выражающей содержание рубрики, и, в случае совпадения (по определенным критериям), данному фрагменту текста приписывается индекс данной рубрики.

Для облегчения работы по организации лексики предлагается некоторая систематизация по принципу определения семантических полей.

Наилучшим образом поддающимися типизации оказались, например, следующие сферы правового регулирования, выделенные в рубрикаторе как рубрики: отрасли промышленности, отрасли сельского хозяйств, наука, транспорт, связь, информация, космос, строительство, оборона, образование, здравоохранение, жилищно-коммунальное хозяйство, физкультура и спорт, культура, религия, телевидение и радиовещание, архивное дело пробирное дело измерительное дело и т.п.

В содержании данных рубрик эксплицитно выделяются типичные группы признаков, которые характеризуют участников действия и их действия или роли в конкретных нормативных ситуациях ( т.е. субъекты и предметы правового регулирования, типичные правовые отношения), а также характерный предметный мир.

Сетка субъектно-объектных отношений позволяет улучшить качество организации информации и ее поиска. Возможно предложить стандартную схему наполнения каждой из соответствующих рубрик. Схема устройства подобных тематических полей состоит из двух частей - специфической и общей.

Для специфической части характерны следующие позиции:

основные направления деятельности, функции, задачи в данной сфере

органы, руководящие данной отраслью

основные организации и предприятия

должностные лица

работники и специалисты, специфические профессии

лица, регулируемые законодательством данной отрасли

специфические документы, функционирующие в данной отрасли

договорные отношения (виды договоров, субъекты договорных отношений, ответственность, санкции)

предметный мир, характерный для данной сферы (виды транспорта, товаров, техники, животных, лекарств...)

подотрасли (разработка каждой аналогична разработке отрасли)

виды работ и процессов.

^ Общая часть содержания рубрик данного типа включает следующие основные позиции:

организационные вопросы деятельности предприятий, организаций (ликвидация...) типовая структура органов, предприятий, организаций (управления, сектора, отделы, филиалы, бухгалтерия, канцелярия...)

кадровые вопросы, штаты (численность, поощрения...)

вопросы труда и зарплаты

функционирование должностных лиц (отчетность, права, обязанности)

категории работников (временные, сезонные...)

категории работ (временные, сезонные...)

виды предприятий, организаций (по подчиненности, видам собственности)

учет, отчетность, статистика, контроль

стандарты, качество

делопроизводство

финансирование, кредитование отраслей, организаций, предприятий

материально-техническое снабжение организаций, предприятий

планирование

фонды предприятий

хозяйственная, финансовая, экономическая, коммерческая деятельность предприятий

административно-хозяйственная деятельность организаций, предприятий

деятельность органов, предприятий в правовой сфере (вопросы применения законодательства, обобщение практики, предложения по совершенствованию законодательства, издание ведомственных актов ...)

международная, внешнеэкономическая деятельность органов, предприятий

информационная деятельность органов, предприятий

обеспечение, обслуживание работников предприятий (жилищные, культурно-бытовые вопросы...) и т.п.

Что касается рубрик другого типа, они стандартизуются в меньшей степени, однако и в них возможно и удобно выделение субъектов и объектов правовых отношений и терминов, обозначающих эти правовые отношения.

Предлагается данную сетку субъектно-объектных отношений, входящих в содержание рубрики, заполнять терминами, взятыми из текстов нормативных актов, а также из стандартов и других информационно-справочных материалов. Это существенно облегчает работу по наполнению рубрики конкретной лексикой.

Предложенная типологизация лексики выполняется в русле деятельности по формализации наполнения рубрики конкретной лексикой. Это позволяет более точно определять взаимно-однозначное соответствие между информацией, заключенной в нормативно-правовых актах, и содержанием рубрик Общеправового рубрикатора - то есть повышает реальность осуществления автоматического рубрицирования документов.


КЛАССИФИКАТОРЫ

К Классификаторам системы относятся:

- Классификатор органов, принявших акт;

- Классификатор видов актов;

- Классификатор источников опубликования и др.

Классификаторы служат поисковыми элементами системы, включая в себя реквизиты нормативных актов.

Данные материалы зачастую однако практически являются не классификаторами, а списками, причем не выстроенными даже по строгому алфавиту, применяющими разные виды записи органов полные и сокращенные. Это снижает их поисковую ценность, влечет неоднозначное соответствие реквизитам из нормативных актов, дублирование и т.п.

Информация о номенклатурных наименованиях органов, предприятий, учреждений и организаций, об их образовании, структуре, реорганизации, упразднении жизненно интересна потребителю, т.к. он далеко не всегда точно знает действующее в определенный период или официальное сокращенное название. Кроме того, следует разработать систему, демонстрирующую "судьбу" органа в разные периоды (время организации и ликвидации, расформирование, переименование, передачу функций, изменение компетенции и т.п.), что может иметь самостоятельную информационную ценность. При современных технических возможностях возможно электронное трехмерное представление списка названий и переименований органов с учетом изменения их компетенции, функций и т.п.

Интересно также разработать Тематический классификатор названий органов, разбивающий все органы на группы в соответствии с их функциями: например, законодательные органы, судебные органы, органы здравоохранения, органы образования, финансовые органы и т.п. Возможно создание Тезауруса наименований органов –совокупности словарных статей, где заглавным словом явится современное наименование, а входить в нее будут названия органа, применявшиеся ранее.

Создание таких классификаторов позволило бы вовремя выявлять и решать чисто лингвистические проблемы (избегать ведомственного подхода в оформлении таких наименований, вовремя привлекать к ним внимание компетентных служб русского языка, которые вырабатывают лингвистические нормы), проблемы оформления нормативно-правовых актов, организационно-распорядительных документов, а также острые проблемы информационного поиска по реквизитам нормативных правовых актов.

Одним из главных принципов формирования таких словарей является постоянное обновление (в соответствии с развитием речевой практики, с изменениями в жизни общества) списка наименований.

Актуально формирование словаря географических наименований - от глобальных до локальных. Его также можно постоянно пополнять, корректировать, сохраняя прежние наименования, их сокращенные варианты, указывая даты и причины изменения названий. Такой перечень позволил бы выявлять процессы, тенденции номинации географических объектов в широком социально-политическом и собственно лингвистическом контексте.

Также ценным инструментом в правотворческой, правоприменительной и информационной работе являются словари наименований единиц систем измерений, денежных единиц и др.


^ ТЕМАТИЧЕСКИЙ КЛАССИФИКАТОР


Кажется очень интересным создание тематического словаря классификатора вопросов по наиболее актуальным темам. Представляется, что он может быть устроен наподобие тезауруса, только вместо ключевых слов в нем - сформулированная тема. Результаты работы с подобным словарем очень интересны и перспективны. Поиск по такому классификатору точный и полный, возможно быстрое создание локальных баз, тематических подборок. Ознакомление с таким словарем на этапе работы над законопроектом создает предпосылки для качественной подготовки закона, с его помощью уточняется структура законопроекта, его терминология, снимается проблема "белых пятен" в законодательстве, совершенствуется вся законодательная система.


^ МНОГОЯЗЫЧНЫЙ СЛОВАРЬ ПРАВОВОЙ ТЕРМИНОЛОГИИ


В условиях многонационального состава Российской Федерации, активизации законодательной деятельности национально-государственных образований, входящих в состав России и СНГ, необходимости гармонизации межнациональных отношений составление словарей, сопоставляющих понятия на русском и национальных языках, чрезвычайно актуально. В то же время важно отметить, что его разработка возможна лишь в условиях автоматизации справочно-информационной правовой службы в национально-государственных образованиях. Квалифицированно составленный многоязычный словарь может стать важным средством реализации языковой политики в области законодательства.

Необходимы также и многоязычные сравнительные словари нескольких государств (например, ряды терминов, обозначающих юридические понятия на русском, английском, французском и испанском языках), что обеспечит поиск информации по законодательству в правовых системах других государств.


^ МНОГОЯЗЫЧНЫЙ СЛОВАРЬ ПРАВОВОЙ ТЕРМИНОЛОГИИ


Представляется полезной разработка словаря пересекающихся терминов российского права и других правовых систем, поскольку прямой перевод не отражает особенности их содержания. Конструкция словаря должна строится таким образом:

Термины российского права - толкование, примеры использования;

- эквивалент в англо-американской системе права - особенности использования, толкование, примеры использования;

- эквивалент в континентальной системе права, особенности использования, толкование, примеры использования.

Ориентация на общепризнанные принципы и нормы международного права, укрепление позиций, авторитета России как субъекта международных отношений, активизация развития межгосударственных договорных отношений делают актуальной задачу создания такого словаря международно-правовой терминологии.


^ ПЕРЕЧЕНЬ АББРЕВИАТУР И СОКРАЩЕНИЙ


Как известно, в законодательстве довольно много полных (аббревиатур) либо частичных сокращений, особенно в названиях многочисленных органов и организаций, в технических наименованиях, и правоприменительные органы и отдельные лица зачастую испытывают трудности при применении норм с такими сокращениями. Необходимость издания словаря сокращений связана также с тем, что в процессе правотворческой деятельности не всегда соблюдается правило использования сокращений в законодательстве. Такое правило определяет, что в нормативных актах используются только общепризнанные и широко вошедшие в обиход сокращения. Что касается наименований органов, организаций и других объектов, то они приводятся в нормативных документах в полном соответствии с их официальным наименованием, предусмотренном в уставах, положениях, в решениях о создании, реорганизации и т. д., а употребление сокращенных наименований допускается в тех случаях, когда такое наименование сформулировано в такого рода актах. Если возникает необходимость дать сокращение длинных и громоздких наименований, которые неоднократно используются в нормативном акте, то при первом упоминании они даются в полном объеме с приведением в скобках его сокращения, а затем используется лишь сокращенное наименование. Однако на практике такое правило часто не соблюдается. Словарь сокращений облегчит жизнь законодателям и пользователям.


^ ВСПОМОГАТЕЛЬНЫЕ СЛОВАРИ


Данные словари позволяют хорошо ориентироваться в системе сложного и разветвленного лингвистического обеспечения. К таким словарям могут относится:

словари (алфавитно-предметные указатели, тезаурусы терминов) рубрикаторов, классификаторов, картотек;

словари терминов, используемых в локальных базах, подборках тематических документов и т. п.

^ СТАТИСТИЧЕСКАЯ ИНФОРМАЦИЯ


Вместе с вышеназванными словарями и подборками в автоматизированный банк данных уместно включить сведения, образующие различные количественные характеристики используемых в законодательстве терминов. К ним относятся, например, сведения об общем числе используемых в различных нормативных актах или систематизированных изданиях (Своды законов, систематические и хронологические собрания действующих актов) терминов, числе изменений, вносимых в тексты актов в связи с нормативным изменением терминов и названий, частоте использования отраслевых, межотраслевых и общеотраслевых терминов, числе специальных юридических терминов, оценочных понятий, нормативных дефиниций, аббревиатур во всем массиве законодательства и в отдельных его отраслях и т.д. Современная вычислительная техника позволяет оперативно получать статистическую информацию.

Создание частотных словарей юридических терминов позволит проследить динамику развития значений терминов и поможет в выработке рекомендаций по их применению, сделает корректной предмашинную обработку документов (индексирование и др.)


^ БАНК ЮРИДИЧЕСКИХ ТЕРМИНОВ


Развертывание работы в указанной сфере предполагает создание обширного автоматизированного банка терминологических данных, который должен состоять из различных словарей, перечней, статистической информации.

Терминологическая работа в области юриспруденции в широком понимании имеет два основных аспекта: научно-методологический и практический.

Научно-методологический аспект охватывает такие виды работ как выявление, формирование, определение, уточнение юридических понятий; установление взаимосвязи между ними; стандартизация терминов.

Практический аспект заключается в том, чтобы обеспечить эффективное использование стандартизованных терминов в правотворческой и правоприменительной сферах, а также в сфере правовой информации.

Каждый из указанных аспектов терминологической работы может быть автоматизирован с применением современных средств вычислительной техники путем создания автоматизированного банка данных юридических терминов - фонда слов и выражений, используемых в законодательстве, и разнообразных - грамматических, семантических, стилистических и других сведений о них для законотворческой, правоприменительной деятельности; составления разного рода словарей, справочников, указателей, энциклопедий и других справочно-информационных материалов; проведения научно-лингвистических исследований; унификации и стандартизации терминологии; выявления "белых пятен" в системе законодательства; а также для решения задач правовой информации и информатизации.

Основой банка терминологических данных могли бы быть перечни терминов с определенными пояснениями, контекстами, в которых эти термины встречаются, терминами-синонимами, а также разного рода дополнительная информация - источники, из которых взяты термины, частота употребления слов в нормативном массиве и т. д.

Банк юридических терминов должен быть обеспечен возможностями осуществлять:

ввод, логический контроль и формирование в памяти машины электронного юридического словаря;

формирование и ведение электронного классификатора юридических терминов (определение взаимосвязи терминов);

формирование и ведение электронной картотеки юридических терминов (обстоятельства возникновения, частота использования, наиболее типичные случаи использования терминов);

формирование аналогов на других языках и сравнительный анализ их применения.

Пользователям подобного банка данных предоставляются возможности получения:

дефиниций интересующего термина;

синонимов термина и терминов, состоящих с ним в родовидовых отношениях;

грамматической, семантической, стилистической характеристик термина,

аналогов на других языках и др.

С позиции государственных интересов, подобный банк данных может быть централизованным с наличием единой службы его организации и ведения, так как информация, заложенная в нем является объективной, единой и одинаково необходимой для всех потребителей правовой информации. Кроме того, централизация фонда юридической лексики обосновывается следующими причинами:

экономия трудовых и материальных ресурсов;

экономия времени в связи с отсутствием дублирования в создании и ведении средств обеспечения системы.

возможность привлечения к работе высококвалифицированных специалистов.

возможность использовать новейшую технику и специальное программное обеспечение;

организация оперативного получения новейшей информации из всех источников и внесения изменений;

сосредоточение в одних руках информации, концептуальных решений и организации практических разработок.

В зависимости от возможностей программного и технического обеспечения, характера и объема терминологических потребностей абонентов банк терминологических данных мог бы состоять из ниже определяемых конкретных лингвистических средств.