Книги по разным темам Pages:     | 1 |   ...   | 40 | 41 | 42 | 43 |

Для проверки правильности индексирования документов экспертами используется структурная тематическая аннотация содержания документа, представляющая шахматную запись основных тематических узлов и силы связей между ними (на пересечении соответствующего столбца и строки).

Технология автоматического рубрицирования:

Х опора на знания, описанные в тезаурусе;

Х представление рубрики в виде логической формулы для небольшого числа опорных концептов, затем автоматическое расширение с использованием иерархической структуры тезауруса.

При рубрицировании в тексте определяются понятия, приписанные к той или иной рубрике (точнее, к операндам логической формулы описания рубрики).

Оценка значимости каждого понятия, упоминаемого в тексте, в зависимости от места в тематическом представлении позволяет уверенно определять оценку значимости рубрики.

В задаче Право применяется версия Общего правового классификатора нормативных актов (принятая Указом Президента РФ от 15.03.2000 г.), где сокращены нижние уровни общего законодательства, но значительно подробнее представлена тематика избирательного права.

Классификатор правовых актов включает:

010.000.000 Конституционный строй 020.000.000 Основы государственного управления 030.000.000 Гражданское право 040.000.000 Семья 050.000.000 Жилище 060.000.000 Труд и занятость населения 070.000.000 Социальное обеспечение и социальное страхование 080.000.000 Финансы 090.000.000 Хозяйственная деятельность 100.000.000 Внешнеэкономическая деятельность. Таможенное дело 110.000.000 Природные ресурсы и охрана окружающей природной среды 120.000.000 Информация и информатизация 130.000.000 Образование. Наука. Культура 140.000.000 Здравоохранение. Физическая культура и спорт. Туризм 150.000.000 Оборона 160.000.000 Безопасность и охрана правопорядка 170.000.000 Уголовное право. Исполнение наказаний 180.000.000 Правосудие 190.000.000 Прокуратура. Органы юстиции. Адвокатура. Нотариат 200.000.000 Международные отношения. Международное право 210.000.000 Индивидуальные правовые акты по кадровым вопросам, вопросам награждения, помилования, гражданства, присвоения почетных и иных званий.

Применяемая технология позволяет обеспечить автоматическую классификацию нормативных актов с качеством на уровне человека-индексатора.

Кроме того, имеются средства корректировки, позволяющие в случае необходимости исправить ошибки.

Следует отметить, что аналогичная технология обработки документов АЛОТ используется также в таких организациях, как ГосДума РФ, Центральный Банк, ФСБ, МГУ, компания Гарант.

Поиск данных:

Х Формирование запроса - в задаче Право реализованы развитые средства формирования запросов любой сложности с использованием логических условий, разных типов поисковых индексов, как по метаданным, так и по контексту и тематике.

Х Запрос на естественном языке - это традиционный для пользователей Интернета или стандартных правовых систем вид запроса. При его обработке в задаче Право используются проверка орфографии, морфологический анализ запроса.

Х Запрос по рубрикам.

Х Запрос по тематикам - использование тезауруса и индексирования по технологии АЛОТ позволяет формировать и исполнять поисковые запросы по понятиям тезауруса, при этом релевантными являются документы, которые содержат хотя бы один из синонимов выбранного понятия. Так как тезаурус представляет собой иерархическую сеть понятий, то определен и запрос по иерархии связей тезауруса, при этом релевантными являются документы, содержащие хотя бы один из синонимов выбранного понятия или хотя бы один их синонимов иерархически подчиненных понятий.

Х Использование запросов, сохраненных в базе данных.

Специальные функции задачи Право Х Ведение терминологического словаря.

Х Выборка из текста нормативного правового акта формализованных показателей.

Х Пересылка данных.

Х Функция Поиск похожих документов.

Х Функция Поиск лответов на вопрос на естественном языке (только для КСА ЦИК).

Х Функция сравнения версий документов.

Планы развития задачи Право В целом программное обеспечение задачи Право прошло определенное историческое развитие. Существовали версии под MS DOS, в качестве базы данных использовалась локальная база данных Clipper, затем был переход на SQLBase. Сейчас основной СУБД является Oracle.

В связи с расширением состава документов сейчас производится переход на хранение поисковых индексов в виде инвертированных списков, обеспечивающих быстрый поиск с учетом словопозиций контекста в документе, поддержка поиска по фрагментам документов, в том числе с учетом структуры.

Вводятся специальные интерфейсы поиска информации, например, по ситуациям в ходе выборов.

Выводы Таким образом, задача Право ПАИП ГАС Выборы обеспечивает правовую поддержку избирательной системы РФ в период подготовки и проведения выборов и референдумов по всей стране.

Программные и технические решения, используемые в задаче Право, наряду с типичными для правовых систем имеют ряд важных особенностей:

Х распределенное ведение базы данных, включая развитые средства обмена данными;

Х гибкая система ввода документов;

Х широкое использование методов автоматической лингвистической обработки документов, включая автоматическое концептуальное индексирование и рубрицирование по правовому классификатору.

Технологии задачи Право продолжают динамично развиваться с включением новых функций, обусловленных изменением законодательства и модернизацией ГАС Выборы.

Технологические вопросы обработки и использования правовой информации на примере сайтов и автоматизированных рабочих мест Е.аА.аРазумовская* 1. Критерии качества для сайтов.

Информационные и интерактивные сайты Сайты, как и все, что создают люди, служат для решения какой-то задачи, и чтобы ответить на вопрос, хороший сайт или плохой, нужно определить, хорошо ли он решает поставленную задачу. Задачи, которые могут быть поставлены перед сайтом, делятся на два основных класса:

1. Предоставление информации пользователям.

2. Обмен информацией между пользователем и другими пользователями или администрацией сайта.

Самым важным критерием в предоставлении информации пользователям является наглядность, удобное представление информации, интерфейс.

В первую очередь это достигается за счет дизайна - расположения блоков меню и содержимого (в интернет-терминологии - контента), подбором шрифтов и фонов, изображений, чтобы читать сайт было приятно. Структурируется информация на сайте с помощью многоуровневых меню, основное обычно располагают в верхней части главной страницы под логотипом сайта или вокруг него.

Если сайт предоставляет каталог каких-то объектов, объединенных в категории, которые в свою очередь объединены в супер-категории, и т. д., то хорошим тоном является отображение иерархии документов в удобном виде. Как правило, для этого слева помещают меню с категориями текущего уровня, выбранная категория выделена, если есть место, отображаются * РазумовскаяаЕленнатольевна, ст. преподаватель кафедры общегуманитарных и социально-экономических дисциплин, Санкт-Петербургский юридический институт (филиал) Академии Генеральной прокуратуры РФ.

родительские и часть дочерних. Иногда, если это не слишком загромождает меню, отображается полный путь до текущего документа (в интернет-терминологии - метод хлебных крошек - brad crumbs). Например, на сайте Прокуратуры Санкт-Петербурга слева отображается меню возможностей: основополагающие документы, руководство, структура, новости и пр. При выборе пунктов меню, имеющих подпункты, отображаются оба уровня.

>> Руководство > Руководитель > Заместители.

Дополнительно для удобства пользователя кроме предоставления информации данного сайта предлагаются подборки подобных документов или список других ресурсов по данной теме. В случае правовой тематики это может быть отсылка к документам других регионов, вышестоящей инстанции, смежным правовым вопросам или более широкому тематическому перечню.

Например, с сайта Прокуратуры Санкт-Петербурга есть переходы на низший уровень - к информации районных и специализированных прокуратур, параллельно на сайты прокуратур других субъектов РФ и вверх по иерархической лестнице - на сайты Генеральной прокуратуры и других органов власти РФ.

Если возможностей основного и иерархического меню не хватает, то непосредственно контент оформляется в виде классификатора (как правило, алфавитного списка), выбор категории переводит пользователя на другую страницу сайта.

На современных сайтах выбор региона, города или района предоставляется по карте страны или города соответственно. Именно так организован выбор района города на сайте Прокуратуры Санкт-Петербурга и выбор региона на сайтах Генпрокуратуры и Президента РФ.

Дополнительные услуги, которые может предоставить сайт, - это режим работы для слабовидящих, автоматический перевод всей информации на иностранный язык и др. Примером оснащения сайта дополнительными функциями является сайт Президента России.

Еще одним критерием качества сайта является скорость работы, точнее, скорость загрузки страниц - реальное время, которое прошло с момента клика по ссылке на сайте до полного отображения контента.

Быстрыми считаются сайты, у которых время загрузки страниц не превышает 0,1 секунды, т. е. то время, которое человеку кажется почти моментальным, сравнимое с реакцией глаз и мозга.

Если страница грузится больше 0,5 секунды это уже медленно, больше 1 секунды - очень медленно, работа с таким сайтом вызывает ощущение дискомфорта у пользователя.

Особенно важным этот критерий становится для сайтов с большой посещаемостью и большими базами данных, по которым необходим поиск. Первые сложны тем, что требуют мощных серверов для быстрого обслуживания большого числа посетителей. Считается, что:

до 100 уникальных пользователей в день - мало посещаемый сайт;

100Ц1000 - более-менее посещаемый;

1000Ц10 000 - посещаемый сайт, скорее всего, это полезный ресурс и на нем ведется активная жизнь пользователей.

Сайты, имеющие более 50 000 уникальных посетителей в день, - это очень посещаемые сайты, требующие мощный сервер (иногда не один). Таких сайтов на несколько порядков меньше, чем вышеперечисленных.

Суперпопулярные гранды рунета - порталы: ВКонтакте, Mail.ru, Яндекс.

Их посещаемость измеряется миллионами активных пользователей в день.

Это сложнейшие системы, располагающиеся часто не в одном дата-центре с тысячами серверов.

Также проблемы скорости загрузки могут испытывать не очень посещаемые сайты, но с большими базами данных (большой считают базу размером более 500 000 текстовых или графических файлов), в которых необходим функциональный поиск. Самым сложным видом поиска является поиск контекста, так называемый полнотекстовый поиск, также часто становится сложным поиск по большому числу критериев.

Теперь поговорим об интерактивных сайтах.

Интерактивность сайта может быть ограниченной: пользователю предоставляются некие формы для заполнения, данные отправляются администрации вместе с контактами пользователя, дальнейшее общение происходит уже вне электронной среды (по интернет-терминологии - офлайн). Более развитые интерактивные сайты предоставляют полноценную среду для общения между пользователями, а также пользователями и администрацией ресурса.

Грамотное составление формы для заполнения является сложнейшей задачей, над которой в компаниях - разработчиках сайтов работают высококлассные специалисты - проектировщики интерфейсов (в интернет-терминологии - юзабилисты).

Опыт конструирования интерфейсов показывает: чем меньше полей у формы - тем лучше. Поля надо располагать сверху вниз, размещение полей в несколько колонок гораздо хуже воспринимается пользователями, повышается вероятность пропуска при заполнении.

Если полей у формы много, то рекомендуется разнести ее заполнение на этапы, группируя поля в смысловые блоки. Например, сначала выводятся главные поля: фамилия, имя, отчество, после заполнения появляется следующий блок полей: дата, место рождения и пол, и т. д. Поля появляются порциями - смысловыми блоками и по нисходящей важности.

Разработчик формы всегда должен помечать, какие поля обязательны для заполнения, а какие - нет. При случайном пропуске пользователем обязательного поля не должен открываться проход к следующему блоку, для повышения комфортности работы пропущенное поле должно подсвечиваться или иначе выделяться среди заполненных или необязательных полей.

Если при заполнении поля пользователь не вводит информацию с клавиатуры, а выбирает из нескольких предложенных возможностей, то они маркируются слева изображениями квадратных кнопок, если возможен выбор нескольких вариантов, или изображениями круглых кнопок в случае уникального выбора (в интернет-терминологии - чекбоксы и радиобаттоны соответственно). Выбранные чекбоксы обычно отмечаются галочками, а радиобаттоны - точками. Хорошим тоном является заранее выбрать самый ожидаемый вариант, но тут надо быть осторожным - пользователь может пропустить неправильно заполненное поле, не заметив его.

Также разумно автоматически вписывать самый ожидаемый вариант в таких полях, как страна, город (определять заранее по IP-адресу компьюP-адресу компью-адресу компьютера), дата заполнения (проставлять текущую) и т. д. Там, где это возможно, пользователю предоставляются встроенные списки вариантов.

Важна проверка правильности заполнения формы (в интернет-терминологии - валидация). Сообщение об ошибках должно быть конструктивным:

мало сказать форма заполнена неверно или телефон введен неверно, хорошо - телефон должен быть введен в формате +7 9хх ххх хх хх. В случаях, допускающих различный формат представления информации, полезно писать пример прямо под полем.

Проводить проверку каждого поля формы лучше сразу после заполнения, в момент попытки перейти к следующему полю или смысловому блоку, а не огорошивать пользователя всеми его ошибками. Для наглядности можно пользоваться подсветкой заполненных полей формы, например: зеленым - правильно, красным - неправильно.

После заполнения и отправки формы на правильно организованном сайте пользователь обязательно получит ответ: подтверждение получения информации, непосредственный результат обработки его данных (если это возможно) или срок и форму ответа на его запрос. Типичным каналом обратной связи пользователя с сайтом является его уникальный почтовый ящик в электронной почте (e-mail), номер его пользователь вводит при регистрации на данном электронном ресурсе.

Для обоих типов сайтов - чисто информационных и интерактивных - важны такие качества, как правдивость и актуальность информации.

Pages:     | 1 |   ...   | 40 | 41 | 42 | 43 |    Книги по разным темам