Вычислительная техника и информатика (ответы на вопросы по кандидатскому экзамену)
Вопросы - Компьютеры, программирование
Другие вопросы по предмету Компьютеры, программирование
µй для улучшения качества поиска не сильно поможет общему горю, потому что оператор вообще, скорее всего, не знает предметной области поиска, что скажется на его результативности в худшую сторону.
Ссылки по теме
Типа ИПЯ: определение особенности назначение
Информационно-поисковый язык.
В настоящее время быстрый рост количества, сложности и срочности информационных запросов, вызванный непрерывным увеличением численности специалистов, а также количества и сложности решаемых ими научно-технических задач и быстрый рост фонда документов, в котором необходимо производить информационный поиск, делает задачу механизации процедуры информационного поиская все более актуальной. Своевременная, точная и полная выдача научных документов в ответ на многочисленные и разнообразные информационные запросы приобретает характер задачи массового обслуживания, которая может быть успешно решена лишь путем применения соответствующих средств механизации и автоматизации. Чтобы процедуру сопоставления поисковых образов документов с информационным запросом можно было выполнить механически, не вникая в их смысл, необходимо их выразить на определенном языке, слова и фразы которого обладали бы смысловой однозначностью. Этот язык информационно-поисковый.
Информационно-поисковый язык (ИПЯ) это специализированный искусственный язык, предназначенный для описания (выражения) центральных тем или предметов и формальных характеристик (тип документа, авторы, название издательства, язык документа и т. п.) документов среди множества других и/или для выражения содержания информационных запросов и поиска нужных документов. Информационный запрос, выраженный на информационно-поисковом языке можно механически сравнивать с поисковыми образами документов, тоже выраженными на этом языке. Если эти два выражения полностью совпадают или первое является частью второго, то документ считается отвечающим на информационный запрос и выдается потребителю. В одной ИПС часто применяется не один, а два разных ИПЯ: один для индексирования документов, а другой для индексирования информационных запросов.
К идеальному ИПЯ предъявляют следующие требования: ИПЯ должен располагать лексико-грамматическими средствами, необходимыми для точного выражения центральной темы или предмета любого текста (документа); ИПЯ не должен быть двусмысленным, т. е. каждая запись на нем должна допускать одно, и только одно, истолкование; ИПЯ не должен содержать элементов, которые как-то связывают сообщение с автором или адресатом этого сообщения; ИПЯ должен быть удобным для алгоритмического сопоставления и отождествления поисковых образов документов с записями, выражающих центральные темы или предметы документов и темы информационных запросов.
Любой письменный язык, в том числе ИПЯ, состоит по крайней мере, из алфавита, словарного состава и грамматики. В ИПЯ используются все или некоторые буквы латинского или кириллического алфавита, арабские цифры, пунктуационные знаки, а также специальные символы. Словарный состав ИПЯ обычно задается одним из следующих способов: перечислением всех без исключения лексических единиц (коды или шифры слов, словосочетанийи выражений естественного языка); перечислением лишь ограниченного числа исходных лексических единиц и формулированием правил построения из них любых других лексических единиц; формулированием правил использования в качестве лексических единиц ИПЯ слов и словосочетаний соответствующего естественного языка. ИПЯ должен иметь развитую систему грамматических средств, которая позволяла бы точно и исчерпывающе описывать любые ситуации, но при этом не порождала бы синтаксической синонимии.
Когда какому-либо документу присваивается поисковый образ, то этот документ обычно включается в более или менее сложный класс, именем которого служит данный поисковый образ.
Для эффективного использования ИПЯ в нем дожны быть выявлены и эксплицитно (в явном виде) выражены важнейшие парадигматические отношения между словами. Парадигматические отношения носят логический характер и определяются содержанием понятий, которые выражаются словами.
Для оценки сравнительной эффективности различных ИПЯ (предкоординированные: перечисленные классификации (иерархические классификации, алфавитно-предметные классификации), фасетные классификации; посткоординируемые: дескрипторные языки, семантические коды, синтагматические языки; язык библиографических ссылок) может быть использовано понятие семантической силы языка, которое характеризует смысловыразительные возможности ИПЯ и показывает, насколько данный ИПЯ в своей коммуникативной функции уступает естественному языку.
Ни один из известных ныне типов и видов ИПЯ не является одинаково высокоэффективным для решения всевозможных информационно-поисковых задач при любых условиях его использования. Для