Ответы к экзамену по специальности Информатик-технолог
Информация - Компьютеры, программирование
Другие материалы по предмету Компьютеры, программирование
ешаются при разработке прикладных задач (ввод текста, обнаружение ошибок, автоматическом переводе с одного языка на другой, при кодировании и классификации, составлении рефератов). Успех зависит тот полноты и качества языковых средств.
При этом ЛО разделяется на следующие части:
1. декларативная единицы языка, различные грамматические тексты (языковые единицы отдельные слова/сочетания, приставка, корень, суффикс вся значимая часть слова);
2. процедурная средства манипулирования единицами языка:
- морфологический анализ (анализ слов/сочетаний);
- семантический анализ (смысловой анализ);
- синтаксический (построение предложений).*, ВИНИТИ словарь, содержащий информацию научно-технической документации и общественно-политического содержания. Было обработано свыше 80 млн. книг.
Основное средство - Языковые средства, должны:
- подбираться в соответствии с решаемыми задачами,
- быть простыми и отличаться гибкостью, чтобы их можно было можно использовать в комплексе.
ЛС предметной области термин слово/сочетание точно обозначающее конкретное понятие (форма фиксации знания).
Термин в качестве ЛС как особая подсистема языка. Использование терминов позволяет:
- конкретно выделить и очертить границы;
- отслеживать развитие конкретного знания в конкретной области;
- показывает динамику развития знания;
- очертить структуру научного знания;
- выделить связи и все интегрированные процессы в структуре научного знания.
Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.
Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.
Методика Т.А. опирается на приемы прикладной лингвистики:
1.Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);
2.Семантические поля отдельные разделы, подразделы;
3.Класс условной эквивалентности анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.
Самые сложные процедуры:
- установление родовидовых отношений;
- установление ключевых слов.
В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше шума.
5. Термин лексическое средство описания предметной области.
Термин в качестве ЛС как особая подсистема языка. Использование терминов позволяет:
- конкретно выделить и очертить границы;
- отслеживать развитие конкретного знания в конкретной области;
- показывает динамику развития знания;
- очертить структуру научного знания;
- выделить связи и все интегрированные процессы в структуре научного знания.
Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.
Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.
Методика Т.А. опирается на приемы прикладной лингвистики:
4.Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);
5.Семантические поля отдельные разделы, подразделы;
6.Класс условной эквивалентности анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.
Самые сложные процедуры:
- установление родовидовых отношений;
- установление ключевых слов.
В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше шума.
6. Информационно-поисковый тезаурус.
При разработке ИПТ применяется ГОСТ 7.25-80 Тезаурус информационно-поисковый одноязычный, ГОСТ 7.14-80 -/- многоязычный. ИПТ представляет собой обычный словарь слов/сочетаний отраслевой словарь. Тезаурус от лат. хранилище, клад.
13 в. составление книг о сокровищах.
17-18 вв. словари-справочники при составлении служебных дисциплин.
1950 гг. С развитием машинного перевода (совр. тезаурус).
Тезаурус имеет узко прикладное назначение обработка информационных запросов.*, информатика Шрейдер, Гольштейн, Брониславский.
Методика составления тезаурусов:
1.предметная выборка всех ключевых слов конкретной предметной области;
2.определение всех взаимосвязей между отдельными терминами.
Сама предметная область м.б. задана как аксиома (область естественных знаний: математика, химия, физика).
3.уточнение предметной области;
4.анализ всего массива документов (насколько точна предметная область);
5.разработка всех взаимосвязей;
6.весь набор терминов на экспертизу спецов-аналитиков для которых разрабатывается тезаурус.
Вся стадия разработки ИПТ выполняется совместными усилиями спецов различных профессий: спец. ПК, спец. конкретной области.
Требования при разработке тезауруса:
1.массив документов д.б. достаточно однородным;
2.ограниченное число авторов (устранение ра