Ответы к экзамену по специальности Информатик-технолог

Информация - Компьютеры, программирование

Другие материалы по предмету Компьютеры, программирование

ешаются при разработке прикладных задач (ввод текста, обнаружение ошибок, автоматическом переводе с одного языка на другой, при кодировании и классификации, составлении рефератов). Успех зависит тот полноты и качества языковых средств.

При этом ЛО разделяется на следующие части:

1. декларативная единицы языка, различные грамматические тексты (языковые единицы отдельные слова/сочетания, приставка, корень, суффикс вся значимая часть слова);

2. процедурная средства манипулирования единицами языка:

  1. морфологический анализ (анализ слов/сочетаний);
  2. семантический анализ (смысловой анализ);
  3. синтаксический (построение предложений).*, ВИНИТИ словарь, содержащий информацию научно-технической документации и общественно-политического содержания. Было обработано свыше 80 млн. книг.

Основное средство - Языковые средства, должны:

  1. подбираться в соответствии с решаемыми задачами,
  2. быть простыми и отличаться гибкостью, чтобы их можно было можно использовать в комплексе.

ЛС предметной области термин слово/сочетание точно обозначающее конкретное понятие (форма фиксации знания).

Термин в качестве ЛС как особая подсистема языка. Использование терминов позволяет:

  1. конкретно выделить и очертить границы;
  2. отслеживать развитие конкретного знания в конкретной области;
  3. показывает динамику развития знания;
  4. очертить структуру научного знания;
  5. выделить связи и все интегрированные процессы в структуре научного знания.

Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.

Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.

Методика Т.А. опирается на приемы прикладной лингвистики:

1.Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);

2.Семантические поля отдельные разделы, подразделы;

3.Класс условной эквивалентности анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.

Самые сложные процедуры:

  1. установление родовидовых отношений;

- установление ключевых слов.

В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше шума.

5. Термин лексическое средство описания предметной области.

Термин в качестве ЛС как особая подсистема языка. Использование терминов позволяет:

  1. конкретно выделить и очертить границы;
  2. отслеживать развитие конкретного знания в конкретной области;
  3. показывает динамику развития знания;
  4. очертить структуру научного знания;
  5. выделить связи и все интегрированные процессы в структуре научного знания.

Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.

Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.

Методика Т.А. опирается на приемы прикладной лингвистики:

4.Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);

5.Семантические поля отдельные разделы, подразделы;

6.Класс условной эквивалентности анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.

Самые сложные процедуры:

  1. установление родовидовых отношений;

- установление ключевых слов.

В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше шума.

6. Информационно-поисковый тезаурус.

При разработке ИПТ применяется ГОСТ 7.25-80 Тезаурус информационно-поисковый одноязычный, ГОСТ 7.14-80 -/- многоязычный. ИПТ представляет собой обычный словарь слов/сочетаний отраслевой словарь. Тезаурус от лат. хранилище, клад.

13 в. составление книг о сокровищах.

17-18 вв. словари-справочники при составлении служебных дисциплин.

1950 гг. С развитием машинного перевода (совр. тезаурус).

Тезаурус имеет узко прикладное назначение обработка информационных запросов.*, информатика Шрейдер, Гольштейн, Брониславский.

Методика составления тезаурусов:

1.предметная выборка всех ключевых слов конкретной предметной области;

2.определение всех взаимосвязей между отдельными терминами.

Сама предметная область м.б. задана как аксиома (область естественных знаний: математика, химия, физика).

3.уточнение предметной области;

4.анализ всего массива документов (насколько точна предметная область);

5.разработка всех взаимосвязей;

6.весь набор терминов на экспертизу спецов-аналитиков для которых разрабатывается тезаурус.

Вся стадия разработки ИПТ выполняется совместными усилиями спецов различных профессий: спец. ПК, спец. конкретной области.

Требования при разработке тезауруса:

1.массив документов д.б. достаточно однородным;

2.ограниченное число авторов (устранение ра