1. Три формы существования мира. Какие процессы называются информационными?

Вид материалаДокументы

Содержание


2. Автоматизированная информационная система.
3. Какие средства относятся к компонентам АИС?
4. Какие основные два класса АИС существуют?
5. Для чего предназначены ИПС?
6. Что является поисковым массивом ИПС и что в него входит?
7. Что такое поисковый тезаурус и его роль в ИПС?
8. Что такое ПОД - поисковый образ документа?
9. Что такое ПОЗ - поисковый образ запроса?
10. Какие ИС используются для решения задач обработки данных?
11. Что является необходимым начальным этапом разработки любой ИС?
Что такое гипертекст? Что такое гипертекстовая система?
13. Какие три основные направления в гипертекстовых системах используются в настоящее время?
Другое направление
Третье направление
14. Какую возможность предоставляет гипертекстовая система пользо­ва­телю при вводе фрагментов текста в БД?
15. Каково основное предназначение гипертекстовых систем?
16. Что такое гипермедиа системы?
17. Что такое система машинного перевода?
18. Информационная система и управление.
19. Создание модели данных для ФИС. Системный подход.
...
Полное содержание
Подобный материал:
  1   2   3   4   5


1. Три формы существования мира. Какие процессы называются информационными?

Мир существует в трех основных формах: вещество, энергия, информация.

Всё многообразие материальных объектов состоит из вещества. Объекты бывают разного вида:
  1. Макромир – объекты:

- неживые объекты: здания, транспорт, мебель, одежда и т.д.;

- живые: растения, животные, люди и др.

2. Микромир – объекты: молекулы, атомы, элементарные частицы.

3. Мегамир – объекты: планеты, звезды, галактики, млечный путь, Вселенная.

Человек воспринимает окружающий мир (получает информацию) с помощью органов чувств (зрение, слух, осязание, обоняние, вкус). Чтобы правильно ори­ентироваться в мире, он запоминает полученные сведения (хранит инфор­мацию). В процессе достижения каких-либо целей человек принимает решения (обрабатывает информацию). В процессе общения с другими людьми чело­век передает и принимает информацию. Таким образом, человек живет в мире информации.

Процессы, связанные с получением, хранением, обработкой и передачей информации, называются информационными процессами.

История человеческого общества – это история накопления и преобразования информации.


2. Автоматизированная информационная система.

Обмен информацией осуществляется с помощью языков как искусственных так и естественных. Автоматизированная информационная система – это функциони­рующий на основе ЭВМ и других технических средств комплекс, обеспечивающий сбор, хранений, актуализацию и обработку информации в целях поддержки какого-либо вида деятельности.


3. Какие средства относятся к компонентам АИС?

К числу основных компонентов такой системы относятся средства ПО, технические средства ПК, сети ПК, лингвистические средства интерфейсов пользователей и системного персонала, информационные ресурсы, которые хранятся и обрабатываются системой.

В зависимости от характера информационных ресурсов, с которыми имеют дело такие системы, различают два крупных их класса:

- документальные системы;

- фактографические системы.


4. Какие основные два класса АИС существуют?

Автоматизированная информационная система – это функциони­рующий на основе ЭВМ и других технических средств комплекс, обеспечивающий сбор, хранений, актуализацию и обработку информации в целях поддержки какого-либо вида деятельности.

К числу основных компонентов такой системы относятся средства ПО, технические средства ПК, сети ПК, лингвистические средства интерфейсов пользователей и системного персонала, информационные ресурсы, которые хранятся и обрабатываются системой.

В зависимости от характера информационных ресурсов, с которыми имеют дело такие системы, различают два крупных их класса:

- документальные системы;

- фактографические системы.


5. Для чего предназначены ИПС?

Наиболее распространенными видами документальных систем являются информационно-поисковые системы (ИПС), предназначенные для накопления и поиска по различным критериям документов, записанных на естественном языке.

Основные компоненты ИПС – ее программные средства, поисковый массив документов, средства поддержки информационного языка системы, информационно-поисковый тезаурус (ИПТ).


6. Что является поисковым массивом ИПС и что в него входит?

Поисковый массив документов ИПС обычно называется БД. Он чаще всего не содержит непосредственно полных текстов документов, а, как правило, только рефераты или аннотации документов.

При выполнении операций поиска документов система использует их поиско­вые образы – формализованные объекты, представленные на информационном языке системы и отражающие содержание соответствующих документов.


7. Что такое поисковый тезаурус и его роль в ИПС?

Документальные системы служат для работы с документами на естественном языке – монографиями, публикациями, материалами конференций, научными отчетами, диссертациями, авторефератами, текстами законодательных актов и т.д.

Наиболее распространенными видами документальных систем являются информационно-поисковые системы (ИПС), предназначенные для накопления и поиска по различным критериям документов, записанных на естественном языке.

Основные компоненты ИПС – ее программные средства, поисковый массив документов, средства поддержки информационного языка системы, информационно-поисковый тезаурус (ИПТ), представляющий собой словарь дескрипторов с семантическими связями между ними.


8. Что такое ПОД - поисковый образ документа?

При выполнении операций поиска документов система использует их поиско­вые образы – формализованные объекты, представленные на информационном языке системы и отражающие содержание соответствующих документов.

Формирование поисковых образов документов (ПОД) производится при вводе документов в систему автоматически с последующим контролем специалистами в их предметной области. Создание ПОД требует проведения процедуры индексиро­вания документов (рефератов документов) – снабжения их ключевыми словами, (дескрипторами, ЛЕ), рубриками и т.п.


9. Что такое ПОЗ - поисковый образ запроса?

Информационный запрос пользователя также автоматически преобразуется в поисковый образ запроса (ПОЗ) с последующим контролем специалистами в их предметной области.

ПОЗ далее сопоставляется с ПОДами документов, хранимых в системе. В ответ на запрос выдаются рефераты всех документов, поисковые образы которых удовлетворяют ПОЗу. Такие документы называются релевантными запросу.


10. Какие ИС используются для решения задач обработки данных?

Фактографические системы составляют другой класс автоматизированных информационных систем. Характерная особенность этих систем состоит в том, что они оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных.

В то время как документальные системы позаимствовали из технологии БД главным образом лишь некоторые идеи и элементы терминологии БД, в современных фактогра­фи­ческих системах в полной мере используются как методология, так и инструментальные свойства БД.

Фактографические информационные системы, созданные средствами СУБД принято называть банками данных (БнД). Фактографические системы используются не только для реализации различных справочных функций, но и для решения задач обработки данных.

Под задачами обработки данных понимается специальный класс задач, решаемых на ПК, связанных с вводом, хранением, сортировкой, отбором по заданному условию и группи­ровкой записей данных однородной структуры. При этом предусматривается создание и вывод различных отчетов с промежуточными и плановыми итогами по всему отчету.


11. Что является необходимым начальным этапом разработки любой ИС?

Каждая ИС в зависимости от ее назначения имеет дело с той или иной частью реального мира, которую принято называть предметной областью системы. Выявление предметной области является необходимым начальным этапом разработки любой информационной системы. На этом этапе определяются информационные потребности всей совокупности пользователей будущей системы, которые, в свою очередь, предопределяют содержание ее БД.

Рассмотрение реальных объектов в конкретной информационной системе требует абстрагироваться от их несущественных в данном случае свойств. Каждый объект обладает определенным набором свойств (атрибутов). Так, например, компьютер характеризуется названием фирмы-производителя, идентификатором модели, типом микропроцессора, объемом оперативной и внешней памяти, типом графической карты и т.д. Признание какого-либо атрибута существенным носит относительный характер. Атрибуты, существенные в рамках одной системы, могут, естественно, оказаться несущественными в другой ИС. Осмысление предметной области в терминах конкретных объектов оказывается чаще всего громоздким, не позволяет четко выкристаллизовать ее структуру. Поэтому в большинстве случаев прибегают к разбиению всего множества объектов предметной области на группы объектов, однородных по их структуре, называемых типами объектов.

При этом считается, что все объекты одного типа обладают одинаковыми наборами атрибутов и, таким образом, считают их свойства свойствами типа.

  1. Что такое гипертекст? Что такое гипертекстовая система?

Гипертекст – это форма организации текстового материала, при которой его смысловые единицы (фразы, абзацы, разделы) представлены не в линейной последовательности, а как система явно указанных возможных переходов, связей между ними. Следуя этим связям, можно читать материал в любом порядке. Если речь идет о достаточно обширном материале с большим количеством связей, то возникает весьма сложное гипертекстовое пространство (сеть). Формирование и просмотр такой сети возможны только при помощи ПК.

Компьютерная гипертекстовая технология в самой общей форме понимается как «поддержка связей», т.е. обеспечение максимальной комфортности для пользователя при формировании и обработке сети связей. Имеется в виду, прежде всего, предоставление пользователю возможности легко добавить в базу данных новые текстовые единицы, указывая их связи с уже имеющимися. Не менее важна для пользователя простота перемещения по образованной сети, т.е. возможность «читать» гипертекст в любом задуманном порядке.

Гипертекст всегда представляет собой некоторую сеть или граф, отображающие систему связей между смысловыми единицами текста. Свойства гипертекста, его функциональные возможности в значительной степени зависят от структурных характеристик гипертекстовой сети. Она может иметь разную степень сложности, быть иерархической или циклической, члениться на обособленные части, быть «стройной» или «хаотической». Почти все авторы отмечают, что в гипертексте можно «заблудиться», потерять ориентацию, не найти удобных путей чтения.

При формировании смысловых графов автор должен пользоваться определенными критериями и процедурами, чтобы отличать прямую смысловую связь от косвенной связи. Смежными по смыслу считаются лишь те понятия, которые можно объединить при помощи связок (типа «есть», «является причиной», «поэтому», «в этих целях» и др.). Такие графы стали называть «логико-смысловыми графами», а логико-смысловые графы вплотную приблизились к гипертекстам.

Появилась возможность представления предметной области с разной степенью детализации путем построения укрупненных графов, включающих лишь те смысловые единицы, у которых число связей превышает определенный порог. Но для самого гипертекста здесь таятся интересные возможности: ведь таким способом в его смысловой сети можно автоматически отыскивать предпочтительные пути. Так могут интерпретироваться социальные позиции, системы взглядов, научные концепции, новые идеи, которые должны обладать единством, целостностью.

Известны гипертекстовые системы, такие как учебные и справочные системы, в которых пользователь сам выбирает, как ему двигаться при освоении материала в сети связанных по смыслу текстовых фрагментов, причем система подсказывает ему возможные варианты такого движения.


13. Какие три основные направления в гипертекстовых системах используются в настоящее время?

В соответствии с этим в применении гипертекстовых систем сложилось несколько основных направлений. Одно из них – электронная книга – обеспечивает более быстрое освоение материала с большим количеством ссылок и смысловых пересечений. В качестве объектов могут выступать справочные и учебные материалы, проектная и программная документация. Каждый фрагмент (текста) снабжается указанием всех его ссылок и возможных смысловых переходов к другим фрагментам документа.

Другое направление применения гипертекстовых систем – компоновка крупных текстовых материалов из фрагментов, которые первоначально представлены в форме сети с указанием их взаимных смысловых связей.

Третье направление – представление в форме единого гипертекста идей, аргументов и предложений, вносимых участниками коллективной работы, рассмотрение и анализ взаимосвязи этих идей и аргументов.


14. Какую возможность предоставляет гипертекстовая система пользо­ва­телю при вводе фрагментов текста в БД?

Системы предоставляют пользователю возможность при вводе фрагментов текста в БД устанавливать между ними связи (ссылочные, смысловые, логические, ассоциативные и др.), обеспечивают компьютерную поддержку этих связей и перемещение по ним. Таким образом, гипертекст формируется как совокупность взаимосвязанных фрагментов текста. Эти фрагменты могут представлять собой, как целые документы, так и отдельные высказывания, формулировки идей, проблем, предложений, мероприятий, фактов. Система обеспечивает максимальную открытость гипертекста, возможность его пополнения, изменения структуры и содержания на любом этапе работы. Система не навязывает пользователю готовые схемы и ограничения на структуру представления информации.

Выводы: Гипертекстовые системы предназначены для использования в таких областях деятельности, как анализ проблем, изучение прецедентов, прогнозирование социальных явлений, обоснование управленческих решений, подготовка различных документов: обзоров, аналитических материалов, пояснительных записок, докладов и т.п.


15. Каково основное предназначение гипертекстовых систем?

Гипертекст всегда представляет собой некоторую сеть или граф, отображающие систему связей между смысловыми единицами текста. Свойства гипертекста, его функциональные возможности в значительной степени зависят от структурных характеристик гипертекстовой сети. Она может иметь разную степень сложности, быть иерархической или циклической, члениться на обособленные части, быть «стройной» или «хаотической». Почти все авторы отмечают, что в гипертексте можно «заблудиться», потерять ориентацию, не найти удобных путей чтения.

При формировании смысловых графов автор должен пользоваться определенными критериями и процедурами, чтобы отличать прямую смысловую связь от косвенной связи. Смежными по смыслу считаются лишь те понятия, которые можно объединить при помощи связок (типа «есть», «является причиной», «поэтому», «в этих целях» и др.). Такие графы стали называть «логико-смысловыми графами», а логико-смысловые графы вплотную приблизились к гипертекстам. Логико-смысловые графы, действительно, рассматривают как одну из версий гипертекста. Например, WWW – глобальная гипермедийная распределенная ИС, функционирующая в среде Интернет. В логико-смысловых графах стал применяться принцип полноты связей, т.е. связь стала фиксироваться для всех пар высказываний, которые могли быть соединены связкой. Для каждого нового высказывания, вводимого в логико-смысловой граф, нужно было указать все его связи с высказываниями, уже имеющимися в этом графе.

Появилась возможность представления предметной области с разной степенью детализации путем построения укрупненных графов, включающих лишь те смысловые единицы, у которых число связей превышает определенный порог. Но для самого гипертекста здесь таятся интересные возможности: ведь таким способом в его смысловой сети можно автоматически отыскивать предпочтительные пути. Так могут интерпретироваться социальные позиции, системы взглядов, научные концепции, новые идеи, которые должны обладать единством, целостностью.

Известны гипертекстовые системы такие как учебные и справочные системы, в которых пользователь сам выбирает, как ему двигаться при освоении материала в сети связанных по смыслу текстовых фрагментов, причем система подсказывает ему возможные варианты такого движения.

В соответствии с этим в применении гипертекстовых систем сложилось несколько основных направлений. Одно из них – электронная книга – обеспечивает более быстрое освоение материала с большим количеством ссылок и смысловых пересечений. В качестве объектов могут выступать справочные и учебные материалы, проектная и программная документация. Каждый фрагмент (текста) снабжается указанием всех его ссылок и возможных смысловых переходов к другим фрагментам документа.

Другое направление применения гипертекстовых систем – компоновка крупных текстовых материалов из фрагментов, которые первоначально представлены в форме сети с указанием их взаимных смысловых связей.

Третье направление – представление в форме единого гипертекста идей, аргументов и предложений, вносимых участниками коллективной работы, рассмотрение и анализ взаимосвязи этих идей и аргументов.

Коммерческие гипертекстовые системы выпускаются с 1987 года. Наибольшую известность получили американские системы Guide, Hypercard и французская Hyperdoc. Guide фирма Owl Technologies привлекает своей простотой, т.к. фактически она является развитой системой обработки текста с оригинальной концепцией «кнопки». Любое слово или словосочетание в тексте может быть определено как «кнопка». В этом случае постановка над ним курсора активизирует определенное действие: замену слова другим, вызов комментариев, установление связей слова с другими текстами, формирование на экране окон.

Система Hypercard фирмы Apple для ПК Macintosh представляют собой своеобразную электронную картотеку. Карточки могут содержать не только текст, но и изображения, музыку. Определенные места карточки являются «кнопками», нажатие на которые вызывает новые карточки, которые тоже имеют «кнопки». Это позволяет охватывать любое число карточек, связанных между собой иерархически, тематически, ассоциативно. Массивы могут обрабатываться независимыми программами, что позволяет сделать изображения движущимися, проводить сложные виды поиска, генерировать музыкальное сопровождение, создать систему обработки текста и изображений.

Система Hyperdoc, созданная французской фирмой GECI. Основное ее достоинство – независимость от характера данных и от аппаратных средств. Hyperdoc оперирует с текстами, чертежами, диаграммами, логическими схемами, реа­­­ли­зуется на компьютерах IBM PC, Macintosh, Atari, Vax и др. Информационные массивы хранятся на оптических дисках. Любая зона экрана может ассоциироваться с любой группой данных при помощи устройства «мышь». Hyperdoc легко сопрягается с системами обработки текста, электронной графики, издательскими паке­­тами, с СУБД dBASE-3.

Оксфордский словарь английского языка был представлен в виде гипертекста (322 т. статей, 56,3 млн. слов, 2,4 млн. ссылок), что позволило просматривать все связи между словами и их толкования с помощью программ, повысило эффективность справочного аппарата. Словарь служит основой установления гипертекстовых связей для других документов.

Отечественные гипертекстовые системы ГИПЕРЛОГ и СЕМПРО разработаны на основе многолетних исследований Субботина М.М., которые реализуют функции и процедуры, позволяющие:

- формировать из элементов гипертекстовой базы данных связанные, упорядо­чен­ные тексты на задаваемые пользователем темы;

- контролировать качество формируемого текста, выявлять в нем логические и смысловые разрывы;

- структурировать гипертекстовую базу данных, выявлять в ней комплексы взаимосвязанных идей, понятий, проблем.

Системы предоставляют пользователю возможность при вводе фрагментов текста в БД устанавливать между ними связи (ссылочные, смысловые, логические, ассоциативные и др.), обеспечивают компьютерную поддержку этих связей и перемещение по ним. Таким образом, гипертекст формируется как совокупность взаимосвязанных фрагментов текста. Эти фрагменты могут представлять собой, как целые документы, так и отдельные высказывания, формулировки идей, проблем, предложений, мероприятий, фактов. Система обеспечивает максимальную открытость гипертекста, возможность его пополнения, изменения структуры и содержания на любом этапе работы. Система не навязывает пользователю готовые схемы и ограничения на структуру представления информации.

Выводы: Данные гипертекстовые системы предназначены для использования в таких областях деятельности, как анализ проблем, изучение прецедентов, прогнозирование социальных явлений, обоснование управленческих решений, подготовка различных документов: обзоров, аналитических материалов, пояснительных записок, докладов и т.п.


16. Что такое гипермедиа системы?

Принципиальной особенностью гипермедиа является распространение идеи гипертекста, т. е. ассоциативно связанной текстовой информации на изобразительную и звуковую информацию, хранящуюся в цифровой форме. Системы гипермедиа относятся к типу систем, базирующихся на использовании наиболее передовых технологий и технических средств и предназначенных для повышения эффективности и интенсивности процессов взаимодействия и всей среды, относящейся к знаниям. С другой стороны системы гипермедиа являются интеллектуальными информационными системами.

Системы гипермедиа, как и гипертекстовые, могут рассматриваться в разных аспектах. Один из подходов, близкий программистам, заключается в том, чтобы сравнить методы доступа к информации в гипертексте с соответствующими методами в СУБД. Эти методы различны: в гипертексте они опираются на ассоциативные связи между понятиями, а в СУБД на структурные свойства данных. Между системами гипертекста и гипермедиа нет четкой границы.

Эти системы представляют собой развитые информационные технологии, ориентированные в первую очередь на обработку знаний. Многие специалисты высоко оценивают перспективы технологий гипермедиа и гипертекста, считая, что они вышли на уровень стратегических ресурсов компьютерных корпораций.


17. Что такое система машинного перевода?

С развитием общества возникает потребность общения между народами и странами. Но этот процесс тормозится языковыми барьерами. Обучение иностранным языкам и переводческая деятельность в какой-то мере облегчают эту проблему, но не решают ее. Более радикальным решением является создание систем автоматического перевода с одних естественных языков на другие. Такие системы создаются во многих развитых странах мира, однако качество автоматического перевода оставляет желать лучшего. Говоря о машинном переводе, мы подразумеваем лишь частично автоматизированную деятельность, в которой на разных ее этапах участвует человек.

Поскольку перевод специальных текстов при помощи компьютера может быть значительно проще и быстрее, системы машинного перевода стали полезным инструментов переводчика и важным фактором снижения затрат в этой области.

Человеческий перевод текстов с одних естественных языков на другие – это сложный мыслительный процесс. Он осуществляется на основе восприятия исходного текста и передачи его смысла средствами другого языка. При этом переводятся не слова и их последовательность, а понятие и мыслительные образы, порождаемые сознанием переводчика под их воздействием.

Системы машинного перевода текстов предназначены для моделирования работы человека переводчика. Но моделировать эту работу в полном объеме пока не удается. И нужно оперировать теми единицами языка и речи, которые позволяют наиболее точно передавать содержание текста, написано на одном языке, средствами другого языка. Такими единицами являются фразеологические обороты и терминологические словосочетания и, во вторую очередь, отдельные слова. Поэтому перспективные системы машинного перевода должны опираться на фразеологическое богатство естественных языков. Они должны быть системами фразеологического перевода.

С точки зрения пользователя системы машинного перевода делятся на три типа:

1) информативные, предназначены для доступа к информации на иностранном языке и для тех, кто готов пользоваться «грубым» переводом, но понятным. Такие системы имеют словари большого объема и не опираются на новейшие достижения в лингвистике и программировании.

2) Профессиональные, которые дают лишь черновые наброски переводов для профессиональных переводчиков и тем освобождают их от черновой работы. Такие системы используются все реже, - как правило, при большом объеме текущей переводческой работы.

3) Персональные – для авторов, желающих перевести свои статьи на иностранный язык, которым они не вполне владеют. Такие системы обычно работают в диалоге с пользователем и могут давать удовлетворительный перевод.

По применяемым лингвистическим методам системы машинного перевода можно разделить также на три типа:
  1. Системы прямого перевода – наиболее многочисленные, поскольку начали создаваться еще в 50-60 годы для фиксированных пар языков. Эти системы выдавали пословные и лишь позднее переводы, основанные на анализе предложений входного языка.
  2. Системы перевода с использованием языка-посредника, служащего для отображения «смысла» входного текста, который преобразуется в семантические и синтаксические представления. Этот метод применяется обычно при необходимости перевода исходного текста на несколько языков (в переводческих центрах Европейского сообщества, например).
  3. Системы перевода с трансфертом являются более сложными, поскольку языки-посредники применяются дважды – 1 раз при переводе с входного языка, второй раз – при переводе на входной язык. За этот счет достигается более глубокий лингвистический анализ и синтез.

В последние годы все большее применение в машинном переводе находят методы искусственного интеллекта, которые при переводе учитывают семантику текста. Это означает, что они опираются не столько на грамматические, сколько на се­­­ман­­­тико-синтаксические категории. Однако и методы искусственного интеллекта пока не дают всей информации, необходимой для полноценного машинного перевода. В частности, проблемы возникают при переводе с английского языка на японский. «Понимание» английского текста не дает достаточной информации о состоянии пишущего и читающего, необходимой для адекватного перевода на японский язык.

Несмотря на все оговорки, связанные с несовершенством систем машинного перевода, существуют уже сотни достаточно широко используемых систем такого рода.