Вопросы и ответы для кандминимума Теоретические основы информатики
Данный файл содержит программу-минимум по специальности
1. Информатика как наука, отрасль промышленности
и инфраструктурная область
Информатика — наука, отрасль индустрии и инфраструктура. Информатика как наука, изучающая информацию и ее свойства в естественных, искусственных и гибридных системах. Место информатики в системе наук. Информатика как обрабатывающая информацию отрасль индустрии и инфраструктурная область, ее роль и значение в скорении научно-технического прогресса.
Некоторые ченые понимают информатику широко – как науку об информации вообще.
Эта наука изучает процессы и законы
передачи
распространения
обработки
преобразования
кодирования
запоминания
отображения
потребления информации и т.д.
Некотороые ченые под информатикой имеют в виду комплексную научную и инженерную дисциплину, которая изучает все аспекты разработки, проектирования, создания, оценки функционирования основанных на ЭВМ систем переработки информации, их применения и воздействия на различные области социальной практики.
Объект и предмет информатики
Поскольку информатика – многоспектная научная область, объект и предмет ее неоднозначны. Объектом изучения информатики является, прежде всего, информация.
Предметом информатики как науки являются информационные технологии в их взаимодействии со средой.
Информатика – это теория и практика проектирования, встраивания новых информационных технологий в социальные среды и их использования.
Предметной областью информатики является информационная среда. Информационная среда включает в себя информационные процессы и информационные системы, также все факторы, воздействующие на них на протяжения всего их существования – начиная от проектирования и до окончания использования.
Можно выделить основные направления развития информатики: теоретическая информатика, прикладная и техническая.
Основные цели теоретической информатики – развитие общей теории создания, переработки и хранения информации; изучение ее структуры и свойств; разработка теоретических проблем организации систем обработки информации; выяснение закономерностей, в соответствии, с которыми происходит создание семантической информации, ее преобразование, передача и использование в различных сферах деятельности человека; разработка современных методов расчета на ЭВМ; открытие общих законов, лежащих в основе переработки информации; изучение сложных взаимосвязей в системе “человек – ЭВМ”, также взаимного влияния социальных факторов и развития информационных технологий.
Прикладная информатика охватывает возможности формализации и математизации областей ее применения, создание баз знаний, моделей информатики, имитации; разработку наиболее рациональных методов осуществления информационных процессов автоматизации исследований, методов и средств вычислительной техники, автоматизации производства; разработку теоретических основ проектирования и организации информационно-поисковых и информационно-логических систем; определение способов наиболее оптимальной организации связи как внутри науки, так и между наукой и производством с широким применением современных вычислительных технических средств, также изучение закономерностей научно – информационной деятельности.
Техническая информатика – отрасль народного хозяйства, основанная на “индустрии” информатики; она включает в себя разработку структуры, принципов конструкции автоматизированных систем обработки информации; создание вычислительной техники новых поколений (в том числе персональных компьютеров), математического обеспечения; эксплуатация средств обработки создание гибких технологических систем, роботов, также другие проблемы связанные с кодаптации человека к новой информационной технологии. К информатике относят и область искусственного интеллекта, содержащую как теоретические, так и технические аспекты.
Информатика - область человеческой деятельности, связанная с процессами преобразования информации с помощью компьютеров и других средств вычислительной техники.
Информационный ресурс
вся совокупность сведений, получаемых и накапливаемых в процессе развития науки и практической деятельности людей.
Информационные реурсы зафиксированы в различного рода документах (отчетах, патентах, технической документации и пр.), теориях, моделях и пр.
В современном обществе ИР относятся к наиболее важному виду материальных ресурсов.
Можно выделить следующие группы информационных ресурсов:
информацию, зафиксированную на физических носителях, также технологию ее обработки;
средства передачи информации;
средства обработки информации;
ученых и специалистов – “производители” информации в разных сферах общественной и производственной деятельности;
органы и службы, занимающиеся сбором и обработкой информации.
Информационные технологии и системы, их определение, назначение и классификация.
втоматизированная информационная система комплекс программных, технических, информационных, лингвистических, организационно-технологических средств и персонала, предназначенный для решения задач справочно-информационного обслуживания. |
ИС представляют собой последующую ступень в развитии ИПС, которые предоставляют только одну функцию – поиск информации.
ИС характеризуются
- многофункциональность
- независимость процессов сбора, обработки и обновления информации от процессов их использования прикладными программами
- независимость прикладных программ от физической организации баз данных
- развитые средства лингвистического, организационно-технологического обеспечения и пр.
Классификация
по поддерживаемым базам данным:
документографические / фактографические / полнотекстовые и пр.
по характеру решаемых задач:
библиотечные / информационно-справочные / научно-технической информации и пр.
втоматизированная информационно-логическая система
ИС, обеспечивающая хранение и обработку информации,
характеризующейся большим разнообразием и значительной неопределенностью используемой терминологии
Интеллектуальная информационная система
ИС, снабженная интеллектуальным интерфейсом, позволяющим пользователю обращаться к системе на естественном языке
Лингвистическое обеспечение развитой АИС должно включтаь в себя следующие компоненты:
- графические средства представления данных (алфавит и микросинтаксис)
- язык библиографических данных
- классификационные языки
- дескрипторные и другие посткоординатные языки
- объектно-признаковые языки (фактографический ровень представления и.)
- языки запросов и манипулирования данными
Средства поддержки ЛО:
- лингвистические процессоры – программы АОТ
- лингвистический банк данных – базы данных машинных словарей и авторитетных записей + программно-аппаратные средства правления ими
- нормативная документация
вторитетная запись – имя собственное (лица, организации, темы, произведения).
Основным назначением авторитетной записи является обеспечение полноты и точности поиска.
втоматизированная информационная система
комплекс программных, технических, информационных, лингвистических, организационно-технологических средств и персонала, предназначенный для решения задач справочно-информационного обслуживания.
Информационное обеспечение - совокупность единой системы классификации и кодирования информации, нифицированных систем документации, схем информационных потоков, циркулирующих в организации, также методология построения баз данных.
Техническое обеспечение - комплекс технических средств, предназначенных для работы информационной системы, также соответствующая документация на эти средства и технологические процессы
По типу хранимых данных ИС делятся на
* фактографические
* документальные
По степени автоматизации информационных процессов информационные системы делятся на
* ручные
* автоматические
* автоматизированные
В зависимости от характера обработки данных ИС делятся на
* информационно-поисковые
* информационно-решающие
* правляющие
*советующие
Результирующая информация правляющих ИС непосредственно трансформируется в принимаемые человеком решения.
Советующие ИС вырабатывают информацию, которая принимается человеком к сведению и учитывается при формировании правленческих решений, не инициирует конкретные действия. (Например, экспертные системы.)
В зависимости от сферы применения различают следующие классы ИС.
* ИС организационного правления
* ИС правления технологическими процессами (ТП)
* ИС автоматизированного проектирования (САПР)
* Интегрированные (корпоративные) ИС
Информационные системы организационного правления
Основными функциями подобных систем являются: оперативный контроль и регулирование, оперативный чет и анализ, перспективное и оперативное планирование, бухгалтерский чет
Интегрированные (корпоративные) ИС - используются для автоматизации всех функций фирмы и охватывают весь цикл работ от планирования деятельности до сбыта продукции.
Классификация ИС по архитектуре
По степени распределённости отличают:
* настольные (desktop), или локальные ИС, в которых все компоненты (БД, СУБД, клиентские приложения) работают на одном компьютере;
* распределённые (distributed) ИС, в которых компоненты распределены по нескольким компьютерам.
Распределённые ИС, в свою очередь, разделяют на
* файл-серверные ИС (ИС с архитектурой «файл-сервер»);
* клиент-серверные ИС (ИС с архитектурой «клиент-сервер»).
В файл-серверных ИС БД находится на сервере (файл-сервере), СУБД и клиентские приложения находятся на рабочих станциях.
В клиент-серверных ИС БД и СУБД находятся на сервере, на рабочих станциях находятся клиентские приложения.
Классификация ИС по сфере применения
Поскольку ИС создаются для довлетворения информационных потребностей в рамках конкретной предметной области, то каждой предметной области (сфере применения) соответствует свой тип ИС. Перечислять все эти типы не имеет смысла, так как количество предметных областей велико, но можно казать в качестве примера следующие типы ИС:
* Экономическая информационная система — информационная система, предназначенная для выполнения функций правления на предприят.
* Медицинская информационная система — информационная система, предназначенная для использования в лечебном или лечебно-профилактическом чреждении.
* Географическая информационная система — информационная система, обеспечивающая сбор, хранение, обработку, доступ, отображение и распространение пространственно-координированных данных (пространственных данных).
Сначала каждая фирма пыталась создать ИС для себя, но потом пришли к выводу, что необходимы стандартные решения.
Из всего спектра проблем разработчики выделили наиболее заметные: автоматизацию ведения бухгалтерского аналитического чета и технологических процессов.
Задача формирования требований к ИС является одной из наиболее ответственных, трудно формализуемых и наиболее дорогих и тяжелых для исправления в случае ошибки.
На этапе проектирования прежде всего формируются модели данных. Построение логической и физической моделей данных является основной частью проектирования базы данных. Полученная в процессе анализа информационная модель сначала преобразуется в логическую, затем в физическую модель данных.
Информационные технологии
это совокупность методов, процедур и средств, реализующих процессы сбора, обработки, хранения и выдачи информации.
Задачи, решаемые ИС:
* Структурированные
* Неструктурированные
* Частично структурированные
Структурируемые - известны все элементы и связи
- можно описать с помощью математической модели
- цель создания ИС - полная автоматизация их решения
Пример: задача расчета заработной платы
Неструктурированная (неформализуемая) задача - задача, в которой невозможно выделить элементы и становить между ними связи.
Возможности использования ИС невелики
Частично структурируемые - бол-во задач относятся к этому типу.
* создающие правленческие отчеты (ориентированы главным образом на обработку данных (поиск, сортировку, агрегирование, фильтрацию)
Используя сведения, содержащиеся в этих отчетах, правляющий принимает решение;
* разрабатывающие возможные альтернативы решения. Принятие решения при этом сводится к выбору одной из предложенных альтернатив.
Данный тип подразделяется на
* модельные системы
* экспертные системы
Модельные информационные системы предоставляют пользователю математические, статические, финансовые и другие модели, использование которых облегчает выработку и оценку альтернатив решения. Пользователь может получить недостающую ему для принятия решения информацию путем становления диалога с моделью в процессе ее исследования.
Экспертные информационные системы обеспечивают выработку и оценку возможных альтернатив пользователем за счет создания экспертных систем, связанных с обработкой знаний. Экспертная поддержка принимаемых пользователем решений реализуется на двух ровнях.
Первый ровень: типовой набор альтернатив
Второй ровень: генерирует альтернативы на базе имеющихся в информационном фонде данных, правил преобразования и процедур оценки синтезированных альтернатив.
Пример: Требуется принять решение по странению ситуации, когда потребность в трудовых ресурсах для выполнения в срок одной из работ комплекса превышает их наличие. Пути решения этой задачи могут быть разными, например:
выделение дополнительного финансирования из величение численности работающих;
отнесение срока окончания работы на более позднюю дату и т.д. Как видно, в данной ситуации информационная система может помочь человеку принять то или иное решение, если снабдит его информацией о ходе выполнения работ по всем необходимым параметрам. Полученная с помощью ИС информация анализируется человеком.
ИС представляют собой последующую ступень в развитии ИПС, которые предоставляют только одну функцию – поиск информации.
ИС характеризуются
- многофункциональность
- независимость процессов сбора, обработки и обновления информации от процессов их использования прикладными программами
- независимость прикладных программ от физической организации баз данных
- развитые средства лингвистического, организационно-технологического обеспечения и пр.
втоматизированная информационно-логическая система
ИС, обеспечивающая хранение и обработку информации,
характеризующейся большим разнообразием и значительной неопределенностью используемой терминологии
Интеллектуальная информационная система
ИС, снабженная интеллектуальным интерфейсом, позволяющим пользователю обращаться к системе на естественном языке
Лингвистическое обеспечение развитой АИС должно включтаь в себя следующие компоненты:
- графические средства представления данных (алфавит и микросинтаксис)
- язык библиографических данных
- классификационные языки
- дескрипторные и другие посткоординатные языки
- объектно-признаковые языки (фактографический ровень представления и.)
- языки запросов и манипулирования данными
Средства поддержки ЛО:
- лингвистические процессоры – программы АОТ
- лингвистический банк данных – базы данных машинных словарей и авторитетных записей + программно-аппаратные средства правления ими
- нормативная документация
вторитетная запись – имя собственное (лица, организации, темы, произведения).
Основным назначением авторитетной записи является обеспечение полноты и точности поиска.
2. Концептуальные модели информатики
Общие принципы моделирования окружающей среды, процессов мышления человека и человеко-машинного общения.
Моделирование – это процесс построения, изучения и применения моделей.
1. Принцип информационной достаточности.
При полном отсутствии информации об исследуемой системе построение ее модели невозможно. При наличии полной информации ее моделирование лишено смысла. Существует некоторый критический ровень априорных сведений о системе (уровень информационной достаточности), при достижении которого может быть построена ее адекватная модель.
2. Принцип осуществимости. Создаваемая модель должна обеспечивать достижение поставленной цели исследования с вероятностью, существенно отличающейся от нуля, и за конечное время. Обычно задают некоторое пороговое значение P0 вероятности достижения цели моделирования P(t), также приемлемую границу t0 времени достижения этой цели. Модель считают осуществимой, если может быть выполнено словие P(t0)≥ P0.
3. принцип множественности моделей. Данный принцип, несмотря на его порядковый номер, является ключевым. Речь идет о том, что создаваемая модель должна отражать в первую очередь те свойства реальной системы (или явления), которые влияют на выбранный показатель эффективности. Соответственно при использовании любой конкретной модели признаются лишь некоторые стороны реальности. Для более полного ее исследования необходим ряд моделей, позволяющих с разных сторон и с разной степенью детальности отражать рассматриваемый процесс.
4. принцип агрегирования. В большинстве случаев сложную систему можно представить состоящей из агрегатов (подсистем), для адекватного математического описания которых оказываются пригодными некоторые стандартные математические схемы. Принцип агрегирования позволяет, кроме того, достаточно гибко перестраивать модель в зависимости от задач исследования.
5. Принцип параметризации. В ряде случаев моделируемая система имеет в своем составе некоторые относительно изолированные подсистемы, характеризующиеся определенным параметром, в том числе векторным. Такие подсистемы можно заменять в модели соответствующими числовыми величинами, не описывать процесс их функционирования. При необходимости зависимость значений этих величин от ситуации может задаваться в виде таблицы, графика или аналитического выражения (формулы). Принцип параметризации позволяет сократить объем и продолжительность моделирования. Однако надо иметь ввиду, что параметризация снижает адекватность модели.
В зком понимании информационная модель — это модель, описывающая, изучающая, актуализирующая информационные связи и отношения в исследуемой системе. В еще более зком понимании информационная модель — это модель, основанная на данных, структурах данных, их информационно-логическом представлении и обработке. Как широкое, так и зкое понимание информационной модели необходимы, определяются решаемой проблемой и доступными для ее решения ресурсами, в первую очередь информационно-логическими.
Основные свойства любой модели:
* конечность — модель отображает оригинал лишь в конечном числе его отношений и, кроме того, ресурсы моделирования конечны;
* прощенность — модель отображает только существенные стороны объекта и, кроме того, должна быть проста для исследования или воспроизведения;
* приблизительность — действительность отображается моделью грубо, или приблизительно;
* адекватность моделируемой системе — модель должна спешно описывать моделируемую систему;
* наглядность, обозримость основных свойств и отношений;
* доступность и технологичность для исследования или воспроизведения;
* информативность — модель должна содержать достаточную информацию о системе (в рамках гипотез, принятых при построении модели) и давать возможность получить новую информацию;
* сохранение информации, содержавшейся в оригинале (с точностью рассматриваемых при построении модели гипотез);
* полнота — в модели должны быть чтены все основные связи и отношения, необходимые для обеспечения цели моделирования;
* стойчивость — модель должна описывать и обеспечивать стойчивое поведение системы, если даже та вначале является неустойчивой;
* замкнутость — модель учитывает и отображает замкнутую систему необходимых основных гипотез, связей и отношений.
Виды моделей:
налитические модели более грубы, учитывают меньшее число факторов, всегда требуют каких-то допущений и прощений. Зато результаты расчета по ним легче обозримы, отчетливее отображают присущие явлению основные закономерности.
Статистические модели, по сравнению с аналитическими, более точны и подробны, не требуют столь грубых допущений, позволяют честь большее число факторов. Но у них свои недостатки: громоздкость, плохая обозримость, большой расход машинного времени, главное – крайняя трудность поиска оптимального решения, которое приходится искать на ощупь.
Наилучший результат получается при совместном применении аналитических и статистических моделей.
Методы хранения, поиска и обработки данных, методы естественно-языкового человеко-машинного общения.
Предметная область и ее модели.
Понятия «план-содержание», «план-выражение».
План-содержание – содержание, концептуальные свойства знака.
План-выражение – необходимая составляющая знака (материальный носитель), то, что можно воспринять (звук, изображение, тактильный образ).
Объекты, характеристики и их значения.
Выделение сущностей, имеющих определенные свойства и связанных с ними информационных блоков.
Значение может иметь своб структуру (например, атрибут «согласование»).
Единицы информации и информационные отношения.
Машинное понимание.
Предположим, что на вход ИС поступает текст. Будем говорить, то ИС понимает текст, если она дает ответы, правильные с точки зрения человека, на любые вопросы, относящиеся к тому, о чем говорится в тексте. Под "человеком" понимается конкретный человек-эксперт, которому поручено оценить способности системы к пониманию. Это вносит долю субъективизма, ибо разные люди могут по-разному понимать одни и те же тексты.
Классификация ровней понимания
В существующих ИС можно выделить пять основных ровней понимания и два ровня метапонимания.
Первый ровень характеризуется схемой, показывающей, что любые ответы на вопросы система формирует только на основе прямого содержания, введенного из текста. Если, например, в систему введен текст: "В восемь тра, после завтрака, Петя шел в школу. В два часа он вернулся домой. После обеда он шел гулять", то на первом ровне понимания система обязана меть отвечать правильно на вопросы типа: "Когда Петя шел в школу?" или "Что сделал Петя после обеда?". В лингвистическом процессоре происходит морфологический, синтаксический и семантический анализ текста и вопросов, относящихся к нему. На выходе лингвистического процессора получается внутреннее представление текста и вопросов, с которыми может работать блок вывода. Используя специальные процедуры, этот блок формирует ответы. Другими словами, же понимание на первом ровне требует от ИС определенных средств представления данных и вывода на этих данных.
Второй ровень: На втором ровне добавляются средства логического вывода, основанные на информации, содержащейся в тексте. Это разнообразные логики текста (временная, пространственная, каузальная и т. п., которые способны породить информацию, явно отсутствующую в тексте. Для нашего примера на втором ровне возможно формирование правильных ответов на вопросы типа: "Что было раньше: ход Пети в школу или его обед?" или "Гулял Петя после возвращения из школы?" Только построив временную структуру текста, ИС сможет ответить на подобные вопросы.
Схема ИС, с помощью которой может быть реализован второй ровень понимания, имеет еще одну базу знаний. В ней хранятся закономерности, относящиеся к временной структуре событий, возможной их пространственной организации, каузальной зависимости и т. п., логический блок обладает всеми необходимыми средствами для работы с псевдофизическими логиками.
Третий ровень: К средствам второго ровня добавляются правила пополнения текста знаниями системы о среде. Эти знания в ИС, как правило, носят логический характер и фиксируются в виде сценариев или процедур иного типа. На третьем ровне понимания ИС должна дать правильные ответы на вопросы типа: "Где был Петя в десять тра?" или "Откуда Петя вернулся в два часа дня?" Для этого надо знать, что означает процесс "пребывание в школе" и, в частности, что этот процесс является непрерывным и что субъект, частвующий в нем, все время находится "в школе".
Схема ИС, в которой реализуется понимание третьего ровня, внешне не отличается от схемы второго ровня. Однако в логическом блоке должны быть предусмотрены средства не только для чисто дедуктивного вывода, но и для вывода по сценариям.
Три перечисленных ровня понимания реализованы во всех практически работающих ИС. Первый ровень и частично второй входят в разнообразные системы общения на естественном языке.
Следующие два ровня понимания реализованы в существующих ИС лишь частично.
Четвертый ровень: Вместо текста в ней используется расширенный текст, который порождается лишь при наличии двух каналов получения информации. По одному в систему передается текст, по другому-дополнительная информация, отсутствующая в тексте. При человеческой коммуникации роль второго канала, как правило, играет зрение. Более одного канала коммуникации имеют интеллектуальные роботы, обладающие зрением.
Зрительный канал коммуникации позволяет фиксировать состояние среды "здесь и сейчас" и вводить в текст наблюдаемую информацию. Система становится способной к пониманию текстов, в которые введены слова, прямо связанные с той ситуацией, в которой порождается текст. На более низких ровнях понимания нельзя понять, например, текст: "Посмотрите, что сделал Петя! Он не должен был брать это!" При наличии зрительного канала процесс понимания становится возможным.
При наличии четвертого ровня понимания ИС способна отвечать на вопросы типа: "Почему Петя не должен был брать это?" или "Что сделал Петя?" Если вопрос, поступивший в систему, соответствует третьему ровню, то система выдает нужный ответ. Если для ответа необходимо привлечь дополнительную ("экзегетическую") информацию, то внутреннее представление текста и вопроса передается в блок, который осуществляет соотнесение текста с той реальной ситуацией его порождения, которая доступна ИС по зрительному или какому-нибудь иному каналу фиксации ситуации внешнего мира.
Пятый ровень: Для ответа на этом ровне ИС кроме текста использует информацию о конкретном субъекте, являющемся источником текста, и хранящуюся в памяти системы общую информацию, относящуюся к коммуникации (знания об организации общения, о целях частников общения, о нормах частия в общении). Теория, соответствующая пятому ровню,-это так называемая теория речевых актов.
Было обращено внимание на то, что любая фраза не только обозначает некое явление действительности, но и объединяет в себе три действия: локуцию, иллокуцию и перлокуцию. Локуция-это говорение как таковое, т. е. те действия, которые говорящий произвел, чтобы высказать свою мысль. Иллокуция - это действие при помощи говорения: вопрос, побуждение (приказ или просьба) и тверждение. Перлокуция - это действие, которым говорящий пытается осуществить некоторое воздействие на слушающего: "льстить", "удивлять", "уговаривать" и т. д. Речевой акт можно определить как минимальную осмысленную (или целесообразную) единицу речевого поведения. Каждый речевой акт состоит из локутивного, иллокутивного и перлокутивного акта.
Для четвертого и пятого ровней понимания интересны результаты по невербальным (несловесным) компонентам общения и психологическим принципам, лежащим в основе общения. Кроме того, в правила пополнения текста входят правила вывода, опирающиеся на знания о данном конкретном субъекте общения, если такие знания у системы есть. Например, система может доверять данному субъекту, считая, что порождаемый им текст истинен. Но может не доверять ему и понимать текст, корректируя его в соответствии со своими знаниями о субъекте, породившем текст. Знания такого типа должны опираться на психологические теории общения, которые пока развиты недостаточно.
Например, на вход системы поступает текст: "Нина обещала скоро прийти". Если о Нине у системы нет никакой информации, она может обратиться к базе знаний и использовать для оценки временного казателя "скоро некоторую нормативную информацию. Из этой информации можно знать, что с большой долей веренности "скоро" не превышает полчаса. Но у системы может иметься специальная информация о той Нине, о которой идет речь во входном тексте. В этом случае система, получив нужную информацию из базы знаний, может приготовиться, например, к тому, что Нина скорее всего придет не ранее чем через час.
Первый метауровень: На этом ровне происходит изменение содержимого базы знаний. Она пополняется фактами, известными системе и содержащимися в тех текстах, которые в систему введены. Разные ИС отличаются друг от друга характером правил порождения фактов из знаний. Например, в системах, предназначенных для экспертизы в области фармакологии, эти правила опираются на методы индуктивного вывода и распознавания образов. Правила могут быть основаны на принципах вероятностей, размытых выводов и т. п. Но во всех случаях база знаний оказывается априорно неполной и в таких ИС возникают трудности с поиском ответов на запросы. В частности, в базах знаний становится необходимым немонотонный вывод.
Второй метауровень: На этом ровне происходит порождение метафорического знания. Правила порождения знаний метафорического ровня, используемые для этих целей, представляют собой специальные процедуры, опирающиеся на вывод по аналогии и ассоциации. Известные в настоящее время схемы вывода по аналогии используют, как правило, диаграмму Лейбница, которая отражает лишь частный случай рассуждений по аналогии. Еще более бедны схемы ассоциативных рассуждений.
Если рассматривать ровни и метауровни понимания с точки зрения архитектуры ИС, то можно наблюдать последовательное наращивание новых блоков и сложнение реализуемых ими процедур. На первом ровне достаточно лингвистического процессора с базой знаний, относящихся только к самому тексту. На втором ровне в этом процессоре возникает процедура логического вывода. На третьем ровне необходима база знаний. Появление нового канала информации, который работает независимо от исходного, характеризует четвертый ровень. Кроме процедур, связанных с работой этого канала, появляются процедуры, вязывающие между собой результаты работы двух каналов, интегрирующие информацию, получаемую по каждому из них. На пятом ровне развитие получают разнообразные способы вывода на знаниях и данных. На этом ровне становятся важными модели индивидуального и группового поведения. На метауровнях возникают новые процедуры для манипулирования знаниями, которых не было на более низких ровнях понимания. И этот процесс носит открытый характер. Понимание в полном объеме - некоторая, по-видимому, недостижимая мечта. Но понимание на ровне "бытового понимания" людей в ИС вполне достижимо.
Существуют и другие интерпретации феномена понимания. Можно, например, оценивать ровень понимания по способности системы к объяснению полученного результата. Здесь возможен не только ровень объяснения, когда система объясняет, что она сделала, например, на основе введенного в нее текста, но и ровень обоснования (аргументации), когда система обосновывает свой результат, показывая, что он не противоречит той системе знаний и данных, которыми она располагает. В отличие от объяснения обоснование всегда связано с суммой фактов и знаний, которые определяются текущим моментом существования системы. И вводимый для понимания текст в одних состояниях может быть воспринят системой как истинный, в других-как ложный. Кроме объяснения и обоснования возможна еще одна функция, связанная с пониманием текстов,- оправдание. Оправдать нечто означает, что выводимые тверждения не противоречат той системе норм и ценностей, которые заложены в ИС. Существующие ИС типа экспертных систем, как правило, способны давать объяснения и лишь частично обоснования. В полном объеме процедуры обоснования и оправдания еще не реализованы.
Когнитивные (интеллектуальные) системы.
Знание и компетенция, восприятие, мышление и двигательное возбуждение.
ВОСПРИЯТИЕ
отражение окружающей ситуации и ее элементов при взаимодействии органов чувств человека или рецепторов искусственной системы с внешней средой.
восприятие зрительной информации, восприятие тактильной информации и акустической информации (распознавание речи).
КОМПЕТЕНЦИЯ
комплекс, связывающий воедино знания, мения и действия
способность мобилизовать знания/умения в конкретной ситуации.
Знаковые системы.
Семиотический треугольник и его элементы. Понятия «экстенсионал» и «интенсионал».
1) Имя
2) Денотат = экстенсионал = объем понятия
Пример: экстенсионал (президент США) = Обама.
3) Смысл = интенсионал = содержание понятия
Пример: интенсионал (президент США) = само понятие.
Закон обратного соотношения объема понятия и содержания понятия (чем больше содержание, тем меньше объем). Пример: красных столов больше, чем просто столов.
Представление знаний
Знания 1) это совокупность хранимых в базах знаний или памяти человека фактов о некоторой предметной области, их взаимосвязей и правил, которые могут быть использованы для получения новых фактов или решения каких-либо задач, связанных с этой предметной областью. 2) совокупность сведений, образующих целостное описание, соответствующее определенному ровню осведомленности об описываемой ПО. |
Свойства знаний:
- внутренняя интерпретируемость
Каждая информационная единица должна иметь никальное имя, по которому ИС находит ее.
- структурированность
Информационные единицы должны обладать гибкой структурой. Одни информационные единицы должны быть вложимы в другие. Должна быть возможность становления отношений типа «часть-целое», «род-вид», «элемент-класс» между информационными единицами.
- связанность
Должна быть предусмотрена возможность становления связей различного типа:
- отношения структуризации (иерархия инф. единиц)
- функциональные отношения (процедурная информация, позволяющая вычислять одни инф. ед. через другие)
- каузальные отношения (причинно-следственные связи)
- семантические отношения (ост. виды отношений)
- активность
В ИС актуализация действий вызывается знаниями, имеющимися в системе. Выполнение программ инициируется текущим состоянием базы знаний.
- семантическая метрика
Отражает силу ассоциативной связи между информационными единицами.
Основная особенность заний - связанность всех понятий ПО в иерархическую сеть - иерархию понятий.
Виды знаний
жесткие – позволяют получить однозначные рекомендации
мягкие – допускают множественные решения
декларативные - факты из предметной области
процедурные - правила преобразования объектов предметной области
Факты - знания в форме тверждения, достоверность которого строго становлена.
Эвристические знания - знания, накапливаемые интеллектуальной системой в процессе ее функционирования, также знания, заложенные в ней априорно, но не имеющие статуса абсолютной истинности в данной проблемной области. Обычно эвристические знания связаны с отражением в базе знаний неформального опыта решения задач.
Метазнания – знания о знаниях (свойства знаний, способы их использования и пр.)
ЗНАНИЯ ДЕКЛАРАТИВНЫЕ
Утверждения об объектах предметной области, их свойствах и отношениях между ними — факты из предметной области.
"Фреймы" - концептуальные структуры для декларативного представления знаний.
Используются в продукционных, редукционных и логических языках программирования (Пролог, Lisp).
Достоинства: способ поиска решений ниверсален и не зависит ни от поставленной задачи, ни даже от ПО, что весьма важно при описании слабо изученных и изменяющихся ПО.
Недостаток: низкая вычислительная эффективность (по затратам времени и памяти), поскольку в процедурах поиска решения не учитывается специфика решаемой задачи и ПО, что делает эту форму непригодной для применения в системах реального времени.
ЗНАНИЯ ПРОЦЕДУРНЫЕ (ИМПЕРАТИВНЫЕ)
Правила преобразования объектов предметной области (рецепты, алгоритмы, методики, инструкции, стратегии принятия решений), последовательность операций над данными.
«Сценарии» - концептуальные структуры для процедурного представления знаний
Используется в императивных языках программирования (например, Паскаль, С++).
Достоинства: наиболее эффективна с вычислительной точки зрения (по затратам времени и памяти на решение задачи), поскольку в процедурах поиска решения глубоко учитывается специфика конкретной проблемной области (ПО), пригодна для применения в системах реального времени.
Недостаток: сложность внесения изменений, что делает ее непригодной для применения в слабо изученных и изменяющихся ПО.
КОМБИНИРОВАННЫЕ ЗНАНИЯ
создаются, чтобы преодолеть недостатки и сохранить достоинства императивной и декларативной форм.
Хорошо обоснованная, стойчивая и формализованная часть знания воплощается в эффективных процедурах, слабо изученная и изменчивая составляющая знания представляется в декларативной форме.
Недостаток: трудность их теоретизации
Они используются в семантических сетях и сетях фреймов.
МЕТАЗНАНИЯ:
- знания о получении знаний, т.е. приёмы и методы познания.
- знания экспертной системы о собственном функционировании и процессах построения логических выводов.
Знания – совокупность сведений, образующих целостное описание, соответствующее определенному ровню осведомленности об описываемой проблеме.
Данные – факты и идеи, представленные в формализованном виде, пригодном для передачи и обработки в некотором
3. Математические основы информатики
Математическая логика: исчисление высказываний; исчисление предикатов; логические модели; формальные системы;
Все предметы и события, составляющие основу необходимой для решения задачи информации, называются предметной областью.
Языки предназначенные для описания предметных областей называются языками представления знаний.
Для представления математического знания пользуются формальными логическими языками – исчислением высказываний и исчислением предикатов.
Описания предметных областей, выполненные в логических языках, называются логическими моделями.
Логические модели, построенные с применением языков логического программирования, широко применяются в базах знаний систем искусственного интеллекта и экспертных систем.
Формальные системы.
Формальные логические модели основаны на классическом исчислении предикатов 1 порядка, когда предметная область или задача описывается в виде набора аксиом. Исчисление предикатов 1 порядка в промышленных экспертных системах практически не используется. Эта логическая модель применима в основном в исследовательских "игрушечных" системах, так как предъявляет очень высокие требования и ограничения к предметной области.
Многие научные теории строятся по следующему принципу. Сначала предлагаются некоторые основные понятия и некоторые исходные законы (аксиомы), присущие основным понятиям. Далее формулируются производные понятия и по определенным правилам доказываются некоторые тверждения (теоремы), относящиеся к основным и производным понятиям. Совокупность основных и производных понятий, аксиом и теорем, построенная таким способом, называется аксиоматической системой.
Часто аксиомы (а, значит, и теоремы) аксиоматической системы сохраняют истинность при замене основных понятий другими (как, например, в теории колебаний, которая находит применение в механике, электронике, оптике). Это позволяет рассматривать аксиоматические системы с двух позиций: синтаксически (принципы построения правильных и истинных предложений)
и семантически (связь смысла правильных и истинных предложений со смыслом основных понятий).
Для исследования синтаксиса аксиоматической системы требуется ее полная формализация, т.е. символическое представление основных и производных понятий, аксиом, правил вывода и теорем.
Поэтому формальная аксиоматическая теория (формальная система) - это синтаксический аспект (сторона) аксиоматической системы. Точное же определение понятия формальной аксиоматической теории включает следующие компоненты.
Во-первых, каждая формальная аксиоматическая теория должна иметь свой формальный язык. Формальный язык считается полностью определенным, когда задано (счётное) множество его символов и описаны формулы языка. Любая конечная последовательность символов языка называется выражением этого языка. Среди всех возможных выражений выделяются формулы языка, под которыми подразумеваются правильно построенные, тверждающие нечто осмысленное предложения языка.
Во-вторых, каждая формальная аксиоматическая теория должна иметь свою систему аксиом - подмножество заведомо истинных формул, из которых по правилам теории могут быть выведены все истинные предложения этой теории (обычно к системе аксиом предъявляются требования непротиворечивости, независимости и полноты, среди которых обязательным является требование непротиворечивости).
В-третьих, каждая формальная аксиоматическая теория должна располагать конечным множеством правил вывода. Каждое правило вывода содержит формулы-посылки и формулу-заключение, выводимую при определенных этим правилом словиях из формул-посылок. Формула-заключение называется непосредственным следствием формул-посылок по данному правилу вывода.
Доказательством в формальной аксиоматической теории называется всякая последовательность формул, в которой каждая формула есть либо аксиома теории, либо непосредственное следствие каких-либо предыдущих формул этой последовательности по одному из правил вывода данной теории.
Формула называется теоремой теории тогда и только тогда, когда существует доказательство, в котором эта формула является заключительной формулой.
Исчисление высказываний - наиболее простой пример формальной аксиоматической теории в логике. Существует несколько исчислений высказываний (Гильберта, Клини, Фреге, Новикова). Мы рассмотрим исчисление высказываний Лукасевича (исчисление L), использующее функционально полную систему связок, состоящую из отрицания ¬ и импликации
Представление и обработка нечетких знаний: источники неопределенности в знаниях и типология нечеткости; подход на основе словных вероятностей (на основе теоремы Байеса).
До сих пор мы не принимали во внимание тот факт, что в реальных словиях знания, которыми располагает человек, всегда в какой-то степени неполны, приближенны, ненадежны. Тем не менее, людям на основе таких знаний все же дается делать достаточно обоснованные выводы и принимать разумные решения. Следовательно, чтобы интеллектуальные системы были действительно полезны, они должны быть способны учитывать неполную определенность знаний и спешно действовать в таких словиях.
Неопределенность (не-фактор) может иметь различную природу.
Наиболее распространенный тип недостаточной определенности знаний обусловлен объективными причинами:
- действием случайных и неучтенных обстоятельств,
- неточностью измерительных приборов,
- ограниченными способностями органов чувств человека,
- отсутствием возможности получения необходимых свидетельств.
В таких случаях люди в оценках и рассуждениях прибегают к использованию вероятностей, допусков и шансов (например, шансов победить на выборах).
Другой тип неопределенности, можно сказать, обусловлен субъективными причинами:
- нечеткостью содержания используемых человеком понятий (например, "толпа"),
- неоднозначностью смысла слов и высказываний (например, "ключ" или знаменитое "казнить нельзя помиловать").
Неоднозначность смысла слов и высказываний часто дается странить, приняв во внимание контекст, в котором они потребляются, но это тоже получается не всегда или не полностью.
Таким образом, неполная определенность и нечеткость имеющихся знаний - скорее типичная картина при анализе и оценке положения вещей, при построении выводов и рекомендаций, чем исключение. В процессе исследований по искусственному интеллекту для решения этой проблемы выработано несколько подходов.
Самым первым можно считать использование эвристик в решении задач, в которых достаточно отдаленный прогноз развития событий невозможен (как, например, в шахматной игре).
Но самое серьезное внимание этой проблеме стали делять при создании экспертных систем и первым здесь был применен вероятностный подход (PROSPECTOR), поскольку теория вероятностей и математическая статистика в тот период были же достаточно развиты и весьма популярны.
Однако проблемы, возникшие на этом пути, заставили обратиться к разработке особых подходов к чету неопределенности в знаниях непосредственно для экспертных систем (коэффициенты веренности в системах MYCIN и EMYCIN).
В дальнейшем исследования в этой области привели к разработке особой (нечеткой) логики, основы которой были заложены Лотфи Заде.
В решении рассматриваемой проблемы применительно к экспертным системам, построенным на основе правил (систем продукций), выделяются четыре основных вопроса:
а) как количественно выразить достоверность, надежность посылок?
б) как выразить степень поддержки заключения конкретной посылкой?
в) как честь совместное влияние нескольких посылок на заключение?
г) как строить цепочки мозаключений в словиях неопределенности?
На языке продукций эти вопросы приобретают следующий смысл.
Будем обозначать ct(А) степень веренности в А (от англ. certainty - веренность).
Тогда первый вопрос заключается в том, как количественно выразить степень веренности ct(А) в истинности посылки (свидетельства) А.
Второй вопрос связан с тем, что истинность посылки А в продукции А→С может не всегда влечь за собой истинность заключения С. Степень поддержки заключения С посылкой А в продукции А→С обозначим через ct(А→С).
Третий вопрос обусловлен тем, что одно и то же заключение С может в различной степени поддерживаться несколькими посылками (например, заключение С может поддерживаться посылкой А посредством продукции А→С с веренностью сt(А→С) и посылкой В посредством продукции В→С с веренностью ct(В→С)). В этом случае возникает необходимость чета степени совместной поддержки заключения несколькими посылками.
Последний вопрос вызван необходимостью оценки степени достоверности вывода, полученного посредством цепочки мозаключений (например, вывода С, полученного из посылки А применением последовательности продукций А→В, В→С, обеспечивающих степени поддержки, соответственно, сt(А→В) и ct(В→С) ).
Подход на основе словных вероятностей (теоремы Байеса)
Рассматриваемый здесь подход к построению логического вывода на основе словных вероятностей называют байесовским. Байесовский подход не является единственным подходом к построению выводов на основе использования вероятностей, но он представляется добным в словиях, когда решение приходится принимать на основе части свидетельств и точнять по мере поступления новых данных.
В сущности, Байес исходит из того, что любому предположению может быть приписана некая ненулевая априорная (от лат. a priori - из предшествующего) вероятность того, что оно истинно, чтобы затем путем привлечения новых свидетельств получить апостериорную (от лат. a posteriori - из последующего) вероятность истинности этого предположения. Если выдвинутая гипотеза действительно верна, новые свидетельства должны способствовать величению этой вероятности, в противном же случае должны ее меньшать.
Примем для дальнейших рассуждений следующие обозначения:
P(H) - априорная вероятность истинности гипотезы H (от англ. Hypothesis - гипотеза);
P(H:E) - апостериорная вероятность истинности гипотезы Н при словии, что получено свидетельство Е (от англ. Evidence - свидетельство);
Р(Е:H) - вероятность получения свидетельства Е при словии, что гипотеза Н верна;
P(E:неН) - вероятность получения свидетельства E при словии, что гипотеза Н неверна.
По определению словных вероятностей имеем: