Теоретические аспекты инженерии знаний

Вид материалаЛекция

Содержание


Общая структура типовой технологической системы поддержки разработки
Документация, результаты работы подсистем, результаты прогнозов и т.д.
Представление данных и знаний в Интернете Язык HTML и представление знаний
Возможности представления знаний на базе языка
Подобный материал:
1   2   3   4   5   6   7   8   9   10   11
^

Общая структура типовой технологической системы поддержки разработки:



Исходные и промежуточные спецификации программы, тесты, задания








Подсистема управления






Подсистема разработки и реализации

Подсистема отладки

Подсистема документирования







СУБД

















^ Документация, результаты работы подсистем, результаты прогнозов и т.д.



Новой ветвью в технологии промышленной разработки и реализации сложных и значительных по объему систем программного обеспечения является CASE-технология (Computer Aided Software Engineering). Все средства поддержки CASE-технологии делятся на две группы: Case-ToolKits и Case-WorkBenches. Case-ToolKits – коллекция интегрированных программных средств, обеспечивающих автоматическое ассистирование в решении задач одного типа в процессе создания программ. Case-WorkBench является естественным «замыканием» технологии разработки, реализации и сопровождения программного обеспечения. Системы типа WorkBench в контексте автоматизации программирования – это интегрированные инструментальные системы, поддерживающие весь цикл создания и сопровождения программ. К основным характеристикам WorkBench-систем

относятся:

  1. Использование определенной технологии проектирования на протяжении всего жизненного цикла целевого продукта.
  2. Вертикальная интеграция инструментальных средств, обеспечивающая связи и совместимость по данным.
  3. Горизонтальная интеграция моделей и методов, используемых на одной стадии проектирования.
  4. Сбалансированность инструментария, отсутствие дублирующих компонентов.

Отличие систем ИИ от обычных программных систем:

Характеристика

Программирование в СИИ

Традиционное

Тип обработки

Символьная

Числовая

Методы

Эвристический поиск

Алгоритм

Задание шагов решения

Неявное

Точное

Искомое решение

Удовлетворительное

Оптимальное

Управление и данные

Перемешаны

Разделены

Знания

Неточные

Точные

Модификации

Частые

Редкие



ЛЕКЦИЯ 6
^

Представление данных и знаний в Интернете

Язык HTML и представление знаний



Язык публикаций для WWW HTML был разработан Тимом Бернес-Ли из Европейского центра ядерных исследований. Версии: HTML+ (1993), HTML 2.0 (1995), HTML 3.2 (1997), HTML 4.0 (1998).

Hyper-Text Markup Language предоставляет следующие средства:
  • представление документов, содержащих заголовки, таблицы, текст, картинки и др. элементы,
  • осуществление навигации по отдельным документам с использованием гиперссылок,
  • конструирование диалоговых форм для взаимодействия с удаленными сервисами,
  • включение в документы вычисляемых форм, звука, видео и приложений.

Описание языка HTML и способы создание Интернет-документов можно найти на сайте ссылка скрыта.

HTML – язык разметки web-документов с помощью специальных конструкций, называемых тегами (tag) или специальными дескрипторами. Для выделения тегов их берут в угловые скобки. Различают теги «открытия» фрагмента и теги его «закрытия». В отличие от начальных конечные теги параметров не имеют.

В целом язык HTML определяет, что именно подлежит передаче между узлами сети. Ссылки в HTML-файле задаются с помощью дескриптора HREF, в окне броузера они выглядят как подчеркнутый текст. Изменение вида мыши при перемещении над ссылкой подсказывает пользователю, что данный текст является гиперссылкой на другой документ.

URL-адрес (Uniform Resource Locator) – строка из букв и цифр, обозначающая расположение или адрес некоторого ресурса в сети и способ доступа к нему. URL-адреса являются самой распространенной схемой идентификации ресурсов и образуют основу HTTP-протокола и всей среды Web. URL-адрес состоит из трех частей: протокола подключения, имени узла и пути, по которому может быть найден данный ресурс. Например: ссылка скрыта , ссылка скрыта.

Важными конструкциями HTML версии 4.0 являются таблицы, формы, редактируемые текстовые поля, элементы выбора, кнопки и т.п. Присоединенные процедуры могут быть подключены к HTML-документу не только в формах, но и в других конструкциях. Следующей важной конструкцией являются кадры (рамки, фреймы, слои), разделяющие документ на части и обладающие способностью «всплытия», «схлопывания» и перекрытия. Другие конструкции: таблицы стилей, скрипты, механизм интеграции текстовых и графических ссылок, механизмы подключения медиаобъектов и приложений.

^ Возможности представления знаний на базе языка HTML

Некоторые, правда ограниченные, возможности для представления знаний в языке HTML имеются.

Для семантической разметки HTML-документов могут быть полезны следующие конструкции:
  • теги типа , <META…>, <a…>.<br /> <li>Заголовки разделов, списки, таблицы.<br /> </ul> <br />Выделение значимых для семантической интерпретации конструкций является экспертной задачей. Решение проблемы семантического анализа Интернет-документов в настоящее время связывается с использованием двух подходов:<br /> <ol> <li>Семантическая разметка выполняется вручную. Результатом такой разметки является семантическая сеть, отражающая знания, представленные в документе.<br /> <li>Автоматическое или полуавтоматическое преобразование исходного текста в специальное семантическое представление, как правило в онтологию или ее фрагмент.<br /> </ol> <br />HTML – это простой язык программирования с контекстно-свободной грамматикой. Для анализа HTML-текстов можно использовать нисходящие распознаватели, реализуемые на базе рекурсивного спуска.<br /><br /><br /><b>ЛЕКЦИЯ 7</b><br />