Нові тенденції і прикладні аспекти інженерії знань

Курсовой проект - Менеджмент

Другие курсовые по предмету Менеджмент

атентних змінних;

  • стиснення початкового масиву даних з мінімальними втратами в їх інформативності.
  • Незалежно від завдання багатовимірне градуювання завжди використовується як інструмент наочного представлення (візуалізації) початкових даних. Багатовимірне градуювання широко застосовується в дослідженнях щодо антропології, педагогіки, психології, економіки, соціології [15].

    В основі даного підходу лежить інтерактивна процедура субєктивного градуювання, коли випробовуваному (тобто експертові) пропонується оцінити схожість між різними елементами за допомогою деякої градуйованої шкали (наприклад, від 0 до 9, або від -2 до +2). Після такої процедури аналітик розташовує чисельно представленими стандартизованими даними, що піддаються обробці існуючими пакетами прикладних програм, що реалізовують різні алгоритми формування концептів вищого рівня абстракції і що будують геометричну інтерпретацію семантичного простору в евклідової системі координат.

    Основний тип даних в багатовимірному градуюванні заходи близькості між двома обєктами (i, j) dij. Якщо міра близькості така, що найбільші значення dij відповідають парам найбільш схожих обєктів, то dij міра подібності, якщо, навпаки, найменше схожим, то dij міра відмінності.

    Багатовимірне градуювання використовує дистанційну модель відмінності, використовуючи поняття відстані в геометрії як аналогію схожості і відмінності понять. Для того, щоб функція d, визначена на парах обєктів (а, b), була евклідовою відстанню, вона повинна задовольняти наступні чотири аксіоми:

     

     

    Тоді, згідно звичайній формулі евклідова відстань, міра відмінності двох обєктів i та j із значеннями ознаки k у обєктів i та j відповідно xik та xjk:

     

     

    Дистанційна модель була багато разів перевірена в соціології і психології [16], що дає можливість оцінити її придатність для використання.

    У більшості робіт по багатовимірному градуюванню використовується матрична алгебра. Геометрична інтерпретація дозволяє представити абстрактні поняття матричної алгебри в конкретній графічній формі. Для полегшення інтерпретації рішення задачі багатовимірного градуювання до попередньо оціненої матриці координат стимулів X застосовується обертання.

    Серед безлічі алгоритмів багатовимірного градуювання широко використовуються різні модифікації метричних методів Торгерсона [17], а також неметричні моделі, наприклад Крускала [18].

    При порівнянні методів багатовимірного градуювання з іншими методами аналізу, теоретично застосовними в інженерії знань (ієрархічний кластерний аналіз або аналіз чинника), багатовимірне градуювання виграє за рахунок можливості дати наочне кількісне координатне уявлення, що переважно є простішим і тому легше інтерпретується експертами.

     

    1.3 Використання метафор для виявлення прихованих структур знань

     

    Не дивлячись на близькість завдань, інженерія знань і психосемантика істотно відрізняються як в теоретичних підставах, на яких вони базуються, так і в практичних методиках. Але головна відмінність полягає в тому, що інженерія знань направлена на виявлення, як остаточного результату, моделі міркувань, динамічній або операційної складової ментального простору (або функціональної структури поля знань Sf), тоді як психосемантика, намагаючись представити ментальний простір у вигляді евклідового простору, дозволяє робити видимою статичну структуру взаємного розташування обєктів в памяті, у вигляді проекцій скупчень обєктів (концептуальна структура Sk).

    Крім цього слід зазначити ряд недоліків методів психосемантики з погляду практичної інженерії знань.

    Оскільки в основі психосемантичного експерименту лежить процедура вимірювання субєктивних відстаней між стимулами, що предявляються, то і результати обробки такого експерименту, як правило, використовують геометричну інтерпретацію евклідовий простір невеликого числа вимірювань (найчастіше двовимірне). Таке сильне спрощення моделі памяті може привести до неадекватних баз знань.

    Природність ієрархії як глобальної моделі понятійних структур свідомості служить методологічною базою ОСП. Крім того, і в природній мові поняття явно тяжіють до різних рівнів узагальнення. Проте в більшості прикладних пакетів не передбачено розбиття семантичного простору на рівні, що відображають різні ступені спільності понять, включених в експериментальний план. В результаті отримувані кластери понять, просторово ізольовані в геометричній моделі градуювання, носять таксономічно неоднорідний характер і важко піддаються інтерпретації.

    Єдині відносини, що виявляються процедурами психосемантики, це далеко близько за деякою шкалою. Для проектування і побудови баз знань виявлення відношень є на порядок складнішим завданням, ніж виявлення понять. Тому семантичні простори, отримані в результаті градуювання і кластеризації, повинні бути піддані подальшій обробці на предмет визначення відношень, особливо функціональних і каузальних.

    Не варто очікувати, що ці протиріччя можуть бути вирішені швидко й безболісно, оскільки, математичний апарат, покладений в основу всіх пакетів прикладних програм з психосемантики, має певні межі застосування. Однак одним з можливих шляхів зближення без порушення чистоти процедури бачиться розширення простору конкретних обє?/p>