Вступ до аналізу асоціативних правил

Контрольная работа - Компьютеры, программирование

Другие контрольные работы по предмету Компьютеры, программирование

?одичності, тощо.

  • Лінійна регресія будується модель даних у вигляді набору коефіцієнтів лінійного перетворення.

  • Логістична регресія будується бінарна логістична регресійна модель.

  • Нейромережа опрацювання даних за допомогою багатошарової нейронної мережі.

  • Дерево рішень опрацювання даних за допомогою дерев рішень.

  • Самоорганізовані карти виконується кластеризація даних.

  • Асоціативні правила виявлення залежностей між взаємозвязаними подіями.

  • Користувацька модель задання моделі вручну за формулами.

  • Інше:
  • Скрипт застосування моделі до нових даних. Скрипти призначені для автоматизації процесу додавання в сценарій однотипних гілок обробки. По суті скрипт є динамічною копією вибраної ділянки сценарію. При зміні оригінальної гілки змінюється і скрипт, який посилається на неї. Наприклад, після імпорту даних з двох різних баз даних потрібно провести їх попередню обробку (очистити дані, згладити, поміняти назви стовпців, додати кілька однакових значень, тощо) та побудувати однакові моделі прогнозу, а потім експортувати отримані дані назад. Для першої гілки (першої БД) ці дії проводяться як звичайно: послідовними кроками будується ланцюжок обробників. Для другого джерела (другої БД) достатньо буде створити вузол імпорту, до якого потрібно приєднати скрипт, що базується на побудованій першій гілці. У цьому скрипті будуть виконані точно такі ж дії, як в оригінальній гілці. На виході скрипта ставиться вузол експорту, і друга гілка є готовою до використання. Аналогом скриптів є функції та процедури в мовах програмування: гілка обробки будується один раз, а потім за допомогою скриптів виконуються закладені в ній універсальні обробники.

  • Калькулятор дозволяє сформувати нове поле вибірки як результат обчислень над даними з інших полів.

  • Умова дозволяє організувати умовне виконання сценарію обробки даних.

  • Команда OC забезпечує формування й запуск різних команд операційної системи.

  • Залежно від обраного методу Майстер обробки буде містити різне число кроків і набір параметрів, що надбудовуються на кожному кроці. На кожному кроці Майстра обробки доступні кнопки Далі, Назад та Скасувати. Майстер візуалізації даних Майстер візуалізації допоможе в інтерактивному покроковому режимі вибрати та налаштувати найбільш зручний спосіб подання даних. В залежності від обраного способу візуалізації будуть налаштовуватись різні параметри, а Майстер, відповідно, буде містити різне число кроків. Для виклику Майстра візуалізації можна скористатися кнопкою

    Майстер візуалізації на панелі інструментів Сценарії, попередньо виділивши потрібну гілку у сценарії опрацювання або вибравши відповідну команду з контекстного меню для даної гілки сценарію.

    Виконання аналізу асоціативних правил На першому кроці необхідно імпортувати дані в Deductor. Використовуючи кнопку

    , вказуємо шлях до текстового файлу з роздільниками. Для прикладу, можна вибрати один із готових прикладів у папці Samples Supermarket.txt:

    Пілся натискування кнопки Далі вказуємо тип роздільника та інші параметри імпорту. Наступним кроком є вказання параметрів стопвпців:

    Після цього натискаємо кнопку Далі, а потім Пуск. Після виконання процесу імпорту даних з текстового файлу потрібно вибрати спосіб їх відображення (за замовчуванням таблиця). Після цього маємо дані, готові для опрацювання:

    асоціативний правило аналітичний

     

    Стаємо на відповідну гілку в сценарії та натискаємо кнопку Майстра обробки даних:

     

     

    Серед методів опрацювання даних вибираємо Асоціативні правила, після чого потрібно вказати, який стовпець відповідає за номер чи ідентифікатор транзакції, а який містить самі елементи (в даному випадку покупки):

     

    Наступне вікно дозволяє вказати значення мінімальних та максимальних підтримки та достовірності правил:

     

     

    В наступному вікні натискаємо кнопку Пуск, після чого здійснюється аналіз згідно вказаних значень:

     

     

    Далі знову пропонуються різні способи візуалізації даних. Вибираємо всі способи відображення, що знаходяться в групі Data Mining. В результаті одержуємо:

    1. Набір асоціативних правил з вказанням їх підтримки, достовірності та кількості.
    2. Популярні набори елементів (в даному випадку покупок).
    3. Дерево правил за наслідком, наприклад:

     

     

    що буде показувати, після покупки яких продуктів далі ймовірно будуть куплені сухарі.

    1. Можливість розрахувати умову якщо... то...: наприклад, можна вказати умову вафлі, а потім натиснути кнопку Розрахувати правила або Ctrl+Enter. Після цього внизу в області наслідку зявляться відповідні записи чай, сухарі, сухарі і чай з вказанням всіх параметрів.