Вступ до аналізу асоціативних правил
Контрольная работа - Компьютеры, программирование
Другие контрольные работы по предмету Компьютеры, программирование
?одичності, тощо.
Лінійна регресія будується модель даних у вигляді набору коефіцієнтів лінійного перетворення.
Логістична регресія будується бінарна логістична регресійна модель.
Нейромережа опрацювання даних за допомогою багатошарової нейронної мережі.
Дерево рішень опрацювання даних за допомогою дерев рішень.
Самоорганізовані карти виконується кластеризація даних.
Асоціативні правила виявлення залежностей між взаємозвязаними подіями.
Користувацька модель задання моделі вручну за формулами.
Скрипт застосування моделі до нових даних. Скрипти призначені для автоматизації процесу додавання в сценарій однотипних гілок обробки. По суті скрипт є динамічною копією вибраної ділянки сценарію. При зміні оригінальної гілки змінюється і скрипт, який посилається на неї. Наприклад, після імпорту даних з двох різних баз даних потрібно провести їх попередню обробку (очистити дані, згладити, поміняти назви стовпців, додати кілька однакових значень, тощо) та побудувати однакові моделі прогнозу, а потім експортувати отримані дані назад. Для першої гілки (першої БД) ці дії проводяться як звичайно: послідовними кроками будується ланцюжок обробників. Для другого джерела (другої БД) достатньо буде створити вузол імпорту, до якого потрібно приєднати скрипт, що базується на побудованій першій гілці. У цьому скрипті будуть виконані точно такі ж дії, як в оригінальній гілці. На виході скрипта ставиться вузол експорту, і друга гілка є готовою до використання. Аналогом скриптів є функції та процедури в мовах програмування: гілка обробки будується один раз, а потім за допомогою скриптів виконуються закладені в ній універсальні обробники.
Калькулятор дозволяє сформувати нове поле вибірки як результат обчислень над даними з інших полів.
Умова дозволяє організувати умовне виконання сценарію обробки даних.
Команда OC забезпечує формування й запуск різних команд операційної системи.
Майстер візуалізації на панелі інструментів Сценарії, попередньо виділивши потрібну гілку у сценарії опрацювання або вибравши відповідну команду з контекстного меню для даної гілки сценарію.
Виконання аналізу асоціативних правил На першому кроці необхідно імпортувати дані в Deductor. Використовуючи кнопку, вказуємо шлях до текстового файлу з роздільниками. Для прикладу, можна вибрати один із готових прикладів у папці Samples Supermarket.txt:
Пілся натискування кнопки Далі вказуємо тип роздільника та інші параметри імпорту. Наступним кроком є вказання параметрів стопвпців: Після цього натискаємо кнопку Далі, а потім Пуск. Після виконання процесу імпорту даних з текстового файлу потрібно вибрати спосіб їх відображення (за замовчуванням таблиця). Після цього маємо дані, готові для опрацювання:асоціативний правило аналітичний
Стаємо на відповідну гілку в сценарії та натискаємо кнопку Майстра обробки даних:
Серед методів опрацювання даних вибираємо Асоціативні правила, після чого потрібно вказати, який стовпець відповідає за номер чи ідентифікатор транзакції, а який містить самі елементи (в даному випадку покупки):
Наступне вікно дозволяє вказати значення мінімальних та максимальних підтримки та достовірності правил:
В наступному вікні натискаємо кнопку Пуск, після чого здійснюється аналіз згідно вказаних значень:
Далі знову пропонуються різні способи візуалізації даних. Вибираємо всі способи відображення, що знаходяться в групі Data Mining. В результаті одержуємо:
- Набір асоціативних правил з вказанням їх підтримки, достовірності та кількості.
- Популярні набори елементів (в даному випадку покупок).
- Дерево правил за наслідком, наприклад:
що буде показувати, після покупки яких продуктів далі ймовірно будуть куплені сухарі.
- Можливість розрахувати умову якщо... то...: наприклад, можна вказати умову вафлі, а потім натиснути кнопку Розрахувати правила або Ctrl+Enter. Після цього внизу в області наслідку зявляться відповідні записи чай, сухарі, сухарі і чай з вказанням всіх параметрів.