Лабораторная работа: Вступ до аналізу асоціативних правил
Майстер імпорту допоможе в інтерактивному покроковому режимі вибрати тип джерела даних і налаштувати відповідні параметри. На першому кроці відкривається список всіх передбачених у системі типів джерел даних, згрупованих за способом доступу до даних. Список доступних джерел може змінюватися залежно від налаштувань на панелі підключень, а також індивідуальних налаштувань доступних дій і доступних джерел даних. Підключенням називається налаштоване і назване певним чином під’єднання до зовнішньої системи, що дозволяє обмінюватись із нею даними (приймати чи передавати).
Для виклику Майстра імпорту можна скористатися кнопкою «Майстер імпорту» на панелі інструментів «Сценарії», вибрати відповідну команду з контекстного меню або натиснути <F6>. З доступних підключень клацанням миші виберіть потрібне:
- Сховища даних:
o Virtual Warehouse – імпорт даних з Virual Warehouse;
o Deductor Warehouse - імпорт даних з Deductor Warehouse.
- Бізнес-програми:
o 1С: Підприємство 7.7 – імпорт даних з облікової системи 1С версії 7.7;
o 1С:Підприємство 8.x – імпорт даних з облікової системи 1С 8.х.
- Бази даних:
o База даних – імпорт даних з баз даних різних видів.
- Прямий доступ до файлів:
o Текстовий файл із роздільниками – тобто у форматі, в якому стовпці даних розділені однотипними символами-роздільниками;
o Імпорт з DBF – прямий доступ до файлів плоских баз даних типу DBF, що підтримується такими ужитками, як dBase, FoxBase, FoxPro.
- Механізм MS ADO:
o Microsoft Excel – книга Microsoft Excel (*.xls);
o Microsoft Access – файл СУБД Microsoft Access (*.mdb);
o Імпорт з DBF (ADO) – доступ через ADO[3] до файлів плоских баз даних типу DBF, що підтримується такими ужитками, як dBase, FoxBase, FoxPro;
o Текстовий файл з доступом через ADO – тобто текстовий файл із роздільниками, доступ до якого здійснюється через механізм ADO;
o ADO-джерело – імпорт даних безпосередньо за допомогою системних налаштувань механізму ADO.
Кількості кроків Майстри імпорту та параметрів відрізянються для різних типів джерел. На кожному кроці Майстра імпорту доступні кнопки «Далі» та «Назад», які дозволяють перейти до наступного кроку або повернутися на попередній крок для внесення змін у раніше налаштовані параметри. Кнопка «Скасувати» дозволить відмовитися від використання Майстра імпорту.
Майстер опрацювання даних
Майстер опрацювання даних допоможе в інтерактивному покроковому режимі налаштувати всі необхідні етапи обробки даних. У вікні першого кроку Майстри наведені всі доступні в системі методи опрацювання даних, згруповані за типом. Для виклику Майстра опрацювання даних можна скористатися кнопкою «Майстер обробки» на панелі інструментів «Сценарії», попередньо виділивши потрібну гілку у сценарії або вибравши відповідну команду з контекстного меню (<F7>).
З доступних алгоритмів опрацювання даних потрібно вибрати один, скориставшись мишкою:
- Очищення даних:
o Парціальна обробка – алгоритми відновлення, згладжування та редагування аномальних даних.
o Факторний аналіз – для зниження розмірності вхідних факторів. Зниження розмірності необхідно у випадках, коли вхідні фактори є скорельованими один з одним, тобто взаємозалежні. У факторному аналізі мова йде про виділення з множини вимірюваних характеристик об'єкта нових факторів, що більш адекватно відображають властивості об'єкта.
o Кореляційний аналіз – усунення факторів, що не сильно впливають на результат (вихідні поля): такі фактори можуть бути виключені з розгляду практично без втрати корисної інформації. Критерієм прийняття рішення про виключення фактора служить порог чутливості: якщо кореляція (ступінь взаємозалежності) між вхідним та вихідним факторами є нижчою за поріг чутливості, то відповідний вхідний фактор відкидається як незначний.
o Дублікати та протиріччя – виявлення дублікатів та суперечливих записів у вхідному наборі даних.
o Фільтрація – фільтрація записів вибірки за заданими умовами.
- Трансформація даних: