ISP/LN

From WikiZMSI

< ISP

Spis treści

Zajęcia nr 1 - Zapoznanie z narzędziem WEKA

  1. Celem zajęć jest zapoznanie się z produktem WEKA. Z podanej poniżej strony projektu należy pobrać instalację i zainstalować narzędzie.
    • Strona projektu WEKA
  2. Omówienie funkcjonalności WEKA z naciskiem na Explorer. Pomocnicze materiały w slajdach poniżej.
  3. Zbiory danych do analizy: Machine Learning Repository

Zadanie domowe

Celem zadania domowego jest zapoznanie się z miarami jakości klasyfikatora:

W sprawozdaniu opisać następujące miary jakości klasyfikatora:

  1. Kappa statistic (Współczynnik Kappa)
  2. TP Rate (True Positive Rate)
  3. FP Rate (False Positive Rate)
  4. Specyficzność
  5. Precision
  6. Recall (czułość)
  7. ROC Area (analiza krzywej ROC)
  8. Confusion Matrix (macierz pomyłek)

Dla każdej miary podać jaka jest wartość oczekiwana dla dobrego klasyfikatora. Postarać się opisać własnymi słowami jakie znaczenie ma dana miara, jaka jest jej intuicyjna interpretacja.

Zajęcia nr 2,3 - Wstępna analiza danych na zbiorze KDD

  1. Celem zajęć jest wstępna analiza i czyszczenie danych z włamań. Dane są dostępne:
    1. Lincoln Laboratory MIT
    2. KDD Cup 1999 Data Dane do pobrania w formacie arff
    3. NSL-KDD DataSet Dane do pobrania w formacie arff
    4. Artykuł tłumaczący różnicę pomiędzy zbiorami NSL-KDD i KDD

Zadanie do wykonania

 Instrukcja do zadania

Zajęcia nr 4 - porównanie klasyfikatorów

  1. Celem zajęć jest porównanie klasyfikatorów w zdaniu rozpoznawania włamań w sieci komputerowej. Do wykonania zadania należy wykorzystać zbiory danych:
    1. KDDTrain+_20Percent.arff do klasyfikacji binarnej
    2. KDDTrain+_20Percent-23class.arff do klasyfikacji wielowartościowej
  2. Na podstawie pliku KDDTrain+_20Percent-23class.arff należy utworzyć trzeci potrzebny do wykonania zadania plik zgodnie z instrukcją podaną poniżej

Zadanie do wykonania