AED/L/z4

From WikiZMSI

< AED | L

Na zajęciach

  • Na potrzeby laboratorium jako zbiór danych (do algorytmu CART) można użyć zbioru z UCI dotyczącego klasyfikacji wina (z pierwszych zajęć).
  • Zaimplementować 3 skrypty obliczające różne wersje funkcji nieczystości (impurity function) jako: błąd klasyfikacji, entropię, indeks Gini'ego.
  • Zaimplementować skrypt budujący rekurencyjnie pełne drzewo CART (dla danego na wejście zbioru danych i wybranej funkcji nieczystości).
  • Zaimplementować możliwość graficznego (lub wygodnego tekstowego) wyświetlenia powstałego drzewa.

Do domu

Dla wybranego przez siebie zbioru danych (innego niż zbiór "wino") wykonać:

  • Zaimplementować skrypt wybierający optymalne przycięcie pełnego drzewa, mając podaną wartość kary za 1 liść.
  • Zaimplementować skrypt wybierający optymalne przycięcie pełnego drzewa, mając dany zbiór kandydatów na wartość kary za 1 liść oraz wykonując procedurę kroswalidacyjną.