AED/L/z4
From WikiZMSI
[edytuj]
Na zajęciach
- Na potrzeby laboratorium jako zbiór danych (do algorytmu CART) można użyć zbioru z UCI dotyczącego klasyfikacji wina (z pierwszych zajęć).
- Zaimplementować 3 skrypty obliczające różne wersje funkcji nieczystości (impurity function) jako: błąd klasyfikacji, entropię, indeks Gini'ego.
- Zaimplementować skrypt budujący rekurencyjnie pełne drzewo CART (dla danego na wejście zbioru danych i wybranej funkcji nieczystości).
- Zaimplementować możliwość graficznego (lub wygodnego tekstowego) wyświetlenia powstałego drzewa.
[edytuj]
Do domu
Dla wybranego przez siebie zbioru danych (innego niż zbiór "wino") wykonać:
- Zaimplementować skrypt wybierający optymalne przycięcie pełnego drzewa, mając podaną wartość kary za 1 liść.
- Zaimplementować skrypt wybierający optymalne przycięcie pełnego drzewa, mając dany zbiór kandydatów na wartość kary za 1 liść oraz wykonując procedurę kroswalidacyjną.