Professional Documents
Culture Documents
Isd 01
Isd 01
MULTIMEDIALNYCH
LABORATORIUM INTELIGENTNYCH
SYSTEMÓW DECYZYJNYCH
opracowanie:
mgr inż. Katarzyna Kaszuba
mgr inż. Kuba Łopatka
1. Wprowadzenie
Drzewo decyzyjne z definicji jest to struktura obrazująca proces decyzyjny. Algorytmy drzew
decyzyjnych stosowane są w uczeniu maszynowych jako metoda pozyskiwania wiedzy z
zebranych przykładów (eksploracja danych, ang. data mining).
Algorytmy charakteryzuje struktura drzewiasta, w której węzły wewnętrzne zawierają testy na
wartościach atrybutów. Z każdego węzła wewnętrznego wychodzi tyle gałęzi, ile możliwych jest
wyników testu badanego w węźle. Każde drzewo decyzyjne zakańczają liście w których
przechowywane są decyzję o klasyfikacji obiektów. Od strony programistycznej warto wiedzieć,
że zwykle drzewo decyzyjne koduje program zawierający same instrukcje warunkowe.
Atrybutami wejściowymi drzew decyzyjnych mogą być dane w formie liczbowej lub ujęte
przy pomocy pojęć naturalnych takich ja np. niski, wysoki, zimny, itp. Atrybuty symboliczne są
bardziej przejrzyste podczas przeglądania struktury drzewa jednak dają możliwości dla testowania
węzła tylko w sposób równościowy tzn:
1 if (ai ( x) v)
t ( x)
0 otherwise
1 if (a i ( x) c)
t ( x)
0 otherwise
Podczas konstrukcji drzewa decyzyjnego każdy zbiór obiektów zostaje podzielony na klasy.
Wyznaczane jest też prawdopodobieństwo wystąpienia danej klasy.
Ci
pi
X
gdzie, pi – prawdopodobieństwo wystąpienia obiektu i-tej klasy, Ci – liczebność i-tej
klasy, X – ilość wszystkich obiektów w zbiorze.
IG Entropy ( X ) pi Entropy ( X i )
i
Przykład:
2. Opis ćwiczenia
2.1 Zaprojektuj drzewo decyzyjne, które rozwiązuje problem, w jaki sposób osoba ma spędzić
wolny wieczór i popołudnie. Wykorzystaj dane treningowe zamieszczone w tabeli
konwergencji poniżej. Schemat stworzonego drzewa decyzyjnego należy dołączyć do
sprawozdania. Pamiętaj przy tym, że projektując drzewo należy kierować sie zasadą: im
mniejsze, tym lepsze.