ASI3 Pawel Kaim

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 6

Algorytmy sztucznej inteligencji

Sprawozdanie 3

Sieci neuronowe

Paweł Kaim
1. Źródło danych

Zbiór danych wykorzystany w projekcie został pobrany ze strony UCI Machine Learning
Repository https://archive.ics.uci.edu/ml/datasets/Wine+Quality. Zbiór dotyczy oceny
jakości czerwonych win w skali od 0 do 10 na podstawie testów fizykochemicznych. Zbiór
zawiera 1599 obiektów, 12 atrybutów w tym jeden decyzyjny oraz nie posiada brakujących
wartości.

2. Opis atrybutów

Atrybuty:

1. fixed acidity – kwasowośd stała (typ ciągły),

2. volatile acidity – kwasowośd lotna (typ ciągły),

3. citric acid – kwas cytrynowy (typ ciągły),

4. residual sugar – cukier resztkowy (typ ciągły),

5. chlorides – chlorki (typ ciągły),

6. free sulfur dioxide – wolny dwutlenek siarki (typ ciągły),

7. total sulfur dioxide – całkowity dwutlenek siarki (typ ciągły),

8. density – gęstośd (typ całkowitoliczbowy),

9. pH (typ całkowitoliczbowy),

10. sulphates – siarczany (typ ciągły),

11. alcohol – alkohol (typ ciągły)

12. quality (between 0 and 10) – jakośd (w skali 0-10)

1 2 3 4 5 6 7 8 9 10 11 12
min 4,6 0,12 0 0,9 0,012 1 6 0,99007 2,74 0,33 8,4 3
max 15,9 1,58 1 15,5 0,611 72 289 1,00369 4,01 2 14,9 8

Na potrzeby projektu został dodany atrybut SNN określający czy obiekt należy do zestawu
treningowego czy testowego. Obiekty zostały przydzielone do zbiorow za pomocą finkcji
RAND w Excellu. Liczebnośd zbioru treningowego wynosi 836 co stanowi 52% wszystkich
obiektów, spełniona jest więc zasada, że zestaw treningowy powinien byd nie mniejszy niż
uczący.
3. Tworzenie sieci neuronowej

Pierwszym etapem tworzenia sieci neuronowych w programie Statistica jest określenie jej zadania.
Zaznaczona zatem została opcja klasyfikacja.

Następnie określone zostały atrybuty należące do wyjścia jakościowego (quality) oraz wejścia
ilościowe (fixed acidity, volatile acidity ,citric acid, residual sugar, chlorides, free sulfur dioxide ,total
sulfur dioxide, density, pH, sulphates, alcohol). Jako sposób tworzenia modeli wybrany został
„Automatyczne poszukiwanie sieci”.
Następnie za pomocą atrybutu SNN określone zostały zbiory uczący i walidacyjny.

Tworzone sieci są typu MLP (ang.multilayer perception). Liczba neuronów w warstwie ukrytej jest
została ustawiona na przedział od 10 do 20 a wykorzystaną funkcją błędu była suma kwadratów.
Funkcjami aktywacyjnymi dla neuronów ukrytych i wyjściowych były: liniowa, logistyczna, tanh,
wykładnicza oraz sinus.
Po wygenerowaniu 20 sieci na podstawie jakości walidacyjnej wybrane zostało 5 najlepszych.
Ponieważ jakośd tylko dwóch z nich przekroczyła 60%, tylko one zostaną omówione.

2-MLP 11-17-6 o jakości 60,288336

3-MLP 11-20-6 o jakości 61,336828

W obu tych sieciach zastosowane zostały te same funkcje aktywacyjne tzn. dla neuronów warstwy
ukrytej funkcja wykładnicza, a dla neuronów wyjściowych funkcja tanh.

3. Macierz pomyłek

Na podstawie macierzy pomyłek zauważyd można że obie macierze miały duży problem dla
zaklasyfikowania win o jakości 3 i 4. Na 6 prób żadne win o jakości 3 nie zostało dobrze
zaklasyfikowane, natomiast na 28 win o jakości 4 tylko 3 zostały zaklasyfikowane poprawnie. O wiele
lepiej sieci poradziły sobie dla klasy jakości 5 i 6 dla których jakośd wynosiła kolejno 81,8% i 76% dla
drugiej sieci, oraz 82,6% i 80,6% dla trzeciej sieci. Równie problematyczne co wina o jakości 3 i 4
okazały się wina o jakości 8. Obie sieci nie potrafiły przyporządkowad poprawnie z 12 takich
obiektów. Największą różnicę pomiędzy sieciami widad dla win o jakości 7. Trzecia sied zdołała
poprawnie ocenid 62 na 108 takich win co dało wynik 57%, podczas gdy sied druga była o ponad 20%
gorsza i poprawnie zaklasyfikowała jedynie 39 przypadków.

4 Podsumowanie
Widad że dla klas o większej liczebności sieci radziły sobie o wiele lepiej niż dla klas o małej
liczebności. Dysproporcje w liczebnościach dokładnie widad na histogramie.
Mała próbka (kilkanaście dla klas 3 i 8 oraz około 30 dla klasy 4) w połączeniu z obiektami, które
posiadają kilkanaście atrybutów spowodowały, że sieci nie mogły nauczyd się poprawnej klasyfikacji.
Negatywny wypływ na naukę sieci mógł mied również fakt, że dane były nieprzygotowane. Możliwe
że wyniki byłyby lepsze gdyby uprzednio zdyskretyzowad lub znormalizowad atrybuty ciągłe. Pomimo
niskiego ogólnej jakości klasyfikacji, klasy 5 i 6 pokazują że sieci neuronowe potrafią byd skutecznym
narzędziem klasyfikacji obiektów, pamiętad jednak należy, że są one w dłużej mierze zależne od
jakości danych które wykorzystywane są na etapie uczenia.

You might also like