Professional Documents
Culture Documents
2013 02 08 Factor Analysis PDF
2013 02 08 Factor Analysis PDF
2013 02 08 Factor Analysis PDF
Faktorska analiza
Faktorska analiza predstavlja jednu od najpopularnijih multivarijacionih tehnika koja ima dva cilja:
1.
2.
Smanjivanje broja varijabli u analizi kada ih je previe, pri emu se neke od njih
preklapaju jer imaju slino znaenje i ponaanje.
Faktorska analiza je tehnika meuzavisnosti jer trai grupu varijabli koje su sline u smislu da se
zajedno pomeraju i zbog toga imaju veliku meuzavisnost. Kada jedna varijabla ima veliku
vrednost, onda i ostale varijable u grupi imaju veliku vrednost. U marketing istraivanjima ova
tehnika vrlo esto slui za analiziranje rejtinga proizvoda ili karakteristika brenda, stavova i slino.
Kod tehnika meuzavisnosti ne postoji podela na zavisne i nezavisne varijable jer su sve zapravo
nezavisne. Ovim tehnikama se zapravo trai model odnosa izmeu varijabli koji ima smisla sa
aspekta problema istraivanja. Tehnike meuzavisnosti su zapravo heuristiki, aproksimativni
metodi kojima se traga za razumnim, smislenim, optimalnim reenjima.
Za efikasnu primenu faktorske analize, pa i drugih multivarijacionih tehnika meuzavisnosti,
potrebno je da postoji minimalna koliina redundancije varijabli, odnosno da se varijable barem
malo preklapaju u svom znaenju. Zahvaljujui toj redundantnosti mogue je otkriti ablon u
ponaanju varijabli, odnosno osnovnu ideju (faktor) kojom su proete.
Sa druge strane, kod multivarijacionih tehnika zavisnosti, gde postoji jedna zavisna i vie nezavisnih
varijabli, redundantnost nije uopte poeljna jer moe da utie na visinu regresionog koeficijenta
svake nezavisne variable pojedinano u modelu. Drugim reima, dolazi do multikolinearnosti pa se
ne vidi jasno koliko koja nezavisna varijabla ima uticaja na zavisnu varijablu.
Kada se pravi anketa, esto dolazi do redundantnosti izmeu postavljenih pitanja. Kada se dizajnira
upitnik, istraiva nikada ne moe biti siguran da je pokrio pravu temu u potpunosti sa pitanjima
koja je odabrao. Zbog toga se esto u upitnik uvrtava vie pitanja koja se na isti ili slian nain
odnose na temu istraivanja. Na primer, u istraivanju na tritu deije hrane, upitnik moe da
sadri najmanje 15 pitanja koja pokrivaju za nijansu razliite aspekte iste teme: deiju hranu.
U ovom kontekstu, jedan od glavnih ciljeva faktorske analize je da trai grupu slinih iskaza od
strane respondenata jer oni izraavaju istu osnovnu ideju na naine koji se razlikuju u nijansama. Mi
elimo da identifikujemo tu osnovnu ideju i da je izmerimo. Te osnovne ideje se nazivaju faktorima.
Faktori se ne mogu identifikovati i izmeriti direktno. Oni se mogu otkriti preko odnosa izmeu
varijabli koje ih svojim ponaanjem ispoljavaju.
Poto se faktori statistiki izdvajaju, svi faktori su inicijalno meusobno nepovezani (ortogonalni).
Ovo pojednostavljuje razumevanje irokog spektra varijabli koje opisuju neku kategoriju iz sektora
usluga ili proizvodnje. Takoe se stvara okvir za dalju analizu podataka.
Iako faktori inicijalno nisu povezani, to ne znai da se to odnosi i na pojedine, originalne iskaze
respondenata. Jedan iskaz respondenta moe u sebi da sadri vie faktora. Takvi iskazi su faktorski
kompleksni. Sami po sebi, ovi iskazi nee jasno definisati ni jedan faktor, ali mogu da doprinesu u
opisivanju faktora od kojih se sastoje.
Identifikovani faktori reprezentuju osnovne ideje odnosno komponente koje su bitne, na primer,
potroaima prilikom vrednovanja nekog proizvoda. Za istraivaa je mnogo lake da se fokusira na
nekoliko najvanijih karakteristika proizvoda koje reprezentuju faktori nego na sve mogue
karakteristike koje su posmatrane. Faktorska analiza na taj nain prua dobar osnov za razumevanje
najvanijih, sutinskih dimenzija ili ideja vezanih za posmatranu pojavu.
Faktorska analiza ima i svoja ogranienja koja se esto navode u literaturi (Hair, Black, Babin, &
Anderson, 2010):
Poto postoji mnogo tehnika kojima moe da se izvede faktorska analiza, ne postoji
konsenzus koja od njih je najbolja.
Subjektivni aspekt je veoma izraen (koliko faktora, koja rotacija, kolika statistika
znaajnost faktorskih optereenja) to dovodi do velikog razmimoilaenja u stavovima
istraivaa.
Problem pouzdanosti je prisutan.
2.
3.
Izbor po jedne varijable iz svake grupe koja najbolje karakterie odreeni faktor i koristiti
je kao marker varijablu odnosno surogat.
4.
Korienje jednog faktor skora koji predstavlja prosek svih varijabli vezanih za dati faktor.
5.
Faktorska analiza se esto koristi da bi se racionalizovao broj pitanja koji se nalaze u anketama.
Nakon racionalizacije dogaa se da se u istraivanju koriste identifikovani faktori a ne originalne
varijable.
Rezultati faktorske analize u mnogome zavise od samog istraivaa, jer e analiza otkriti obrasce
ponaanja bilo kojih varijabli koje istraiva ukljui u model. Ukoliko se odlui za itav niz
varijabli koje su vezane za jednu ideju, a kod drugih ideja postoji znatno manje varijabli, definisae
se jedan faktor sa velikom vrednou. Zbog toga dizajniranje upitnika bitno utie na rezultate
faktorske analize. Cilj faktorske analize je da pronae grupu povezanih varijabli, ali ne i da utvrdi
vanost tog grupisanja.
Faktor
1. faktor Hrana
Koriste visoko kvalitetne sastojke u hrani.
0.78
0.72
0.69
0.59
0.59
0.59
Porcije su odgovarajue.
0.53
2. faktor Objekat
Unutranjost uvek izgleda lepo.
0.72
0.69
0.68
Toaleti su isti.
0.60
Zgrade su atraktivne.
0.58
0.55
0.53
0.52
3. faktor Okruenje
Moe biti brzo usluen.
0.77
Zaposleni su ljubazni.
0.65
0.58
0.57
4. faktor Meni
Povremeno imaju nova jela.
0.77
0.74
0.59
0.48
Kada se dobijeni koeficijent za prvu karakteristiku (0,78) podigne na kvadrat, dobija se da je oko
61% varijacija u oceni zajedniko sa faktorom. Ovako mali koeficijent determinacije je dobijen zato
to su mnoga pitanja u anketi izbaena jo prilikom dizajniranja upitnika zbog utede u resursima.
To znai da su mnoge slinosti i redundantnosti izmeu pitanja ranije eliminisane. Vee optereenje
faktora bi moglo lako da se dobije dodavanjem novih pitanja koja su slina ve postojeim.
Faktor 3 je mnogo tei za interpretaciju. Karakteristike nisu logiki povezane i ne ine celinu. Ipak,
faktorska analiza ukazuje da se ove karakteristike pomeraju zajedno u ocenjivanju. To znai kada
respondent da relativno visoku ocenu jednoj karakteristici iz grupe, i ostale karakteristike iz grupe
imaju tendenciju ka visokoj oceni. Zbog toga nije bilo jednostavno dodeliti pravi naziv faktoru. Na
kraju je izbor pao na naziv Okruenje.
etvrtom faktoru je bilo lake dati ime jer se karakteristike odnose uglavnom na meni restorana.
Zbog toga je dodeljen naziv Meni.
Izbor imena za faktore je izuzetno bitan jer je kasnije prilikom donoenja bilo kakvih odluka fokus
upravo na nazivima. To je ponekad lake kada postoje i pozitivno i negativno optereenje faktora jer
nam negativni govore ta dati faktor ne predstavlja.
Na osnovu definisanih faktora stvorena je globalna slika o restoranima brze hrane koju strateki
menadment mora da uvai. Pored toga, 23 karakteristike su smanjene na svega 4 glavne varijable
(faktore) koje mogu biti upotrebljene za dodatnu analizu podataka. Iako ova etiri faktora ne
pokrivaju sve to su pokrivale 23 karakteristike, ipak pokrivaju vei deo varijacija.
Primer: Auto-dileri
140 kupaca automobila zamoljeno je da oceni auto-dilere koje su posetili na osnovu 20 datih
karakteristika. Faktorska analiza je dala vrlo jasne rezultate na osnovu ankete.
1. Lini pristup
Jasno su mi odgovarali na pitanja.
0.90
0.86
0.79
0.76
0.75
0.59
0.57
2. Izbor robe
Mnogi modeli ili tipovi su na zalihama.
0.90
0.87
0.63
3. Uslovi prodaje
Dobre kamate.
0.83
0.73
0.66
4. Objekti
Dovoljno prostora za parking.
0.75
0.69
5. Karakteristike vozila.
Poreenja sa drugim markama.
0.79
0.64
0.61
6. Nema pritiska
Nisu navalentni.
0.90
-0.48
Identifikovano je est faktora na osnovu 20 karakteristika. Ovim verovatno problem istraivanja nije
u potpunosti pokriven. Faktorska analiza ne moe da ukae na to ta nedostaje u nizu karakteristika.
Jedan od naina da se proveri pokrivenost je da se uradi viestruka regresiona analiza gde bi zavisna
varijabla bila ukupna ocena auto-dilera i da se izrauna koeficijent determinacije. Ako je on nizak
(recimo ispod 70%), moe se rei da odreene karakteristike, odnosno odreena pitanja treba dodati
u anketu.
Nekada je jedno od pitanja u anketi ponueno da se da opta ocena o posmatranoj pojavi pored
svih ostalih pojedinanih karakteristika i onda se ta varijabla takoe ukljuuje u faktorsku analizu. U
tim sluajevima esto se deava da takva varijabla nema visoko faktorsko optereenje ni kod jednog
faktora nego je podjednako rasprena na vie faktora sa malim faktorskim optereenjem.
Ponekad se deava da gotovo sve varijable imaju visoko faktorsko optereenje za prvi faktor. Taj
sluaj se javlja, na primer, kada respondenti treba da ocene veliki broj performansi nekog proizvoda
koji je za njih zapravo nov i nedovoljno poznat. Tada se deava da respondenti daju odgovore na
osnovu nekog opteg utiska. Ova pojava se naziva halo efekat i postoji vie naina da se on
izbegne. Jedno reenje je da standardizuju odgovori za svakog respondenta posebno, a drugi je
eliminisanje halo efekta uz pomo parcijalne korelacije. Vie o ovim tehnikama moe se nai u
Myers i Mullet (2003).
pronalaenju ablona unutar grupe varijabli i mala je korist od faktora koji se zasniva na jednoj
varijabli.
to se tie veliine uzorka, nije preporuljivo analizirati uzorak koji ima manje od 50 jedinica i
poeljno je da uzorak ima barem 100 jedinica. Generalno je pravilo da postoji barem pet puta vie
jedinica nego to ima varijabli u bazi, a najbolje bi bilo da je taj odnos 10:1. U sluajevima kada je
taj odnos manji od 5:1, potrebno je rezultate objanjavati sa velikom rezervom.
Vrste faktora
Postoje dve vrste faktora u faktorskoj analizi: zajedniki i specifini faktori. Zajedniki faktori su
oni ije varijacije su podeljene izmeu dve ili vie varijabli iz skupa varijabli. Specifini faktori su
oni ije su varijacije vezane za pojedinane varijable i te varijacije nisu obuhvaene zajednikim
faktorima. Skoro svaka varijabla ima makar malu koliinu specifine varijanse. Faktorska analiza
identifikuje samo zajednike faktore. Bitno je znati da specifini faktori nekad mogu biti od veeg
znaaja u nekom istraivanju od zajednikih. Specifini faktori se mogu izvui na povrinu
dodavanjem novih pitanja u anketi.
Varijable koje imaju malo zajednikog sa drugim varijablama i imaju malo faktorsko optereenje
(manje od 0,30) prema svim zajednikim faktorima nazivaju se esto nezavisnim varijablama.
esto se deava da se previdi vanost takvih varijabli i da se one iskljue iz interpretacije rezultata
to moe da bude velika greka.
V2
V3
12
Claster analiza bi zbog blizine taaka u prostoru zajedno grupisala jedinice A i B u jednu grupu a C
i D u drugu, dok bi Q faktorska analiza grupisala zajedno jedinice A i C u jednu a B i D u drugu
grupu jer se pomeraju zajedno.
gde su:
X vrednost varijable (skor faktora za varijablu) sa aritmetikom sredinom nula i varijansom jedan,
i redni broj varijable,
F faktori koji su meusobno nezavisni,
m redni broj faktora,
a faktorsko optereenje (konstanta),
e specifini faktor vezan samo za datu varijablu.
Var X i
1 ai21Var F1
ai 2 Var F 2
2
... aim
Var F m
Var ei
2
2
2
ai1 ai 2 ... aim Var ei
2
pri emu ai21 ai22 ... aim
predstavlja komunalitet varijable Xi (deo varijanse koji je povezan sa
zajednikim faktorima), a Var(ei) je specifina varijansa varijable Xi (deo varijanse koji nije
povezan sa zajednikim faktorima). Takoe je dokazano da je korelacija izmeu varijabli Xi i Xj:
r ij
Prema tome, dva faktorska skora mogu biti jako povezana ako imaju visoko optereenje za iste
faktore. Poto komunalitet ne moe da bude vei od 1, mora biti zadovoljen uslov:
1 aij
1.
2.
3.
4.
5.
6.
10
ima samo dva modaliteta (na primer, obeleje je vlasnitvo automobila, a modaliteti su ima i
nema odnosno 1 i 0).
Analitiar mora da se uveri da u korelacionoj matrici ima dovoljno visokih koeficijenata korelacije
da bi imalo smisla primeniti faktorsku analizu. Ako su svi koeficijenti niski, ili su svi jednaki (to
znai da nije mogue grupisati varijable), pitanje je da li treba raditi faktorsku analizu. Ako ne
postoji znaajan broj koeficijenata korelacije koji su vei od 0,30, onda faktorsku analizu ne treba
primenjivati.
Korelacija izmeu varijabli se moe analizirati i preko parcijalnih koeficijenata korelacije izmeu
varijabli. Parcijalna korelacija je korelacija koja je neobjanjena kada se uzmu u obzir uticaji ostalih
varijabli. Ako postoje znaajni faktori u strukturi podataka, onda bi parcijalni koeficijenti trebali biti
mali, jer se varijabla moe objasniti preko uea varijabli u faktoru. Ako su parcijalni koeficijenti
veliki, onda ne treba raditi faktorsku analizu.
Bartlett-ov test sferinosti je jo jedan nain da se analizira korelaciona matrica. Ovaj test analizira
postojanje statistike znaajnosti odnosno da li postoji korelacija barem izmeu nekih varijabli.
Treba imati u vidu da sa poveanjem uzorka Bartlett-ov test postaje sve osetljiviji na otkrivanje
korelacije.
MSA (measure of sampling adequacy) je jo jedan nain da se kvantifikuje stepen korelacije izmeu
varijabli i opravdanost faktorske analize. Indeks se kree u granicama od 0 do 1. to je MSA blii
jedinici, to je lake predvideti odreen varijablu uz pomo ostalih varijabli. MSA se posmatra prema
sledeoj skali:
preko 0,80 vrlo jaka korelacija
izmeu 0,70 i 0,80 jaka
izmeu 0,60 i 0,70 srednja
izmeu 0,50 i 0,60 slaba
ispod 0,50 neprihvatljiva.
MSA moe da se povea u sledeim sluajevima:
poveanjem veliine uzorka
porastom prosene korelacije
poveanjem broja varijabli
smanjivanjem broja faktora.
Opti MSA mora da bude iznad 0,50 pre nego to se primeni faktorska analiza. Ako opti MSA
padne ispod 0,50 onda specifine MSA vrednosti varijabli mogu da ukau na one varijable koje
treba iskljuiti iz analize.
Poto je mogue izraunati specifine MSA za svaku varijablu posebno, mogue je iskljuiti
varijablu sa najniim specifinim MSA i onda ponovo uraditi faktorsku analizu. Ovaj postupak
potrebno je ponavljati sve dok sve preostale varijable imaju MSA iznad 0,50.
11
Z2
...
Zp
b p1 X 1 b p 2 X 2 ... b pp X p
gde su vrednosti bij ajgenvektori korelacione matrice. Sledi ortogonalna transformacija za dobijanje
vrednosti varijabli. Inverzna linearna kombinacija glasi:
X1
X2
...
Xp
b1 p Z 1 b2 p Z 2 ... b pp Z p
X2
...
Xp
12
b1 p Z 1 b2 p Z 2 ... bmp Z m e p
gde je ei linearna kombinacija ostalih, izostavljenih glavnih komponenti, od Zm+1 do Zp. Sada treba
transformisati preostale glavne komponente da imaju jedininu varijansu. Za dobijanje faktorskih
jednaina potrebno je Zi podeliti sa standardnom devijacijom,
odgovarajue ajgenvrednosti u korelacionoj matrici:
b21 F 2 ...
X1
b11 F 1
X2
b12 F 1
b22 F 2 ...
bm 2 F m
b1 p F1
b2 p F 2 ...
bmp F m e p
bm1 F m e1
e2
...
Xp
gde je F i Z i
i . Iz datog se vidi da su nerotirani faktori zapravo vrednosti glavnih komponenti
poto su transformisani tako da imaju varijansu jednaku jedinici. Nerotirani faktorski model onda
glasi:
X1
X2
...
Xp
a p1 F 1 a p 2 F 2 ... a pm F m e p
b ji .
Rotacija faktora
Nakon analize glavnih komponenti, faktorska analiza poinje da rotira komponente. Cilj je da se
redefinie i pojasni znaenje svakog faktora. Postupak se svodi na preraspodelu uticaja faktora sa
prve glavne komponente na ostale, tako da je ukupna varijansa koja je objanjena preko faktora
ravnomernije rasporeena izmeu komponenti.
U koordinatnom sistemu, glavne komponente su predstavljene kao prave linije koje prolaze kroz
ishodite i izmeu varijabli koje se nalaze u vidu taaka u prostoru. Ako su varijable u jaoj
korelacionoj vezi, nalaze se blizu jedna drugoj. Prave linije (glavne komponente) prolaze kroz grupu
bliskih varijabli. Te prave linije zapravo predstavljaju faktore koji se trae. Prave linije komponenti
su meusobno pod uglom od 90 stepeni jer komponente nisu meusobno zavisne.
Najpoznatija rotacija je varimax rotacija koja maksimizira sumu varijansi kvadrata faktorskih
optereenja.
Nakon varimax rotacije, ili neke druge, faktorski model ima oblik:
X1
X2
g 21 F1 * g 22 F 2 * ... g 2m F m * e2
13
...
Xp
g p1 F1 * g p 2 F 2 * ... g pm F m * e p
1.Prijatan ukus
0.84
-0.001
-0.29
0.14
-0.62
0.38
0.36
0.34
0.76
2.Iskriav ukus
0.93
-0.02
-0.02
-0.1
0.48
0.43
-0.53
0.38
0.84
3.Zreo ukus
0.76
-0.11
-0.28
0.1
-0.70
0.26
0.38
0.36
0.83
14
4.Bogat ukus
0.91
0.16
-0.001
-0.11
0.45
-0.53
0.54
0.29
0.86
5.Zadovoljavajui ukus
0.78
-0.002
-0.20
0.21
-0.74
0.38
0.30
0.32
0.88
6.iv ukus
0.93
0.12
-0.02
-0.16
0.50
0.43
-0.59
0.35
0.91
0.90
-0.04
0.04
-0.21
0.42
0.38
-0.64
0.37
0.84
0.78
0.35
0.11
0.16
0.31
-0.74
0.27
0.22
0.78
0.85
-0.28
0.24
-0.09
0.23
0.24
0.52
-0.62
0.81
10.Topao ukus
0.86
0.25
0.22
0.17
0.28
-0.75
0.33
0.39
0.86
0.89
0.11
-0.05
0.10
0.52
-0.55
0.36
0.36
0.79
12.Sladak ukus
0.86
-0.29
0.04
0.27
0.43
0.28
0.16
-0.67
0.77
13.Sve ukus
0.84
-0.27
0.19
0.12
0.33
0.32
0.36
-0.70
0.81
14.Ukupan utisak
0.92
0.04
0.08
-0.23
0.38
0.43
-0.65
0.34
0.85
Objanjena varijansa u %
75.2
2.4
3.1
2.5
23.6
20.2
21.3
19.0
Kumulativno varijansa u %
75.2
77.6
80.7
83.2
23.6
43.8
65.1
84.1
Pod nazivom varimaks rotacija u tabeli se nalaze faktorska optereenja za svaku varijablu posle
rotacije. Sada je prikladnije koristiti termin faktor umesto komponenta. Uoava se da su visoka
optereenja kod prve komponente pre rotacije uglavnom nestala kod prvog faktora. Sada je lake
utvrditi ta je zapravo faktor 1 i ta nije. Visoka optereenja, ako su pozitivna, govore ta faktor
jeste, a negativna ta nije.
Procenat ukupne varijacije (objanjena varijansa) se dramatino menja. Pre rotacije, prva
komponenta je objanjavala 75,2% od ukupne varijacije, sledea 2,4% itd. Nakon rotacije
postignuta je ravnomernost u objanjenoj varijansi izmeu faktora (od 23,6% do 19,0%) to govori
o redistribuciji faktorskog optereenja.
Negativna optereenja su se pojavila kod sva etiri faktora posle rotacije. Ona ukazuju na to to
faktor ne predstavlja. Zbog naina na koji se rotacija izvodi, faktoru se dodeljuje ime na osnovu
najveeg optereenja i to bez obzira na predznak. Najvee faktorsko optereenje ukazuje na
varijable koje imaju najjau korelaciju sa datim faktorom.
Poslednja kolona tabele pokazuje komunalitet svake varijable. Komunalitet je proporcija varijanse
varijable koja je zajednika sa svim ostalim varijablama zajedno. Izraunava se tako to se saberu
kvadrati faktorskih optereenja varijable. Na primer, za varijablu Prijatan ukus, komunalitet
iznosi:
(0,62)2+0,382+0,362+0,322=0,76.
15
16
Faktor 2
+
Faktor 3
90
90
90
Faktor 1
Faktor 2
+ Faktor 3
+
Faktor 1
Razliiti programi pruaju razliite opcije za kosu rotaciju. Na primer, analitiar moe da odabere
ciljnu varijablu i program e smestiti ose kroz nju. Ova varijabla oko sebe okuplja ostale bliske
varijable dajui im visoko faktorsko optereenje. Postoji i takozvana Prokrustova rotacija kod
koje se prvo izvede ortogonalna rotacija, a zatim se ose rotiraju dok osa ne proe kroz bilo koju
varijablu koja ima najvee faktorsko optereenje za svaki ortogonalni faktor.
Kosa rotacija moe da prui jasnije razumevanje strukture faktora. Ukoliko ortogonalna rotacija nije
dovoljno ravnomerno rasporedila faktorska optereenja na faktore, moe se pribei kosoj rotaciji
koja e to efikasnije izvesti.
17
Nedostatak kose rotacije je taj to se izmeu faktora javlja zavisnost (kolinearnost) pa se dobijeni
rezultati ne mogu kvalitetno upotrebiti u viestrukoj regresionoj analizi. Ipak kosa rotacija nee
imati uticaja na prognostiku mo regresionog modela. Ukoliko se za regresionu analizu koriste
ortogonalni faktori, onda je problem multikolinearnosti potpuno reen. to je vei broj ortogonalnih
varijabli, regresioni model je efikasniji.
Poto rotirani faktor u kosoj rotaciji vie nisu pod uglom od 90 stepeni, oni se mogu tretirati kao
nove originalne varijable na kojima moe da se uradi drugostepena faktorska analiza.
Metod rotacije koji se najee koristi je takozvana varimax rotacija. Ona se bazira na pretpostavci
da razumljivost datog faktora moe da se izmeri varijansom faktorskih optereenja. Ako je ta
varijansa velika onda vrednosti faktorskih optereenja tee da budu ili blizu nule ili blizu jedinice.
Varimax rotacija maksimizira sumu tih varijasni za sve faktore. Ova rotacija moe da se radi bez ili
sa prethodnom normalizacijom faktorskih optereenja (Kaiser normalizacija).
Kriterijumi za odreivanje broja faktora
U odluivanju koliko e faktora biti uzeto u obzir, analitiar mora da kombinuje konceptualna
znanja (Koliko faktora treba da bude u datoj strukturi?) sa empirijskim dokazima (Koji je racionalan
broj faktora koji se mogu objasniti?). Analitiar polazi od unapred postavljenih kriterijuma, kao to
je opti broj faktora plus opti prag praktine znaajnosti (procenat objanjenosti varijanse koji je
unapred postavljen). Ovi kriterijumi se kombinuju sa empirijskim rezultatima. Tehnika za tano
odreivanje broja faktora nije razvijena.
Najei metod koji se primenjuje jeste kriterijum latentnog korena (latent root criterion). Prema
ovom kriterijumu u obzir se uzimaju samo oni faktori koji imaju ajgenvrednost veu od 1. Faktori
koji imaju manju ajgenvrednost od 1 se smatraju nebitnim jer objanjavaju manje varijabiliteta nego
to ga objanjavaju same varijable. Ovaj metod je najbolji kada je broj varijabli izmeu 20 i 50. Ako
ima manje od 20 varijabli, postoji tendencija da se izabere premalo faktora, a ako je broj varijabli
vei od 50, tendencija je da se izabere previe faktora.
A priori kriterijum polazi od unapred definisanog broj faktora koji se eli i raunaru se prosto da
instrukcija da se dati broj faktora izvue.
Kriterijum procenta objanjene ukupne varijanse. Polazi se od toga da se odredi procenat ukupne
varijanse za koji se eli da bude objanjen i kada se taj procenat dostigne, tada se utvrdi koliko je
faktora potrebno da bi se to dostiglo. Ne postoji vrsto pravilo koji je to procenat objanjene ukupne
varijanse dovoljan, nego se ide od sluaja do sluaja. U prirodnim naukama obino se zahteva vei
procenat (barem 95%), dok kod drutvenih nauka, gde je informacija manje precizna, esto se
analitiari zadovoljavaju i sa 60% od ukupno objanjene ukupne varijanse.
Scree test je grafiki metod za odreivanje broja komponenti za rotaciju. Na linijskom dijagramu se
predstavljaju ajgenvrednosti komponenti poevi od najvee. Trai se mesto na kojem linija naglo
menja pravac i do te take se broje komponente koje e biti ukljuene u analizu. Na slici je prikazan
jedan takav grafikon gde se uoava nagli prelom linije kod druge komponente, to znai da e za
rotaciju biti izdvojena samo dva faktora koji zajedno objanjavaju 82,95% varijacija.
18
Eigenvalue
2.5
2.0
1.5
1.0
10.63%
7.73%
0.5
6.03%
3.29%
0.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
6.0
Eigenvalue number
19
Ako su optereenja u intervalu od 0,30 do 0,40 onda oni ispunjavaju minimalne zahteve
za uee u interpretaciji date strukture podataka.
Optereenja preko 0,50 se smatraju praktino signifikantnim.
Optereenja preko 0,70 se smatraju indikativnim za jednu dobro definisanu strukturu i oni
su pravi cilj faktorske analize.
Pored navedene skale, postoji i kriterijum za statistiku znaajnost faktorskih optereenja uz
verovatnou 95%, odnosno koliko treba da bude velik uzorak da bi se odreeni nivo faktorskog
optereenja smatrao znaajnim (tabela).
Tabela: Identifikacija statistiki znaajnih faktorskih optereenja na osnovu veliine uzorka
Faktorsko optereenje
0,30
350
0,35
250
0,40
200
0,45
150
0,50
120
0,55
100
0,60
85
0,65
70
0,70
60
0,75
50
20
varijable mora da bude uzeta u obzir. Prema tome, ona varijabla koja ima komunalitet manji od 0,50
nema dovoljno dobro objanjenje u modelu.
Kada su istraena faktorska optereenja i komunalitet, mogu da se jave sledei problemi:
varijabla nema znaajno faktorsko optereenje
komunalitet varijable je nizak, bez obzira to je faktorsko optereenje znaajno
varijabla ima unakrsno faktorsko optereenje, odnosno ista varijabla ima znaajna
faktorska optereenja za vie faktora (cross-loadings).
Potrebno je preduzeti odreene mere, koje mogu da se kombinuju (Hair, Black, Babin, & Anderson,
2010):
Ignorisati problematine varijable i interpretirati faktore takve kakvi su. Ovo je opravdano
ako je cilj redukcija podataka, ali mora se imati na umu da su odreene varijable loe
reprezentovane u faktorskoj strukturi.
Razmisliti o eventualnom brisanju varijable iz analize, to zavisi od opteg doprinosa u
celokupnom istraivanju i u komunalitetu date varijable. Nakon toga se izrauje novo
faktorsko reenje bez te varijable. Brisanje variable se esto radi i u sluaju unakrsnog
faktorskog optereenja.
Uraditi neku drugu vrstu rotacije, moda i kosu rotaciju ako je do tada koriena samo
ortogonalna rotacija.
Smanjiti ili poveati broj faktora da bi se videlo da li e onda problematina varijabla biti
bolje reprezentovana.
Promena vrste faktorske analize (analiza glavnih komponenti vs. faktorska analiza u uem
smislu) da bi se videlo da li e se znaajnije promeniti faktorska struktura.
Interpretacija rotiranih faktora
Kao finalna faza istraiva posmatra faktorska optereenja nakon rotacije (ako je ona bila uopte
potrebna) i eventualnog redefinisanja modela. Da bi se dodelili adekvantni nazivi faktorima
posmatraju se faktorska opereenja za svaku varijablu sa ciljem da se odredi njena uloga i doprinos
u definisanje strukture faktora.
Predznaci faktorskih optereenjsa se interpretiraju kao kod bilo kog drugog koeficijenta korelacije,
to znai da su kod pozitivnih faktorskih optereenja faktor i varijabla pozitivno povezani a u
suprotnom sluaju negativno. Kod ortogonalnih reenja faktori su nezavisni to znai da se
negativno ili pozitivno faktorsko optereenje kod jednog faktora ne povezuje ni na koji nain sa
drugim faktorima.
U primeru sa vonim sokovima, sledei korak je da se daju imena faktorima. Imena faktora uvek
zavise od najveeg i najmanjeg (negativnog) faktorskog optereenja. Na primer, u tabeli, pod
varimaks rotacijom, za faktor 1, najvea optereenja su za Zadovoljavajui ukus (-0,74), Zreo
ukus (-0,70) i Prijatan ukus (-0,63), svi sa negativnim optereenjem. To zapravo znai da ako je
odreena vrsta vonog soka visoko ocenjena po jednoj od ovih osobina, verovatno e biti visoko
ocenjena i po ostalim osobinama i obrnuto. Pored toga, najvea pozitivna optereenja kod faktora 1
su ist i jasan ukus (0,52), iv ukus (0,50), Iskriav ukus (0,48) i Bogat ukus (0,45). To
21
zapravo znai da voni sok koja ima ist, iv, iskriav i bogat ukus obino nema zadovoljavajui,
zreo i prijatan ukus.
Istraiva je za prvi faktor izabrao ime Zadovoljavajui ukus na osnovu najveeg, negativnog
faktorskog optereenja. Faktor 2 je dobio ime Toplina ukusa, faktor 3 Ukus pravog voa i
faktor 4 Sveina.
Primer: Zaposlenost u evropskim zemljama
Faktorska analiza je primenjena na podacima o zaposlenosti u evropskim zemljama. Korelaciona
matrica kao i ajgenvrednosti i ajgenvektori za ovu seriju su izraunati kod analize glavnih
komponenti. Poto ima ukupno etiri ajgenvrednosti vee od jedan, primenuje se grubo pravilo da
bude i etiri faktora u modelu.
Izraunata su faktorska optereenja za etiri faktora i devet varijabli:
(0,93)
(0,85)
X2
X3
(0,91)
X4
(0,46)
X5
(0,92)
X6
(0,79)
X7
(0,87)
X8
(0,88)
X9
(0,87)
0,90
0,03
0,34
0,02
0,93
Komunaliteti su veliki za sve varijable osim za X4 (PS, proizvodnja elektrine energije, gasa i
vode). To znai da je vei deo varijabiliteta podataka osam varijabli obuhvaeno zajednikim
faktorima.
Faktorska optereenja koja su vea od 0,50, bez obzira na predznak, predstavljaju velika i umerena
optereenja koja pokazuju kako je varijabla povezana sa faktorom. Oigledno je da je varijablia X 1
gotovo u potpunosti odreena faktorom 1, X2 je meavina faktora 2 i faktora 3, X3 je odreen
faktorima 1 i 2 itd. Nepovoljno je to su pet od devet varijabli jako povezane sa dva faktora.
Rotacija faktora e moda pruiti bolje reenje.
Primenjena je varimax rotacija sa Kaiser-ovom normalizacijom. Dobijen je sledei model:
X1
X2
22
X3
X4
X5
X6
X7
X8
X9
Komunalitet je nepromenjen a faktori su i dalje nepovezani. Reenje je neto bolje jer je samo
varijabla X9 povezana neto vie sa dva faktora.
U sledeem koraku potrebno je dati nazive faktorima, to podrazumeva odreeni stepen
inovativnosti.
Faktor 1 ima visoko pozitivno optereenje za varijablu X1 (AGR poljoprivreda, umarstvo i
ribarstvo), gde je optereenje 0,85 i visoka negativna optereenja za varijable X 8 (SPS drutvene i
line usluge), sa optereenjem 0,91 i X9 (TC - transport i komunikacije), sa optereenjem 0,73.
To znai da se meri stepen u kojem su ljudi zaposleni u poljoprivredi pre nego u dravnoj upravi i
komunikacijama. Naziv faktora 1 je zbog toga ruralna industrija pre nego drutveni servis i
komunikacije.
Faktor 2 ima negativno optereenje za X7 (FIN finansije), i to 0,93 i dovoljno visoko pozitivno
optereenje za X9 (TC - transport i komunikacije) od 0,57. Usled toga je dobio naziv nedostatak
finansija.
Faktor 3 ima visoko pozitivno optereenje za X2 (MIN rudarstvo) od 0,86 i negativna optereenja
za X3 (MAN preraivaka industrija) od 0,89 i X4 (PS - Proizvodnja elektrine energije, gasa i
vode) od 0,64. Naziv ovog faktora je rudarstvo pre nego proizvodnja.
Faktor 4 ima visoka pozitivna optereenja za varijable X 5 (CON graevinarstvo) od 0,95 i X6
(SER usluge) od 0,65. Logino je da naziv bude graevinarstvo i usluge.
Na osnovu jednaina izraunavaju se faktorski skorovi za svaku varijablu pojedinano. Rezultati su
dati u tabeli.
Tabela: Rotirani skorovi faktora
Zemlja
Faktor 1
Faktor 2
Faktor 3
Faktor 4
Belgium
0.97
0.56
0.10
0.47
Denmark
0.89
0.47
0.03
0.67
France
0.56
0.78
0.15
0.25
Germany
-0.05
0.57
0.47
-0.58
23
Ireland
-0.48
-0.19
0.23
-0.02
Greece
-0.28
0.60
0.36
-0.03
Italy
-0.25
0.13
-0.17
-1.00
Luxembourg
0.46
0.36
-0.02
-0.92
Netherlands
1.36
1.56
0.03
2.08
Portugal
-0.66
0.45
0.37
-0.64
Spain
-0.24
0.11
0.09
-0.93
U.K.
0.50
1.14
0.35
0.04
Austria
-0.18
-0.05
0.71
-0.56
Finland
0.78
0.20
0.21
0.52
Iceland
0.18
0.04
0.06
-0.46
Norway
1.36
0.17
-0.20
0.41
Sweden
1.20
0.52
-0.04
0.74
Switzerland
-0.12
0.67
-0.01
-0.65
Albania
-3.16
1.82
-1.76
1.79
Bulgaria
-0.47
-1.56
0.57
0.65
Czech/Slovak Rep.
0.26
-1.45
-3.12
-0.44
Hungary
1.05
-1.70
-2.82
0.14
Poland
-0.97
-0.71
0.37
0.42
Romania
-1.11
-1.73
1.69
0.81
USSR (form.)
-0.08
-2.09
0.11
-0.14
Yugoslavia (form.)
-0.13
-1.48
1.70
-0.17
Cyprus
-0.46
0.32
-0.03
-1.08
Gibraltar
0.05
1.05
-0.08
-3.26
Malta
1.18
-0.49
0.79
1.31
Turkey
-2.15
-0.07
-0.15
0.56
Na osnovu analize faktorskih skorova uoava se da je vrednost faktora 1 visoka u Albaniji i Turskoj,
to znai da je tamo akcent na ruralnoj industriji pre nego na drutvenom servisu i komunikacijama.
Bugarska, Maarska, Rumunija i bivi SSSR imaju malo zaposlenih u finansijama, dok Holandija i
Albanija imaju velik broj zaposlen u toj oblasti. Ovo je uoljivo na osnovu faktora 2. Faktor 3
stavlja u kontrast Albaniju i bivu ehoslovaku sa jedne strane i Rumuniju i bivu Jugoslaviju sa
druge strane zbog broja zaposlenih u rudarstvu. Faktor 4 stavlja u kontrast Gibraltar, sa velikim
brojem zaposlenih u graevinarstvu i uslugama, naspram Holandije i Albanije gde je obrnut sluaj.
Moda bi bilo racionalno i izvodljivo nastaviti analizu sa manjim brojem faktora i drugaijim
metodima faktorske analize. Razliiti softverski paketi mogu da daju ajgenvektore sa suprotnim
predznacima. Takoe, obrnuti predznaci mogu da se pojave prilikom rotacije faktora, tako da
faktorska optereenja idu u suprotnom smeru od onog koji je naveden u ovom primeru. U takvom
sluaju potrebno je obrnuti i interpretaciju.
24
Faktor skorovi
Jednom kada je broj originalnih varijabli smanjen na odreeni broj faktora, mogue je izraunati
faktor skorove. Oni zapravo predstavljaju rezultate za svaku jedinicu posmatranja po pojedinim
faktorima. Skup faktor skorova ini novi, redukovani set podataka. Oni predstavljaju visinu
individualnih skorova koji su povezani sa visinom faktorskog optereenja. Odnosno, visoka
vrednost varijable u pogledu faktorskog optereenja e rezultovati i visokim faktor skorom.
U sluaju sa vonim sokovima, umesto 14 varijabli sada imamo 4 varijable koje na najbolji nain
odslikavaju stav ispitanika prema vonim sokovima.
Postoje sluajevi kada faktor skorove nije poeljno izraunavati:
Kada struktura faktora nije dovoljno jasna i kada se neki faktori ne mogu dobro
interpretirati.
Kada veliki broj varijabli ima mali komunalitet, to znai malu varijaciju zajednikih
faktora.
Kada je potrebna velika preciznost u analizi. Tada je bolje primeniti neku od
multivarijacionih tehnika zavisnosti, ako je mogue.
25
Zamena originalnog seta varijabli sa potpuno novim, redukovanim setom varijabli koje su
kreirane uz pomo sumirane skale ili faktor skorova.
O sumiranim skalama vie informacija moe da se nae u Hair et al. (2010).
Bilo koja od pomenutih opcija kreira nove varijable koje bi, na primer, mogle da se koriste kao
nezavisne varijable u diskriminacionoj analizi, kao zavisne varijable u multivarijacionoj analizi
varijanse ili kao klaster varijable u klaster analizi. U svakom sluaju, ako je cilj to vea
jednostavnost, onda se favorizuje reenje sa surogat varijablama, ako se eli replikacija u drugim
studijama, favorizuje se sumirana skala, a ako je akcenat na ortogonalnosti, onda se biraju faktor
skorovi. Sa empirijskog stanovita postoji velika slinost izmeu sumirane skale i faktor skorova.
Ipak, vrlo esto su rezultati faktorske analize sami sebi cilj, kada je dovoljno da se identifikuje
logika kombinacija varijabli i bolje razumevanje njihovog meusobnog odnosa.
Pokretanje analize:
StatisticsMultivariate Exploratory Technique Factor Analysis
Dobija se poetni meni za analizu.
Definisanje varijabli:
QuickVariables
Otvara se prozor sa spiskom varijabli od kojih treba odabrati one koje e biti uvrtene u analizu.
OK
Dobija se drugi glavni meni sa opcijama Quick, Advanced i Descriptives
Odreivanje broja faktora i minimalne ajgenvrednosti:
26
Rotacija podataka:
QuickOK Quick (ili Loadings) Factor rotation (izabrati vrstu rotacije iz padajueg menija)
Scree metod odreivanja broja faktora:
QuickOKExplained varianceScree plot
Izraunavanje komunaliteta:
QuickOKExplained varianceCommunalities
27
Literatura
Hair, J., Black, W., Babin, B., & Anderson, R. (2010). Multivariate Data Analysis - A Global
Perspective. New Jersey: Pearsib.
Manly, B. F. (2005). Multivariate Statistical Methods - A primer (3rd Edition izd.). New York:
Chapman & Hall/CRC.
Myers, J. H., & Mullet, G. M. (2003). Managerial Applications of Multivariate Analysis in
Marketing. Chicago: American Marketing Association.