PMM Faktorska Analiza Predavanje

You might also like

Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 35

Sveučilište u Zagrebu

Filozofski fakultet
Odsjek za psihologiju

Primjena multivarijatnih metoda

Tema
FAKTORSKA ANALIZA*

* Ova prezentacija predstavlja radni materijal


Faktorska analiza je skup matematičko-statističkih
postupaka koji omogućuju da se u većem broju
varijabli, među kojima postoji povezanost, utvrdi
manji broj temeljnih varijabli koje objašnjavaju takvu
međusobnu povezanost. Te temeljne varijable nazivaju
se faktori.

Varijable koje promatramo nazivaju se manifestne


varijable, a faktori koje utvrđujemo u postupku
faktorske analize nazivaju se latentne varijable.
Sadržaj teme:
 
1. Cilj faktorske analize
 2. Rekapitulacija osnovnih pojmova i operacija
 3. Problemi u primjeni faktorske analize
 4. Izvođenje faktorske analize u programu SPSS
 5. Interpretacija rezultata
I. REPETITORIJ OSNOVNIH POJMOVA:
 
1. Definicija i ciljevi FA
2. Parsimonija i interpretabilnost
3. Manifestne i latentne varijable
4. Korelacije među manifestnim varijablama kao
indikacija zajedničkih faktora
5. Multifaktorski model strukture manifestnih
varijabli (linearni efekti faktora, ortogonalnost
latentnih varijabli, jednadžba specifikacije
manifestne varijable = višestruka regresijska
jednadžba)
6. Odnosi između manifestnih i latentnih varijabli
(faktorska zasićenja ili saturacije=regresijski
koeficijenti faktora za varijable kao kriterije)
7. Dijelovi varijance manifestnih varijabli u FA
8. Objašnjenje manifestnih varijabli pomoću faktora,
rezidualne vrijednosti
9. Objašnjenje korelacija među manifestnim
varijablama pomoću njihovih saturacija s faktorima
(rezidualne korelacije)
10. Varijanca skupa varijabli objašnjena pomoću
faktora.
11. Geometrijski prikaz odnosa manifestnih varijabli i
faktora
12. Neodređenost multifaktorskih rješenja (jednostavna
struktura, rotacije)
13. Psihologijska interpretacija faktora
II. PROBLEMI U PRIMJENI FAKTORSKE
ANALIZE
 
1. Prikladnost podataka za primjenu FA
- kvantitativne varijable i njihove distribucije
- Bartlettov test (R=I)
- KMO i MSA
 2. Komponentni model i model zajedničkih faktora
- metode za ekstrakciju faktora
- problem određivanja komunaliteta
3. Određivanje broja značajnih faktora
 4. Postizanje jednostavne strukture
 5. Matrice faktorskog sklopa (obrasca) i faktorske
strukture
 6. Izračunavanje i procjena faktorskih rezultata
 7. Kosokutne rotacije, korelacije među faktorima i
faktori viših redova
8. Evaluacija primjene faktorske analize (objašnjena
varijanca, rezidualni r, interpretabilnost)
U prijašnjim fazama faktorska analiza upotrebljavala se
isključivo kao eksploratorna strategija. Prije 1970. termin
FA koristio se bez riječi eksploratorna. Ovaj izraz uveden
je kasnije kako bi se razlikovala od konfirmatorne FA
uvedne približno 1969. radovima Joreskoga.

Cilj je EFA da utvrdi temeljne faktore ili izvore varijacija


i kovarijacija među promatranim varijablama. Kod CFA
situacija je drugačija. FA se pojavljuje kao objektivan test
određenog strukturalnog modela ili teorije.
Osnivač je FA engleski psiholog C. Spearman koji je
ujedno postavio i prvu empirijsku teoriju inteligencije.
Zj = fjG + Sj

Spearmanova psihološka teorija o dva faktora kasnije je


zamijenjena teorijama o više faktora. Tako je nastala
multifaktorska analiza. Po toj koncepciji u svakoj manifestnoj
ili promatranoj intelektualnoj aktivnosti sudjeluje nekoliko
faktora ili latentnih varijabli. Prvi je takvu koncepciju iznio
Garnett (1919), a termin multifaktorska analiza prvi je
upotrijebio Thurstone (1931).
Zj = fjA + gjB + hjC + ... + Sj
Engleski psiholozi Burt (1938) i Vernon (1961) stvaraju
psihološke modele prema kojima postoji hijerarhija
pojedinih faktora inteligencije. Na vrhu je G faktor koji
participira u svim intelektualnim aktivnostima, ispod
njega su grupni faktori višeg reda, a zatim grupni faktori
nižeg reda itd.
Glavni ciljevi EFA
1. Odrediti broj zajedničkih faktora koji uvjetuju
variranje skupa manifestnih varijabli
2. Odrediti jačinu povezanosti između svakog faktora i
svake manifestne varijable
Načelno postoje dvije strategije korištenja faktorske
analize. Jedna strategija naziva se eksploratorna
faktorska analiza, a druga konfirmatorna faktorska
analiza.
Cilj je eksploratorne faktorske analize da utvrdi temeljne
faktore ili izvore varijacija i kovarijacija među
promatranim varijablama. Cilj je ovakve strategije
faktorska deskripcija određenog područja istraživanja.
Pri konfirmatornim strategijama faktorske analize
istraživač polazi od unaprijed formuliranog modela,
hipoteze ili teorije o strukturi temeljnih izvora varijacija i
kovarijacija među manifestnim varijablama. Faktorska
analiza u ovom slučaju predstavlja test pretpostavljene
strukture, odnosno omogućuje testiranje strukturalnih
teorija.
Treba naglasiti da se oba pristupa mogu dopunjavati, te
da formalno gledajući oba pristupa omogućuju testiranje
teorijskih modela.
1. MULTIFAKTORSKI MODEL STRUKTURE BRUTO
REZULTATA
U teoriji pouzdanosti bruto rezultat je strukturiran kao
linearna kombinacija:
X=T+E
bruto rezultat = pravi rezultat + pogreška
U teoriji valjanosti pravi rezultat se dalje rastavlja.
T=H+S
Jednadžba bruto-rezultata može se u skladu s izrečenim
napisati:
X=H+S+E
Nadalje u teoriji valjanosti se pretpostavlja da je H
složenica linearnog tipa. Razumno je pretpostaviti da se
nekim mjernim postupkom može pobuditi određeni broj
odijeljenih psiholoških osobina. Ako pretpostavimo da su
njihovi efekti linearno kombinirani dobivamo izraz:
H = H1 + H2 + ... + Hk
tako da se jednadžba bruto rezultata može pisati:
X = H1 + H2 + ... + Hk + S + E
Ukoliko pretpostavimo da su sve varijable u prethodnoj jednadžbi
standardizirane i neka se u svakom rezultatu zx nalazi izvjesna komponenta
svih gore opisanih elemenata, a količina njihova prisustva neka je označena
različitim koeficijentima, dobijamo jednadžbu specifikacije bruto rezultata:

zx = 1zh1 + 2zh2 + ... + kzhk + szs + eze

Ponderi  predstavljaju zasićenja ili saturacije ili opterećenja.

Pretpostavimo u ovom trenutku da su zajednički faktori h1, h2, ..., hk


međusobno nezavisni. Tada je varijancu bruto rezultata moguće
dekomponirati u terminima varijanci članica gornje linearne kombinacije (sve
su kovarijance nulte):

Vt(z) = 1 = h12 + h22 + ... + hk2 + s2 + e2


Posljednje jednadžbe predstavljaju bit multifaktorske teorije strukture bruto-rezultata
L.L Thurstone-a, a pretposljednji izraz generalizirani linearni model.
1. KOMUNALITET je onaj dio totalne varijance koji je uvjetovan
zajedničkim faktorima, tj. onaj dio varijance koji varijabla dijeli s drugim
varijablama.

h2 = h12 + h22 + ... + hk2

U terminima komunaliteta varijanca bruto rezultata može biti izražena kao:

Vt(z) = 1 = h2 + s2 + e2

U ovom trenutku cilj FA se može reformulirati kao nastojanje da se odredi broj


i veličina komponenata komunaliteta neke varijable. Budući da su te
komponente očito proporcije totalne varijance, možemo ih shvatiti kao
koeficijente determinacije varijable i faktora, pa je dakle cilj faktorske analize
nalaženje korelacije između varijabli i faktora.
2. SPECIFICITET je onaj dio varijance bruto-rezultata koji je uvjetovan stabilnim
faktorima svojstvenim samo toj varijabli.

s2 = 1- (h2 + e2)

3. UNIKVITET je onaj dio ukupne varijance koji jedinstven za datu varijablu, te


nije objašnjiv na osnovi preostalih varijabli. Predstavlja zbroj varijanci specificiteta i
pogreške.

u2 = s2 + e2 = 1- h2

Koeficijent pouzdanosti, definiran kao proporcija prave varijance u varijanci bruto-


rezultata, u terminima fundamentalnih pojmova FA može biti izražen kao:

rxx = 1 - e2 = h2 + s2

stoga se varijanca komunaliteta h2 može razmatrati kao donja granica pouzdanosti.


Prikaz različitih faktorskih struktura pomoću dijagrama puta

a) jedan zajednički faktor i više manifestnih varijabli

d1
U1
V1
b1

b2
d2 U2
V2
F1
b3 d3
U3
V3
b4
d4
V4 U4

bi - standardizirani regresijski koeficijenti ili koeficijenti puta ili faktorske


saturacije

V1 = b1F1 + d1U1

Dijagram implicira da je korelacija F,U=0, te da je Ui,Uj=0


b) dva ortogonalna zajednička faktora i više manifestnih varijabli
d1 U1
V1
b11
b12
b21
d2 U2
V2
F1
b31 b22 d3
U3
V3
b41
b32
b51 d4
b42 V4 U4
F2
b52 d5
V5 U5

V1 = b11F1 + b12F2 + d1U1


V2 = b21F1 + b22F2 + d2U2

Dekompozicija varijance za Vi:

V(Vi) = bi12 + bi22 + di2


d) dva kosokutna zajednička faktora i više manifestnih varijabli
d1 U1
V1
b11
b12
b21
d2 U2
V2
F1
b31 b22 d3
U3
V3
b41
b32
b51 d4
b42 V4 U4
F2
b52 d5
V5 U5

r(F1,V1) = b11 + b12 r(F1,F2)


2.1. OSNOVNE PRETPOSTAVKE ZA
PROVOĐENJE FAKTORSKE ANALIZE

Istraživački problemi na koje FA može dati


odgovor

Slučajevi kada FA nije dobar izbor za analizu podataka


2.2. PODOBNOST KORELACIJSKE
MATRICE ZA FAKTORIZACIJU

Prije provođenja FA potrebno je provjeriti podobnost korelacijske matrice za


faktorizaciju.
Bartlettov test sfericiteta koristiti se za testiranje hipoteze da je korelacijska
matrica identična matrici identiteta (čije su izvandijagonalne vrijednosti nula, a
na dijagonali su jedinice). Test zahtijeva da su podaci uzorak iz multivarijatne
normalne populacije. Što je veća dobivena vrijednost hi-kvadrata to je manja
vjerojatnost da je opažena korelacijska matrica jednaka matrici identiteta. Ako je
dobiveni p veliki prihvaćamo hipotezu da se matrica ne razlikuje značajno od
matrice identiteta i u tom slučaju treba razmotriti opravdanost FA.

2 = - (N-1 - (2k+5)/6) loge |R|


2.3. PODOBNOST KORELACIJSKE
MATRICE ZA FAKTORIZACIJU

- Kaiser-Meyer-Olkin (KMO - measure of sampling


adequacy) koeficijent mjera je podobnosti korelacijske
matrice za faktorizaciju, a njegova logika jest da u omjer
dovede sumu opaženih i parcijalnih korelacija u matrici.

KMO 
  r 2
ij

 r   a 2
ij
2
ij

ij

Kaiser (1974) navodi da je vrijednost iznad 0,9 izvrsna,


između 0,5 i 0,6 tek prihvatljiva, a ispod 0,5 neprihvatljiva.
2.3. PODOBNOST KORELACIJSKE
MATRICE ZA FAKTORIZACIJU

MSA (measure of sampling adequacy) - mjera je podobnosti svake pojedine


varijable za faktorizaciju, te ima u osnovi istu logiku kao i KMO koeficijent,
osim što u omjer dovodi sumu korelacija jedne varijable sa svim drugim
varijablama i parcijalne korelacije jedne varijable sa svim preostalim.

Varijable koje imaju niske vrijednosti MSA bilo bi poželjno izbaciti iz FA,
budući da njihov varijabilitet nije objašnjiv skupom preostalih varijabli .

MSA 
 ij
r 2

 ij  ij
r 2
 a 2

ji
2.3. UTJECAJ KARAKTERISTIKA
VARIJABLI: FAKTORIZACIJA ČESTICA

Literatura ukazuje na moguće probleme vezane uz faktorizaciju čestica.


(Bernstein, Teng, 1989.)

Korelacija dvije čestice bit će uvjetovana njihovim sadržajem ali i oblikom


njihovih distribucija. Može se demonstrirati kako razlika u distribucijama utječe
na korelaciju dva inače sadržajno slična zadatka.
Ovaj efekt poznat je pod nazivom «težinski faktor» (Carrol, 1945; Gorsuch,
1983).
2.4. KRITERIJI ZADRŽAVANJA
FAKTORA:

1. Guttman i Kaiser (K1)


Guttman, 1954
Kaiser, 1960
Komponenta bi trebala objašnjavati toliko varijance
koliko i pojedina manifestna varijabla
2.4. KRITERIJI ZADRŽAVANJA
FAKTORA:

2. Cattelov scree test

Cattell (1966) predlaže scree test.


Ovaj test obično sugerira manje faktora nego G-K kriterij
kada je prosječna korelacija mala i broj varijabli velik.
Primjedba je subjektivnost.
2.4. KRITERIJI ZADRŽAVANJA
FAKTORA:

3. Interpretabilnost

4. A priori odluke na osnovi teorije

5. Kombinacija više kriterija


2.4. KRITERIJI ZADRŽAVANJA
FAKTORA:

6. Paralelne analize
sugerirali Humprey i Ilgen (1969)
2.4. KRITERIJI ZADRŽAVANJA
FAKTORA:

7. Postotak objašnjene varijance


- obično daje prevelik broj faktora
- ovisi o prosječnoj korelaciji u skupu podataka

8. Bartlettovi testovi značajnosti (1950, 1954)


hi kvadrat test koji testira hipotezu da su preostali kk
jednaki ili da je rezidualna korelacijska matrica različita
od nulte.
često vodi zadržavanju trivijalnih faktora
2.5. ROTACIJA FAKTORA

- Svrha rotacije
- Thurstoneova načela jednostavne strukture
- Ortogonalne i kosokutne rotacije

Varimax – Minimalizira broj varijabli koje imaju visoke


saturacije s pojedinim faktorom
Olakšava interpretaciju faktora.

You might also like