Professional Documents
Culture Documents
Fajgelj 2008
Fajgelj 2008
Fajgelj 2008
2
KAKAOBEJZ: MAKRO ZA AJTEM ANALIZU DIHOTOMNO
SKOROVANIH AJTEMA TEORIJA AJTEMSKOG ODGOVORA
1
Stanislav Fajgelj
2
,
Fakultet za pravne i poslovne studije, Novi Sad
Bojan Janii
Odsek za psihologiju, Filozofski fakultet, Novi Sad
U radu je prikazan KakaoBejz, makro iz serije Kakao, koja je namenjena
ajtem analizi mernih instrumenata iz oblasti nauka o ponaanju. Pro-
grami su izraeni u Matrix jeziku, kao makroi u okviru statistikog pake-
ta SPSS. To su makro programi otvorenog koda (open source), besplatni
su, a za njihovo odvijanje potreban je statistiki paket SPSS i vrlo su jed-
nostavni za upotrebu.
Makro je namenjen ajtem analizi zasnovanoj na teoriji ajtemskog odgovo-
ra. Za ocenjivanje parametara ajtema koristi se metoda maksimalne ve-
rodostojnosti, koja je dopunjena a priori oekivanjima izvedenim iz
Bayesove teoreme. Makro sadri osnovne indikatore kontrole konvergenci-
je i omoguuje korisniku da oceni da li je iterativni proces protekao korek-
tno. Pomou ulaznih opcija mogue je kontrolisati odvijanje programa,
birati model ajtemskog odgovora i zadavati poetne vrednosti. KakaoBejz
prihvata samo dihotomno skorovane ajteme, jednakog usmerenja u odno-
su na predmet merenja.
Kljune rei: ajtem analiza, teorija ajtemskog odgovora, maksimalna ve-
rodostojnost, Bayesova teorema
1
Rad u okviru projekata broj 149027 Integralni razvoj, fizika aktivnost i aberantno ponaanje
predkolske dece, kojeg sufinansira Ministarstvo za nauku i tehnoloki razvoj i broj 149008b
Psiholoke karakteristike drutva u tranziciji kojeg finansira Ministarstvo nauke i zatite ivo-
tne sredine Republike Srbije.
2
E-mail: stanef@beocity.net.
Stanislav Fajgelj i Bojan Janii
224
Uvod
Skup programa pod zajednikim nazivom Kakao namenjen je ajtem analizi
mernih instrumenata iz oblasti nauka o ponaanju. Programi Kakao namenje-
ni su psiholozima i svima onima koji konstruiu ili evaluiraju takve merne ins-
trumente. Takoe, programi su namenjeni studentima, kao pomono sredstvo
u univerzitetskoj nastavi. Kakao se nastavlja na seriju programa rtt9, rtt10 i
dr., iji je glavni autor bio Konstantin Momirovi u oblasti klasine testne teo-
rije (KakaoKTT), ali i dodaje novu oblast teorije ajtemskog odgovora (TAO).
Programi KakaoBejz i KakaoMiks, pisani kao makroi u metajeziku Matrix, ne
mogu zameniti neke poznate komercijalne programe, kao to su Winsteps
(Linacre, 2002), Bilog i Multilog (Du Toit, 2003) ili RUMM (Andrich, Sheri-
dan i Luo, 2004). Oni nemaju brojne pratee pokazatelje koje ovi programi
imaju, nemaju robusnost i brzinu izvoenja, nemaju grafike prikaze itd. Me-
utim, poto je softver za TAO ajtem analizu skup i slabo dostupan psiholo-
zima generalno, a pogotovo studentima, smatramo da e nai makroi olakati
praksu konstrukcije i evaluacije mernih instrumenata u prilinoj meri
3
.
Ajtem analiza po teoriji ajtemskog odgovora
Teorija ajtemskog odgovora je usmerena na ajtem, a ne na testni skor. U
TAO, zapravo, ne postoji testni skor nego mera osobine kod ispitanika. TAO
je ak usmerena na pojedinaan odgovor, ona matematiki egzaktno modelira
verovatnou odgovora pojedinanog ispitanika na dati ajtem (vidi kasnije iz-
raz 1). Dok je KTT deterministiki model, bitna odlika TAO je da se doprinos
kako ajtema oceni osobine ispitanika, tako i ispitanika oceni ajtema zasniva na
verovatnoi.
Sledei ova svojstva, TAO je reformulisala ne samo pravi skor i skor greke,
nego i druge pojmove KTT, ukljuujui i merna svojstva. Pre svih moemo
spomenuti karakteristinu krivu stavke (KKS), koja osim to predstavlja mo-
del ajtemskog odgovora, odraava i pogled na merenje ponaanja uopte. Na
slici 1 prikazane su KKS jednog lakog i visoko diskriminativnog ajtema (ajtem
1), jednog srednje tekog ali nisko diskriminativnog ajtema (ajtem 2) i jednog
tekog a srednje diskriminativnog ajtema (ajtem 3). Lokacija ajtema na konti-
nuumu osobine definie njegovu teinu, nagib ajtema u taki preloma definie
njegovu diskriminativnost, a verovatnoa da e ispitanici odgovoriti pozitivno
3
Svi Kakao makroi mogu se dobiti direktno od autora putem e-maila janicic@uns.ns.ac.yu, ili
na: http://www.cpijm.org.yu/sfstuff/index.htm.
KAKAOBEJZ - ajtem analiza po TAO
225
na sva tri ajtema dobija se kombinovanjem verovatnoa odgovora na pojedi-
nane ajteme. Na tu zdruenu verovatnou utie nivo osobine ispitanika, kao i
teina i diskriminativnost ajtema. Uoava se jo jedno vano svojstvo, a to je
da se teina ajtema i osobina iskazuju na istoj skali.
Slika 1. Karakteristine krive tri dihotomna ajtema razliite teine i diskriminativnosti
Nastojanje da se postigne nezavisnost ocenjivanja parametara ajtema od kon-
kretnog postignua ispitanika (i obrnuto) centralna je taka teorije ajtemskog
odgovora, a najdoslednije je izvedena u Raschovom modelu kao specifina
objektivnost. Specifina objektivnost je uinila da se danas bez TAO ne mogu
zamisliti detekcija diferencijalnog funkcionisanja ajtema (DIF) i jednaenje
testova (horizontalno i vertikalno). Nezamenljiva je, takoe, u raunarskom
adaptivnom testiranju (KAT) i u fleksibilnom skorovanju testova koji se sasto-
je od ajtema razliitih formata.
Naravno, nita nije idealno, pa tako i teoriji ajtemskog odgovora predstoji
praktina verifikacija sa istorijskom perspektivom. Na primer, TAO ima jedan
problem, koji nije teorijski, nego je tehniki, ali vrlo ozbiljan. To je ocenjivanje
parametara koje je matematiki i raunski vrlo kompleksno, intenzivno i zavi-
sno od metode i podataka (u ovom poslednjem se, dodue, ne razlikuje od fak-
torske analize i slinih tehnika). Ovaj problem se uoava u svojoj punoj velii-
Stanislav Fajgelj i Bojan Janii
226
ni kada se pristupi pisanju softvera za TAO, a bez raunara je TAO neprimen-
ljiva.
Ocenjivanje parametara u teoriji ajtemskog odgovora dihotomni ajtemi
Centralni deo svakog modela teorije ajtemskog odgovora je veliina Z
j
= a
j
(
j
), koja u normalnim modelima predstavlja z-skor, a u logistikim modelima
logit (od "log-odds unit"). Parametri a
j
i
j
su parametri ajtema i odnose se na
diskriminativnost i teinu, a parametar je parametar ispitanika i odnosi se na
nivo latentne osobine (Van der Linden i Hambleton, 1997, Baker i Kim, 2004).
Program kojim se ovde bavimo namenjen je evaluaciji testova, konkretnije
ajtem analizi, i u tom smislu se ne bavi ocenjivanjem .
Najjednostavniji sluaj predstavljaju dihotomno skorovani ajtemi, sa dve kate-
gorije odgovora: pozitivnom i negativnom. Uopteni model odgovora na diho-
tomni ajtem j moe se predstaviti funkcijom P
j
() = P(a
j
,
j
, ), u kome P
j
(),
po konvenciji, predstavlja verovatnou pozitivnog odgovora kod zadatog ni-
voa . Napominjemo da emo u ovom tekstu koristi samo dvoparametarski
model (2P). Funkcija P(a
j
,
j
, ) ima dva osnovna oblika: logistiki i normalni.
Iako mnogi autori smatraju da je normalni model "prirodniji", u statistikom
smislu, u praksi, ali i u teoriji, vrlo je prisutan logistiki model (Baker i Kim,
2004). Sledstveno tome, nai programi su takoe bazirani na logistikim mo-
delima.
Funkcija P
j
() nije nita drugo do karakteristina kriva stavke KKS sa slike 1
(engl. Item Characteristic Curve ICC). Ona spada u kumulativne krive vero-
vatnoe, ili kako se u argonu kae, u ogive. McDonald (1999) ovu ogivu nazi-
va veznom funkcijom jer povezuje verovatnou pozitivnog odgovora sa line-
arnom nezavisnom varijablom latentnom osobinom i u logistikim mode-
lima glasi:
j
j
j
Z
Z
Z
j
e
e
e
P
+
=
+
=
1 1
1
) ( , (1)
pri emu smo Z
j
ranije definisali kao logit: Z
j
= a
j
(
j
). Parametar
j
se iska-
zuje u vrednostima i predstavlja lokaciju ajtema na kontinuumu osobine,
odnosno njegovu teinu. Parametar a
j
ima viestruku interpretaciju. On pred-
stavlja diskriminativnost ajtema, ali i nagib KKS u taki preloma. Takoe,
obrnuto je proporcionalan standardnoj devijaciji logistike funkcije, pa se zato
naziva faktorom skaliranja KKS. Za potrebe ocenjivanja parametara pokazala
KAKAOBEJZ - ajtem analiza po TAO
227
se korisnom takva transformacija koja linearizira KKS, pretvarajui je u regre-
sionu liniju iz koje se vrednost logita (a ne verovatnoa pozitivnog odgovora)
moe predvideti iz osobine. U ovoj linearnoj verziji, logit dobija oblik Z
j
=
j
+
j
, uz sledea dva odnosa:
j
=
j
/
j
i a
j
=
j
. Veliina
j
se, u skladu sa regre-
sionom terminologijom, naziva odsekom, a
j
nagibom, pri emu on logiki i
numeriki zadrava znaenje parametra a
j
.
Uzmimo da imamo test od m dihotomno skorovanih ajtema, administriran na
uzorku od n ispitanika. Pretpostavimo da su ajtemi skorovani sa 0 i 1, to zna-
i da neki ispitanik i moe da ima sklop odgovora na m ajtema: 01011...0.
Sklop odgovora i-tog ispitanika moemo predstaviti vektorom u
i
. Sklopovi
odgovora ispitanika su osnov za ocenjivanje parametara kako ajtema, tako i
ispitanika.
Metoda maksimalne verodostojnosti
U kolokvijalnom engleskom jeziku izraz "likelihood je jedna od varijanti poj-
ma "verovatnoe. Embretson i Rajs (Embretson i Reie, 2000) kau da kada se
relativna frekvencija na velikom broju dogaaja rauna pre nego to se oni
dese, onda je to verovatnoa. Meutim, kad se relativna frekvencija rauna tek
poto se oni dogode, onda je to verodostojnost (likelihood). Tanija definicija
je da funkcija verodostojnosti L(p | X) odreuje verovatnoe dobijenih podata-
ka X u zavisnosti od vrednosti parametra p. Uporedimo to sa definicijom ve-
rovatnoe: P(X | p). Parafrazirajui Edvardsa (Edwards, 1972), u verovatnoi X
je varijabla a p konstanta, dok je u verodostojnosti p varijabla a X konstanta.
Takoe, verodostojnost nije isto to i verovatnoa, a to se najbolje dokumen-
tuje time to integral funkcije verodostojnosti nije 1 (Edwards, 1972).
Ono to nas ovde interesuje, to je vrh funkcije verodostojnosti, odnosno mod,
odnosno maksimum. Mesto maksimuma na apscisi odreuje vrednost para-
metra p kod koje je verodostojnost dobijenih podataka najvea. U naem slu-
aju to su oni parametri ajtema pod kojima dobijeni podaci imaju najveu ve-
rovatnou (verodostojnost) pojavljivanja. Ovakav nain ocene parametara na-
ziva se ocenjivanjem putem maksimalne verodostojnosti (engl. maximum like-
lihood estimation MLE).
Metoda maksimalne verodostojnosti je danas veoma popularna jer je fleksi-
bilna i prilagodljiva razliitim namenama, a vrednosti parametara koje su do-
bijene ovom metodom imaju mnoga poeljna svojstva. Jedno od neeljenih
svojstava je to to se funkcija verodostojnosti kao i nain odreivanja njenog
maksimuma moraju izvesti za svaku aplikaciju posebno. Drugo, za maksimizi-
ranje funkcije potrebna je "teka matematika. Tree, vrednosti maksimuma
Stanislav Fajgelj i Bojan Janii
228
ne mogu se izraunati u zatvorenoj formi, nego se koriste sloene i raunski
veoma intenzivne numerike metode.
Ako se sada vratimo na na zadatak, opti oblik funkcije verodostojnosti sklo-
pa odgovora u
i
za ispitanika i moemo napisati kao:
=
m
j
u
i j
u
i j i i
ij ij
Q P L
1
1
) ( ) ( ) , | ( u , (2)
pri emu je Q
j
(
i
) = 1 P
j
(
i
), a P
j
(
i
) se razlikuje od izraza 1 samo po tome to
se odnosi na konkretnog ispitanika, sa nivoom osobine
i
. Vektor sadri sve
parametre svih ajtema. Kao to je reeno u uvodu, za ocenjivanje parametara
u , a na osnovu dobijenih podataka iz u
i
, koji opet zavise od nivoa osobine
kod ispitanika, na raspolaganju nam je metoda maksimalne verodostojnosti. U
osnovi, maksimum funkcije verodostojnosti se dobija iz prvog izvoda te funk-
cije.
Za svaki TAO model se mora izvesti konkretna funkcija verodostojnosti i pri-
lagoditi konkretnom algoritmu. Kao prvo, funkcija P
j
() se izvodi iz konkret-
nog modela. Zatim, umesto za jednog ispitanika, u stvarnosti se radi sa matri-
com sklopova odgovora U. Takoe, se klasifikuje u neki krajnje svedeni broj
razreda i svaki sklop odgovora dobija mesto u nekom od tih razreda. Za taj
sluaj se koristi diskretan oblik funkcije verodostojnosti i to njen negativni
logaritam lnL (Hambleton, Swaminathan i Rogers, 1991, Baker i Kim, 2004).
Sledea varijacija u primeni ML metode za ocenu parametara se sastoji u uvo-
enju Bayesove teoreme, koja u naelu pomae odreivanju parametara uko-
liko je poznata njihova a priori distribucija. A priori distribucija parametara se
u naim programima svodi na momente distribucije parametra diskriminativ-
nosti
=0 i