Professional Documents
Culture Documents
13 Kvantitativna Analiza
13 Kvantitativna Analiza
Mark Franklin
Kvantifikacija je jedan nain uporabe znanstvenog metoda kako bi se
otkrile stvari o svijetu. U druvenim naukama pokuavamo otkriti stvari o
drutvenom svijetu, ali pristup koji koristimo svejedno se moe smatrati
znanstvenim. Znanstvenim pristupom pokuava se izvui apstrakt iz
nijansi i detalja prie bitnih karakteristika koje se mogu nadograditi u
teoretski iskaz (ili iskaze) za koje e se oekivati da budu istiniti u bilo kojoj
situaciji koja se moe definirati u smislu istih apstrakcija. Ukoliko takav
teoretski iskaz nije istinit u nekoj specifinoj situaciji, onda se pretpostavlja
da je razlog za to ili injenica da ta teorija nije ispravna ili injenica da
takva teorija nije dovoljno elaborirana. Elaboriranje drutvenih teorija kako
bi se u nju unijele nove bitne karakteristike o svijetu, a koje su opet
potrebne za potpuno objanjenje je posebna karakteristika znanstvenog
pristupa; ali da bi elaboracija dosegla vii stupanj potrebno je upotrijebiti
kvantitativnu analizu, kao to e ovo poglavlje pokuati prikazati.
Prelaz sa studije sluaja (case study) na kvantitativnu analizu je u veinom
stvar koliine sluajeva. Ukoliko imate jedan sluaj, ne mogu se izvesti
nikakvi uobiajeni zakljuci (inferencije). Ukoliko imate dva sluaja, neto
moete iskljuiti kao potreban odnos za neto drugo. Ako opet imate tri
sluaja moete iskljuiti dvije stvari ili moete zapoeti s kvantitativnim
iskazima. im ponete s iskazima koji ukljuuju reenice tipa ovo se
deava u 2/3 sluajeva radite kvantitativnu analizu. Ali kako biste mogli
davati takve iskaze morate biti u stanju da izvuete openite karakteristike
(znaajke) koje su zajednike za mnoge sluajeve, to onda opet zahtijeva
dotjeraniju teoretsku bazu za kvantitativnu studiju nego za studiju sluaja.
Takoer za kvantitativnu analizu potreban vam je i prilino veliki broj
sluajeva.
ta tano predstavlja poprilino veliki broj sluajeva u gore navedenom
iskazu uope nije jasno i u praksi postoji veliki prostor preklapanja u kojim
jedan istraiva govori o viestrukoj studiji sluaja multiple case study
dok drugi govori o maloj N studiji (slovo N u kvantitativnoj tradiciji
predstavlja number of cases veliki broj sluajeva) im vidite sluajeve o
kojima se razgovara na taj nain, znat ete da itate neto napisano u
kvantitativnoj tradiciji.
Tabela 13.1 Dravno upravljanje i drutvene mree
Vie
drutvenih Nedostatak
mrea
koje
se drutvenih
vraaju do C12
ak i danas
Visoko-kvalitetno
demokratsko
dravno upravljanje
Sjeverna Italija
mrea
Loe
upravljanje
dravno
Juna Italija
upravljanje
drutvene
mree
Vie
drutvenih Nedostatak
mrea
koje
se drutvenih
vraaju do C12
ak i danas
Visoko-kvalitetno
demokratsko
dravno upravljanje
Loe
upravljanje
dravno 1
(nakon
mrea
Izbor metode u vidu studije sluaja ili kvantitativne studije ovisi o velikom
prostoru preklapanja, na kojoj tradiciji radite vie nego o tome ta radite.
Pogledajte primjer Roberta Putnama 1993. godine i njegove studije
demokratije u Italiji tabela 13.1. Ovaj poprilino poznat primjer bio je
doveden u pitanje nekoliko godina kasnije u harvardskoj doktorskoj
disertaciji koja je posmatrala francuske regije i pronala sluaj loeg
dravnog upravljanja i u sluajevima u kojim su drutvene mree postojale
dugo vremena. ta uraditi? Jedna mogunost je sprovoenje dodatnih
studija u nadi kako e se otkriti da je ili sluaj Francuske ili sluaj Italije
toliko neuobiajen da nije vrijedan brige. Poslije mnogo posla, neko bi
mogao doi do Tabele 13.2. gdje su dva sluaja visoko-kvalitetnog
upravljanja tri sluaja loeg upravljanja u podudaranju s Putnamovim
iskazima, dok iznimka pomenuta u kasnijoj doktorskoj disertaciji onda
predstavlja jedini takav sluaj. To se ini prilino iskljuivim i konanim.
Putnamova otkria se pokazuju istinitim u vie sluajeva nego to se
pokazuju pogrenim. Nadalje, moemo izraziti ova otkria u smislu uvjeta
koji su potrebni za dobro dravno upravljanje (jer nema primjera visokokvalitetnog upravljanja u Tabeli 13.2 bez prisustva drutvenih mrea), iako
samo taj uvjet nije dovoljan za postojanje dobrog upravljanja.
Naravno, bilo bi puno zanimljivije otkriti zato se pojavila iznimka, to bi
onda znailo upotrebu dodatnih sluajeva kako bi se uvidjelo da li je neki
drugi uvjet uzrokovao iznimku. Ukoliko bismo pronali magini sastojak
(nazovimo to preduzetnitvom) koji je uzrokovao iznimku, onda bismo
mogli napraviti i tabelu 13.3. Ovaj dotjeraniji test nam omoguava da
uvidimo kako u biti postoje dva uvjeta, od kojih oba moraju biti prisutna
kako bi postojalo visoko-kvalitetno demokratsko upravljanje dravom,
jedno koje je Putnam predstavio kao neophodno (postojanje drutvenih
mrea) i dodatni uvjet o kojem nije znao nita, a koji je ini se uzronik za
iznimku francuskog sluaja. Dodatni uvjet stoga predstavlja drugi potreban
uvjet za visoko-kvalitetno upravljanje. Preduzetnitvo bez viestrukih
Nedostatak
preduzetnit
va
Nedostata
k mrea
Mree
Nedostata
k mrea
Visoko2
kvalitetno
dravno
upravljanja
Loe
0
dravno
upravljanje
Ne
Politiko
preduzetnitvo
Brittany o
Languedoc x
Nedostatak
preduzetnitva
Aquitaine x
Tuscany o
Provence x
Liguria x
[Varijabla predstavlja bilo koji entitet koji moe da ima razliite vrijednosti
odnosno atribute, tj davarira. Primjeri varijabli su godine, visina, teina,
boja oiju, pol. Razmiljajui o ovim primjerima, uoavamo da vrijednosti
koje varijabla moe da uzme variraju, i mogu biti brojevi (starost
pojedinca), rijei (boja oiju, ime i prezime), datum, to zavisi od
konkretne varijable.Bitna karakteristika varijable je tip varijable, koji se
odreuje u odnosu na nivo mjrenja njenih vrijednosti. Tako, razlikujemo
etiri nivoa mjerenja: nominalni, ordinalni, intervalni i racio. Tip varijable,
odnosno nivo mjerenja, dalje bitno odreuje statistike modele koje
moemo koristiti.Kod nominalnih varijabli (zovemo ih jo i kategorijalne)
vrijednosti koje varijabla moe da ima sutakve da meu njima nije mogue
utvrditi odnose, redosljed, itsl. Takva je varijabla boja oiju, pol,region,
ime, itd. Naime, iako moemo izmjeriti boju oiju svih naih ispitanika,
nemogue je meu razliitim bojama utvrditi neki odnos, da je jedna
bolja/vea od druge, niti moemo mjeriti razlike meu njim. Kod
nominalnih varijabli vrijednosti koje mogu da se jave su predstavljene
rijeima,opisno. Premda e esto opis vrijednosti biti numeriki kodiran
(npr kod varijable pol,esto emo rei da vrijednost 1 oznaava muki a
vrijednost 2 enski pol), one e i dalje biti nominalne po svom tipu. Kada
govorimo o mjerama centralne tendencije i ostalim statistikim modelima,
kod nominalnih varijabli moemo koristiti iskljuivo modus i chi-kvadrat
staistiku. Artimetika sredina i medijana kodnominalne varijable nemaju
smisla.
Sljedei tip varijable je ordinalna varijabla. Kod ordinalne varijable je
mogue sve vrijednosti koje ona moe da ima na neki nain rangirati.
Naime, kod ovih varijabli postoji odnos izmeu razliitih vrijednosti, u
smislu da je jedna vrijednost vea / bolja / jaa od druge. Meutim, razlike
izmeu razliitih vrijednosti nisu jasne i nisu iste. Primjer je skala stepena
slaganja sa odreenim stavom, kada postoje vrijednosti: u potpunosti se
slaem, djelimino se slaem, djelimino se ne slaem, i uopte sene
slaem. Kao to vidimo, svaka sledea vrijednost predstavlja manji stepen
slaganja sa stavom,meutim razlike izmeu dva stepena nisu jasne (ne
moemo rei kolika je razlika izmeu ispitanik akoji se u potpunosti slae i
onog koji se slae samo djelimino), i nisu jednake (ne moemo rei da je
ista razlika u jaini stava izmeu u potpunosti se slaem i djelimino se
slaem, kao to je izmeu djelimino se slaem i djelimino se ne slaem).
Primjer
Dodatne informacije
Intervalna varijabla
Ordinalna varijabla
Nominalna varijabla
Dummy varijabla
0=NotLabour;
1=Labour
n.a.
Zabiljeka:
(Ponekad se intervalne varijable nadalje razlikuju na one sa
real zero point koje se zovu racio varijable, ali ta distinkcija nije
potrebna u drutvenim naukama)
Statistika
Kako bi razgovarali o kvantitativnom istraivanju i rezultatima istog,
moramo se koristiti statistikom. U tehnikom smislu, statistika predstavlja
koefcijente koji saimaju stvari od interesa (bitne stvari) o podacima.
Statistika je takoer procedura kojom osoba dolazi do takvih koefcijenata,
inae jo poznatija kao statistika analiza. Procent ili prosjek jeste
statistiki koefcijent (inae se jo naziva descriptive statistic deskriptivna
statistika jer opisuje tijelo podataka), ali ono to je mnogo interesantnije
drutvenim naunicima su koefcijenti koji se odnose na pitanja koja smo
saeli ranije: Koliko rasprostranjeno? Koliko snano? Koliko znaajno? Poet
emo s posljednjim od ova tri.
Koliko znaajno?
Znaaj se odnosi na vjerovatnost pogreke prilikom davanja neke
tvrdnje. Statistiki metodi omoguavaju nam da odredimo koliki su izgledi
da smo u krivu po pitanju zakljkuaka izvuenih iz sluajnog uzorka.
Nadalje, veina istraivaa koristi ove metode na bilo kojem datasetu za
koji ne postoji razlog sumnje u njegovu reprezantitivnu prirodu. Pitanje
znaaja moe se primjeniti na tzv. POINT ESTIMATES POJEDINANE
PROCJENE PARAMETARA POPULACIJE (naprimjer statistika nam moe rei
koliko je mogue da smo u krivu ako procijenimo da e Demokrati dobiti
53% glasova na sljedeim Predsjednikim izborima u SAD-u); ali i mnogo
interesantnija drutvenim naunicima su pitanja odnosa izmeu varijabli.
Ukoliko uzmemo raniji primjer veze izmeu zastupljenosti mrea i kvalitete
demokratske vladavine, bilo bi korisno da znamo da su anse kako su veze
da je mala
su to tako
veze emo
regijama i
Snaga korelacije
Interpretacija s
podacima na
individualnom nivou
Interpretacija s
agregatnim
podacima
nR = 0.00-0.06
Trivijalno
Trivijalno
nR = 0.07-0.19
Beznaajno
Trivijalno
nR = 0.20-0.34
Umjereno
Beznaajno
nR = 0.35-0.49
Snano
Umjereno
nR = 0.50-0.65
Spektakularno
Snano
nR = 0.66-0.80
Visoko spektakularno
Jako snano
nR = 0.81-0.95
Sumnjivo
Spektakularno
nR = 0.96-1.00
Veoma sumnjivo
Sumnjivo
minuti
Regresijska analiza
[Ispitivanje ovisnosti jedne zavisne (regresand) varijable o jednoj
(ili vie) nezavisnih (regresorskih) varijabli s ciljem da se utvrdi
analitiki izraz takve povezanosti (model).
Osnova regresijske analize je regresijski model.
Regresijski model - algebarski model kojim se analitiki izraava
statistilki odnos meu pojavama.
Model: - deterministiki (funkcionalan)
- statistiki (stohastiki).
Deterministiki model - za svaku vrijednost nezavisne varijable X
jednoznano je odreena vrijednost zavisne varijable Y.
Y fX
Y f X e
pri emu je :
- funkcionalna (deterministika) komponenta
e stohastika varijabla koja predouje nesistematske utjecaje
na zavisnu varijablu.
Regresijska analiza
32.9*Prisilno
Coeff.
s.e.
Prob
Natturnout
0.30
0.18
1.66
0.10
Compulsory
32.90
3.30
9.95
0.00
First
7.16
2.90
2.47
0.02
(Constant)
24.67
14.02
1.76
0.08
Broj observacija
64
F(3,60)
66.38
Prob > F
0.00
R2
0.77
Adjusted R2
0.76
Drugi koefcijenti e biti objanjeni kasnije, ali kolumna pod naslovom Prob
(Nekada je Prob skraeno P) daje nivo znaaja od po svakog utjecaja.
injenica da utjecaj nacionalne izlaznosti ima vjerovatnost od 0.10 da e
biti laan govori nam da izlaznost na Izborima za EP vjerovatno nije pod
utjecajem nacionalne izlaznosti na prethodnim izborima, tako da bi u
praksi, prema tome ova komponenta trebala biti eliminisana. (I bit e
elimisana u Tabeli 13.9 kako ova pria bude odmicala.)
Output iz regresijskog programa nam takoer govori o R 2 koji je povezan s
analizom, kao, meu drugim statistikama. R2 bez iznenaenja je kvadrat
od R (ili r) koefcijent koji se esto koristi da bi se objasnile bivarijabilne
veze o kojima smo prethodno govorili. Vrijednost R je kvadratna u
multivarijabilnoj analizi dijelom zbog toga to je s vie nezavisnih varijabli
lake postii visoku R vrijednost. Kada je ovaj koefcijen kvadratni (R 2),
dolazimo do manjeg koefcijenta koji je prikladniji za upotreb u
multivarijabilnoj analizi (proporcija proporcije je manja proporcija
naprimjer, polovina polovine je etvrtina.) Kako bi evaluirali vrijednosti R 2 ,
moemo se koristiti Tabelom 13.7 radi interpretacije razliitih vrijednosti r.
Spektakularan multivarijabilni nalaz (rezultat) na individualnom nivou je
onaj koji proizvede R2 iznad 0.5, dok s agregatnim podacima R2 treba biti
iznad 0.8 kako bi bio spektakularan itd. Tabela 13.8 sadri listu adjusted R 2
prilagoenog R2, to je vrijednost koja se obino prikazuje. U ostatku
ovog dijela, opisat emo analizu koja uslijedila nakon otkria (ilustriranog u
Tabeli 13.8) da izlaznost na nacionalne izbore nije znaajno utjecala na
izlaznost na Izbore za Evropski parlament. Ovo otkrie nas je iznenadilo,
jer bi Izbori za EP trebali biti sekundarni u odnosu na nacionalne izbori koji
su primarni (Reif and Schmitt 1980), demonstrirajui tako karakteristike
nacionalne situacije, prije nego karakteristike koje se odnose na same
Izbore za EP. Prema tome, iako je prirodno teoretizirati da je primarna
determinanta izlaznosti na Izbore za EP izlaznost na nacionalnim izborima,
relevantni koefcijent nije znaajan u Tabeli 13.8.
Table 13.9. European Election turnout (3)
Model A
Nezavisne
Model B
(s.e.)
0.30
(0.18)
varijable
Nacionalna
Model C
(s.e.)
Model D
(s.e.)
(s.e.)
izlaznost
Prisilno
32.90
(3.30)**
36.22
(2.66)**
38.30
(2.98)**
7.15
(2.90)*
8.30
(3.86)*
1.51
(5.38)
9.41
47.15
38.62
(2.74)**
(6.34)
10.92
(3.31)**
(1.66)**
47.14
(1.65)**
glasanje
Prvo
glasanje za
EP
Prvo
glasanje
*Ne-prisilna
(konstanta
24.67
(14.02)
47.80
(1.62)**
)
Prilagoeno
0.76
0.75
0.75
0.76
64
64
64
64
R2
N
fusnoti ispod tabele. Kada podaci dolaze i sluajnih uzoraka, imamo samo
ansu 1 od 100 da pogrijeimo kada tvrdimo da su utjecaji (efekti) s dvije
zvijezdice ** stvarni. U posljednja dva reda, na dnu svakog modela
prezentovan je broj sluajeva koji su ukljueni u analizu (N) i R 2 povezan s
analizom, koji smo ve opisali u vezi s Tabelom 13.8.
Na osnovu poprilino minimalistikog uvoda, moemo nadalje objasniti
zato je intuitivno prihvatljivije stajalite (Ono da izlaznost na izbore za EP
zavisi od izlaznosti na nacionalne izbore) odbaeno rad objanjenja koje ni
ne spominje nacionalne izbore.
Model A je model koji je ve prezentovan u Tabeli 13.8, koji je ponovljen u
referentne svrhe. Ovo je teoretski oekivani model u kojem se ipak
nacionalna izlaznost ne pokazuje znaajno utjecajnom na izlaznost na EP
izbore. (bez zvijezdica za efekt od 0.30).
U Modelu B vidimo ta se deava kada jednostavno otklonimo nacionalu
izlaznost iz modela. Drugim varijablama se malo povea utjecaj, ali utjecaj
prvih izbora je i dalje znaajan samo na nivou 0.05 i odstupanje (varijanca)
koja je objanjena (R2) se isto tako malo sputa. Postoje miljenja, da
moda pogreno specificiramo nau varijabl prvih izbora, jer teoretski
injenica da postoji neto posebno kod izbora ne bi trebalo utjecati na
izlaznost u zemlji koja ve ima uvedeno prisilno glasanje. Specificiranje
adekvatne interakcije izmeu prvih izbora i prisilnog glasanja, izraa novi
Model C u kojem se pokazuje da nijedna od ovih varijabli nije znaajna, ali
interakcijsku utjecaj je snaniji od dva utjecaja. Poto su prvi izbori bili
znaajni kada su bili jedina mjera koncepta (Model B), neuspjeh te
varijable da se pokae znaajnom kada je popraena svojom novom
varijacijom (u Modelu C) moe biti jer dvije varijable veinom mjere istu
stvar (to se naziva multicollinearity multikolinearnost). Postoji nekoliko
naina da se uhvatimo u kotac s multikolinearnou, ali u ovom primjeru
jednostavno to radimo eliminacijom manje snane od dvije alternativne
mjere. Rezultat je onda Model D, gdje su svi utjecaji jako znaajni i
objanjeno odstupanje (varijanca) je tamo gdje je bila i kod Modela A.
(Franklin 2001.)
Daljni koraci
Jo uvijek ima mnogo toga da se naui o kvantitativnoj analizi. Naroito,
postoje mnogi tipovi multivarijabilne analize, od kojih su mnoge
dizajnirane za specijalne istraivake situacije, a izbor meu njima bit e
odreen najee prirodom podataka koji se analiziraju. Naprimjer, podaci
u kojima sluajevi predstavljaju razliite vremenske periode zahtijevaju
cijeli set specijaliziranih postupaka, kao to zahtijevaju i podaci izmjereni
na razliitim nivoima agregacije.
Ipak, regresijska analiza je neto to se moe smatrati industrijskim
standardom za multivarijabilnu analizu. Biti u mogunosti da razumijemo