Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 24

13 Kvantitativna analiza

Mark Franklin
Kvantifikacija je jedan nain uporabe znanstvenog metoda kako bi se
otkrile stvari o svijetu. U druvenim naukama pokuavamo otkriti stvari o
drutvenom svijetu, ali pristup koji koristimo svejedno se moe smatrati
znanstvenim. Znanstvenim pristupom pokuava se izvui apstrakt iz
nijansi i detalja prie bitnih karakteristika koje se mogu nadograditi u
teoretski iskaz (ili iskaze) za koje e se oekivati da budu istiniti u bilo kojoj
situaciji koja se moe definirati u smislu istih apstrakcija. Ukoliko takav
teoretski iskaz nije istinit u nekoj specifinoj situaciji, onda se pretpostavlja
da je razlog za to ili injenica da ta teorija nije ispravna ili injenica da
takva teorija nije dovoljno elaborirana. Elaboriranje drutvenih teorija kako
bi se u nju unijele nove bitne karakteristike o svijetu, a koje su opet
potrebne za potpuno objanjenje je posebna karakteristika znanstvenog
pristupa; ali da bi elaboracija dosegla vii stupanj potrebno je upotrijebiti
kvantitativnu analizu, kao to e ovo poglavlje pokuati prikazati.
Prelaz sa studije sluaja (case study) na kvantitativnu analizu je u veinom
stvar koliine sluajeva. Ukoliko imate jedan sluaj, ne mogu se izvesti
nikakvi uobiajeni zakljuci (inferencije). Ukoliko imate dva sluaja, neto
moete iskljuiti kao potreban odnos za neto drugo. Ako opet imate tri
sluaja moete iskljuiti dvije stvari ili moete zapoeti s kvantitativnim
iskazima. im ponete s iskazima koji ukljuuju reenice tipa ovo se
deava u 2/3 sluajeva radite kvantitativnu analizu. Ali kako biste mogli
davati takve iskaze morate biti u stanju da izvuete openite karakteristike
(znaajke) koje su zajednike za mnoge sluajeve, to onda opet zahtijeva
dotjeraniju teoretsku bazu za kvantitativnu studiju nego za studiju sluaja.
Takoer za kvantitativnu analizu potreban vam je i prilino veliki broj
sluajeva.
ta tano predstavlja poprilino veliki broj sluajeva u gore navedenom
iskazu uope nije jasno i u praksi postoji veliki prostor preklapanja u kojim
jedan istraiva govori o viestrukoj studiji sluaja multiple case study
dok drugi govori o maloj N studiji (slovo N u kvantitativnoj tradiciji
predstavlja number of cases veliki broj sluajeva) im vidite sluajeve o
kojima se razgovara na taj nain, znat ete da itate neto napisano u
kvantitativnoj tradiciji.
Tabela 13.1 Dravno upravljanje i drutvene mree
Vie
drutvenih Nedostatak
mrea
koje
se drutvenih
vraaju do C12
ak i danas
Visoko-kvalitetno
demokratsko
dravno upravljanje

Sjeverna Italija

mrea

Loe
upravljanje

dravno

Juna Italija

Izvor: Putnam (1993)


Tabela 13.2 Dravno
dodatnih studija)

upravljanje

drutvene

mree

Vie
drutvenih Nedostatak
mrea
koje
se drutvenih
vraaju do C12
ak i danas
Visoko-kvalitetno
demokratsko
dravno upravljanje
Loe
upravljanje

dravno 1

(nakon

mrea

Izbor metode u vidu studije sluaja ili kvantitativne studije ovisi o velikom
prostoru preklapanja, na kojoj tradiciji radite vie nego o tome ta radite.
Pogledajte primjer Roberta Putnama 1993. godine i njegove studije
demokratije u Italiji tabela 13.1. Ovaj poprilino poznat primjer bio je
doveden u pitanje nekoliko godina kasnije u harvardskoj doktorskoj
disertaciji koja je posmatrala francuske regije i pronala sluaj loeg
dravnog upravljanja i u sluajevima u kojim su drutvene mree postojale
dugo vremena. ta uraditi? Jedna mogunost je sprovoenje dodatnih
studija u nadi kako e se otkriti da je ili sluaj Francuske ili sluaj Italije
toliko neuobiajen da nije vrijedan brige. Poslije mnogo posla, neko bi
mogao doi do Tabele 13.2. gdje su dva sluaja visoko-kvalitetnog
upravljanja tri sluaja loeg upravljanja u podudaranju s Putnamovim
iskazima, dok iznimka pomenuta u kasnijoj doktorskoj disertaciji onda
predstavlja jedini takav sluaj. To se ini prilino iskljuivim i konanim.
Putnamova otkria se pokazuju istinitim u vie sluajeva nego to se
pokazuju pogrenim. Nadalje, moemo izraziti ova otkria u smislu uvjeta
koji su potrebni za dobro dravno upravljanje (jer nema primjera visokokvalitetnog upravljanja u Tabeli 13.2 bez prisustva drutvenih mrea), iako
samo taj uvjet nije dovoljan za postojanje dobrog upravljanja.
Naravno, bilo bi puno zanimljivije otkriti zato se pojavila iznimka, to bi
onda znailo upotrebu dodatnih sluajeva kako bi se uvidjelo da li je neki
drugi uvjet uzrokovao iznimku. Ukoliko bismo pronali magini sastojak
(nazovimo to preduzetnitvom) koji je uzrokovao iznimku, onda bismo
mogli napraviti i tabelu 13.3. Ovaj dotjeraniji test nam omoguava da
uvidimo kako u biti postoje dva uvjeta, od kojih oba moraju biti prisutna
kako bi postojalo visoko-kvalitetno demokratsko upravljanje dravom,
jedno koje je Putnam predstavio kao neophodno (postojanje drutvenih
mrea) i dodatni uvjet o kojem nije znao nita, a koji je ini se uzronik za
iznimku francuskog sluaja. Dodatni uvjet stoga predstavlja drugi potreban
uvjet za visoko-kvalitetno upravljanje. Preduzetnitvo bez viestrukih

drutvenih mrea nee proizvesti nita vie visoko-kvalitetno upravljanje


nego to e prisustvo mrea bez preduzetnitva.

Tabela 13.3. Preduzetnitvo i mree


Preduzetnit
vo
Mree

Nedostatak
preduzetnit
va
Nedostata
k mrea

Mree

Nedostata
k mrea

Visoko2
kvalitetno
dravno
upravljanja

Loe
0
dravno
upravljanje

Tabela 13.4 Zajednice s teritorijalnom politikom


Veliki
broj
drutvenih mrea
Da

Ne

Politiko
preduzetnitvo

Brittany o

Languedoc x

Nedostatak
preduzetnitva

Aquitaine x

Tuscany o
Provence x
Liguria x

Izvor: Smyryl 1997.


Stavimo prave nazive regija u jednostavniju Tabelu 13.4 gdje dvije
varijable odreuju gdje se svaka od regija svrstava u tabeli u kojoj se
kvalitet upravljanja oznaava sa x (loe) i o (kvalitetno upravljanje).
Tabela 13.4 je tabela koja bi se koristila u veem broju studija sluaja, dok
je Tabela 13.3 prikladnija za kvantitativnu analizu. Naravno, kada imamo
samo 6 sluajeva, teko je biti siguran da smo iscrpili sve mogunosti.
Mogu se pojaviti dodatne iznimke i onda se moraju u obzir uzeti novi
uvjeti. Ali prilino je jasno da kako bi se otkrilo vie, potrebno je to vie

sluajeva i s veim brojem dodatnih sluajeva format koji se koristi u Tabeli


13.3 postaje korisniji nego format koji se koristi u Tabeli 13.4. Ukoliko
bismo imali dvanaest imena u Tabeli 13.4 umjesto samo est, informacije
ne bi bile pretjerano korisne u takvom formatu. S vie od deset sluajeva,
postaje korisno upotrebljavati brojeve za saimanje svega onoga to ste
nauili i tako mijenjajui specifinost za openitost. Ali s malim N
studijama, ono to moete rei s brojevima i dalje je limitirajue. S ovog
gledita sljedee bitno razvoe dolazi s tranzicijom na velike N-studije,
gdje moete iskoristiti punu snagu onoga to se naziva multivarijabilnom
analizom. Opet, ponavljam, nema fiksno postavljene granice. to se vie
poveava N broj to je analiza monija, snanija, bolja.
ta se onda moe uraditi s malim N-studijama koje se ne mogu izvesti sa
studijama sluaja i ta se moe uraditi s velikim N-studijama, ali opet ne
moe s malim N-studijama? U biti moemo rei da s porastom broja
sluajeva istraiva moe bolje:
a) odrediti (specificirati) uvjete pod kojima se osjete uobiajeni efekti
(koliko su rasprostranjeni);
b) odrediti (specificirati) prirodu uobiajenih efekata (koliko su snani);
c) odrediti (specificirati) koliko je vjerovatno da su efekti realni, a ne
toliko neuobiajeni da se mogu zanemariti (koliko su znaajni).
Vokabular kvantitativnog istraivanja
Distinkcije koje sam upravo predstavio (izmeu rasprostranjenih, snanih i
znaajnih uobiajenih
efekata ) dovode nas do glavne potekoe
ukljuene u kvantitativnu analizu. Kako bismo mogli priati kvantitativno,
osoba mora biti sposobna razlikovati i praviti distinkcije koje ostalim
ljudima nisu prirodne. U obinom engleskom jeziku razlike izmeu rijei
snani, rasprostranjeni i znaajni nisu toliko oigledne. Sve ove rijei
izgledaju kao razliite varijante rijei vano. To je istina, ali distinkcije
koje se ine nebitnim s jednog gledita mogu biti jako bitne s nekog
drugog gledita.
Ukratko, uobiajeni efekt je snaan ukoliko ima ekstenzivne uinke
(efekte). Rasprostranjen je ukoliko se pojavljuje u mnogo razliitih
okolnosti i situacija i znaajan je ukoliko je malo vjerovatno da je laan ili
toliko neuobiajen da se moe zanemariti. Kada priamo o nesretnim
sluajevima koristimo skoro isti vokabular i pravimo distinkciju izmeu
udne nesree koja se najvjerovatnije nee ponoviti i nesree koja je
znaajna jer je dio predvidivog ablona (eme). Meutim ak i znaajna
nesrea moe imati male ili limitirajue posljedice. Alternativno, njene
posljedice mogu biti velike i/ili rasprostranjene. Doista postoji irok spektar
rijei koje se moraju nauiti kako bismo mogli razgovarati senzibilno o
kvantitativnim rezultatima drutvenog istraivanja ili kako bi nam
literatura koja koristi ovakav vokabular uope imala smisla. U nastavku
ovog poglavlja obradit u neke od bitnijih rijei. Jasno, kako bismo nauili

kvantitativno drutveno istraivanje potrebno je mnogo vie od pukog


uenja vokabulara. Postoji nekoliko vjetina, ali uvijek sam smatrao da
vokabular zbunjuje ljude prije nego to je to sluaj s konkretnim
vjetinama.
Izvori kvantitativnih informacija
Kvantitativne informacije mogu se skupiti na isti nain kao i bilo koje druge
informacije: intervjuom (u kvantitativnoj tradiciji generalno se zovu
surveys odnosno ankete) ili traenjem informacijama u raznim vrstama
pregleda (ili na Internetu). Ankete (surveys)
openito ukljuuju
uzimanje uzoraka (sampling) {gdje izaberemo podgrupu koju emo
intervjuirati jer postoji previe osoba da bi ih sve intervjuirali} uzimamo
uzorak od recimo 1000 ljudi odreene populacije, dok su informacije koje
pregledamo openito iscrpljujue (moemo dobiti podatke cijelog
univerzuma (universe) sluajeva koji nas interesiraju). Vano je znati
da li je informacija dobijena iz uzorka ili cijelog univerzuma jer su
uzorci podloni grekama kada pokuamo generalizirati izvan uzorka.
Ovo je naravno podjednako tano za mnoge studije sluaja, gdje je
mogunost da sluaj nije reprezentativan (unrepresentative case )
sinonimna s loim uzorkom (bad sample), ali postoje posebni tipovi
uzoraka vjerovatnosni uzorci (probability samples) kod kojih je mogue
koristiti statistike metode generaliziranja izvan uzorka s poznatom
vjerovatnou da e generalizacija biti istinita. Ovo je vrlo mona opcija
nasuminih uzoraka random samples koja je onemoguena onima koji
svoje sluajeve biraju na drugi nain; kod tradicije studije sluaja
nemogue je rei koliko indikativan moe biti jedan sluaj. Veina anketa
bazirana je na nasuminom uzorku, koji se mora razlikovati u praksi, takve
distinkcije su izvan djelokruga ovog uvoda.
Dataset i data matrix
U onom trenutku kada neko zapone priu o kvantitativnoj informaciji,
prinuen je da pone priati o podacima. Data podaci (plural, tretiranje
podataka kao kolektivne imenice je esto, ali pogreno) proizlaze iz
standardiziranih informacija. U ovom smislu, biografski pregled sadri
podatke, jer su karakteristike svakog individualca prezentirane u
standardnoj formi: spol, datum roenja, kola koju su pohaali itd. Dataset
ide korak dalje u kodiranju standardiziranih podataka, openito u
numerikom smislu (npr. 1=female 2=male) i prua svojevrsni rjenik ili
upute codebook knjiga s kodom s kojom e se tumaiti kodovi. Kada se
organizira na ovaj nain codebook se razlikuje od data matrixa
podatkovne matrice koja predstavlja tabelu organiziranu s razliitim
sluajevima u razliitim redovima. Preko tabele nalaze se kolone, svaka
kolona sadri posebnu karakteristiku (kao to je spol, dob, prihodi, stranka
za koju ste glasali). Ovo su poznate varijable. Posmatrajui presjek jednog
odreenog reda s odreenom kolonom moe se proitati o odreenoj
karakteristici ili vrijednosti koja je povezana s odreenim sluajem. Dakle

ako e uee na Evropskim parlamentarnim izborima biti varijabla u treoj


koloni Tabele 13.5 i Francsuka biti sluaj u etvrtom redu do tree kolone,
moe se pronai podatak da je uee (izlaznost) Francuza na izborima
iznosila 60.7%.
Varijable i nivoi mjerenja
[METODOLOGIJA POLITIOLOKIH ISTRAIVANJA, FPN PODGORICA]

[Varijabla predstavlja bilo koji entitet koji moe da ima razliite vrijednosti
odnosno atribute, tj davarira. Primjeri varijabli su godine, visina, teina,
boja oiju, pol. Razmiljajui o ovim primjerima, uoavamo da vrijednosti
koje varijabla moe da uzme variraju, i mogu biti brojevi (starost
pojedinca), rijei (boja oiju, ime i prezime), datum, to zavisi od
konkretne varijable.Bitna karakteristika varijable je tip varijable, koji se
odreuje u odnosu na nivo mjrenja njenih vrijednosti. Tako, razlikujemo
etiri nivoa mjerenja: nominalni, ordinalni, intervalni i racio. Tip varijable,
odnosno nivo mjerenja, dalje bitno odreuje statistike modele koje
moemo koristiti.Kod nominalnih varijabli (zovemo ih jo i kategorijalne)
vrijednosti koje varijabla moe da ima sutakve da meu njima nije mogue
utvrditi odnose, redosljed, itsl. Takva je varijabla boja oiju, pol,region,
ime, itd. Naime, iako moemo izmjeriti boju oiju svih naih ispitanika,
nemogue je meu razliitim bojama utvrditi neki odnos, da je jedna
bolja/vea od druge, niti moemo mjeriti razlike meu njim. Kod
nominalnih varijabli vrijednosti koje mogu da se jave su predstavljene
rijeima,opisno. Premda e esto opis vrijednosti biti numeriki kodiran
(npr kod varijable pol,esto emo rei da vrijednost 1 oznaava muki a
vrijednost 2 enski pol), one e i dalje biti nominalne po svom tipu. Kada
govorimo o mjerama centralne tendencije i ostalim statistikim modelima,
kod nominalnih varijabli moemo koristiti iskljuivo modus i chi-kvadrat
staistiku. Artimetika sredina i medijana kodnominalne varijable nemaju
smisla.
Sljedei tip varijable je ordinalna varijabla. Kod ordinalne varijable je
mogue sve vrijednosti koje ona moe da ima na neki nain rangirati.
Naime, kod ovih varijabli postoji odnos izmeu razliitih vrijednosti, u
smislu da je jedna vrijednost vea / bolja / jaa od druge. Meutim, razlike
izmeu razliitih vrijednosti nisu jasne i nisu iste. Primjer je skala stepena
slaganja sa odreenim stavom, kada postoje vrijednosti: u potpunosti se
slaem, djelimino se slaem, djelimino se ne slaem, i uopte sene
slaem. Kao to vidimo, svaka sledea vrijednost predstavlja manji stepen
slaganja sa stavom,meutim razlike izmeu dva stepena nisu jasne (ne
moemo rei kolika je razlika izmeu ispitanik akoji se u potpunosti slae i
onog koji se slae samo djelimino), i nisu jednake (ne moemo rei da je
ista razlika u jaini stava izmeu u potpunosti se slaem i djelimino se
slaem, kao to je izmeu djelimino se slaem i djelimino se ne slaem).

Kod ordinalnih varijabli moemo koristiti, pored onihmodela i mjera koje


koristimo kod nominalnih, i medijanu kao mjeru centralne tendencije.
esto emo, meutim, naii i na aritmetiku sredinu kao mjeru centralne
tendecije primijenjenu na ordinalnoj varijabli. Sledei nivo mjerenja je
intervalna varijabla. Kod intervalnih varijabli, osim to postoji rangiranje
izmeu vrijednosti, postoji i ekvidistanca. Naime, razlike izmeu dvije
vrijednosti su precizne i konstantne za bilo koje dvije susjedne vrijednosti.
Primjer je temperatura vazduha: naime moemo rei da je razlika izmeu
10 i 20 stepeni ista kao i razlika izmeu 30 i 40 stepeni celzijusa. Takoe,
kodintervalne varijable vrijednost 0 (nula) ne predstavlja odsustvo
vrijednosti veima svoje znaenje (0stepeni je temperatura, a ne odsustvo
temperature). Ono to ne moemo raditi kod intervalne varijable jeste
definisati odnose, pa tako ne moe rei da je 40 stepeni duplo toplije od
20 stepeni.
Poslednji nivo mjerenja je racio skala. Kod racio skale vrijednost 0 je
fiksirana, nije arbitrarna kao kodintervalne varijable. Takva je varijabla
godine starosti. Kod racio varijabli moemo definisati i odnose izmeu
vrijednosti, pa tako moemo rei da je osoba od 40 godina duplo starija od
osobe od 20godina. Kada su u pitanju statistiki modeli i mjere centralne
tendencije, sve ono to budemo izuavali tokom kursa primjenjivo je i na
intervalne i na racio varijable. ]
Prianje o varijablama zakomplikovano je injenicom da postoje razliiti
tipovi varijabli. Ve smo spomenuli dva tipa: varijable poput spola, gdje su
pripisane vrijednosti dosta proizvoljne i varijable poput dobi gdje pripisane
vrijednosti imaju sutinsko znaenje (dob se generalno mjeri u godinama).
U sluaju nominalne varijable poput spola gdje su vrijednosti u velikoj
mjeri proizvoljne i varijabli poput dobi, gdje pripisane vrijednosti imaju
sutinsko znaenje (dob se obino mjeri u godinama). U sluaju nominalne
varijable poput spola, mukarci se lako mogu kodirati s brojem 1 dok se
ene mogu kodirati s brojem 2 kao i obrnuto ili bi dvije mogue vrijednosti
mogli biti M i . Sve to radimo s nominalnim varijablama jeste da
razlikujemo karakteristike koje moemo primjeniti s razliitim sluajevima
u granicama te varijable vrijednosti koje upotrebljavamo slue samo za
davanje imena karakteristikama (stoga nominal iz latinskog za ime).
Ali s interval variables intervalnim varijablama kao to je dob intervale
izmeu vrijednosti su znaajne. (godina, dolar, KM ili nekad druga mjerna
jedinica).
Za istraivae drutvenih nauka bitna su jo dva nivoa mjerenja. Varijable
mogu biti ordinal ordinalne varijable ukoliko vrijednosti imaju red
(order) koji je impliciran njihovim numerikim vrijednostima (5 je vee od
4) ak iako ne postoji mjerna jedinica. Takoer postoje tzv. dummy
variables (lane varijable) koje samo indiciraju (pokazuju) prisustvo ili
odsustvo neke karakteristike (npr. 0=nije Britanac, 1=Britanac). Kada
podaci dolaze iz ankete individua, najee varijable su nominalne i

ordinalne, dok su varijable koje mi najee prieljkujemo kako bi mogli


provesti multivarijabilnu analizu (pogledajte tabelu dolje) intervalne
varijable.

Tabela 13.5 Izlaznost na Izborima za Europski parlament


Data matrix (matrica podataka)
Data matrix
Country Electn EPturnout Natturnout Yrsleft Compuls First
bri 1979 32.2 76 4 0 1
den 1979 47.8 86 0.36 0 1
bel 1979 90.4 95 2.4 1 1
fra 1979 60.7 83 2 0 1
ger 1979 65.7 91 1.3 0 1
gre 1981 82.2 82 0 1 1
ire 1979 63.6 76 2 0 1
ita 1979 84.9 91 4 1 1
lux 1979 88.9 89 0 1 1
net 1979 57.8 88 2 0 1
bri 1984 32.6 73 3 0 0
den 1984 52.4 88 3.2 0 0
bel 1984 92.2 95 1.3 1 0
fra 1984 56.7 71 1.7 0 0

ger 1984 56.8 89 2.6 0 0


gre 1984 82.2 82 0.96 1 0
ire 1984 47.6 73 2.7 0 0
ita 1984 83.4 89 3 1 0
lux 1984 88.8 89 0 1 0
net 1984 50.6 81 1.9 0 0
por 1984 72.4 73 0 0 1
spa 1984 68.9 70 2.4 0 1
Codebook
Variables Meaning (and values)
Country Three-character country ID
Electn Date of election (year)1
EPturnout Turnout at European Parliament election (per cent)
Natturnout Turnout at previous national election (per cent)
Yrsleft Years to next national election (years and parts of years)
Compuls Compulsory voting at time of EP election (0no; 1yes)
First First EP election held in country (0no; 1yes)
1 Note that Greece, which held its first EP elections in 1981, is generally not distinguished
from the 1979 election countries.

Mnogo vremena i napora istraivai ulau kako bi podatke transformirali.


Rjeenje koje je opeprihvaeno u istraivanju politikih nauka je da se
ordinalne varijable tretiraju poput intervalnih (ukoliko imaju dovoljno
kategorija) i da se nominalne varijable ponovno kodiraju u svoje dummy
lane kopije, koje se mogu posmatrati kao poasne intervalne varijable sa
mjernom jedinicom koja predstavlja prisustvo ili odsustvo atributa o kojem
se govori. Za ovo je potrebno mnogo vjetine, ali kada se uradi ispravno,
na ovaj nain ne vri se nasilje nad podacima.
Tabela 13.6 Tipovi varijabli
Nivo mjerenja

Primjer

Dodatne informacije

Intervalna varijabla

43% Lab; 10%


Dem; 47% Con

Ordinalna varijabla

1=Lab, 2=Lib Dem, Red Order (lijevica3=Con


desnica
relativna
lokacija)

Nominalna varijabla

1=Lab, 2=Con, 3=Lib Meusobna


Dem
iskljuenost

Dummy varijabla

0=NotLabour;
1=Labour

Lib Quantity (Con je 4%


vie nego Lab)

n.a.

Zabiljeka:
(Ponekad se intervalne varijable nadalje razlikuju na one sa
real zero point koje se zovu racio varijable, ali ta distinkcija nije
potrebna u drutvenim naukama)

U Tabeli 13.6, ne samo da vidimo primjer razliitih tipova varijabli, ve


vidimo i saetak dodatnih informacija potrebnih za kodiranje varijable na
viem nivou od nivoa ispod varijable u tabeli, ovo je takoer dodatna
informacija dodijeljena takvim kodiranjem. Dummy varijable ili lane
varijable smatraju se varijablama s najniim nivoom informacija prisustvo
ili odsustvo atributa. Opisi u uobiajenom jeziku obino se sastoje od niza
podataka (ovjek ima plave oi).Prianje o atributima omoguava nam da
poveemo razliite atribute istog tipa (ovjek ima jedno plavo oko i jedno
zeleno oko). U trenutku kada se pomaknemo do nominalnog nivoa
procjenjujemo da su atributi meusobno iskljuivi; osoba moe glasati
samo za jednu politiku partiju, tako da kod Konzervativca ne implicira niti
Radniku partiju niti Liberalnog demokrata. Kada napravimo dodatni korak
do ordinalnog nivoa uvodimo dodatni koncept koji nam omoguava da
posloimo vrijednosti po redoslijedu te takoer uvodi se mogunost
pogrenog kodiranja prema u odnosu na ovaj koncept kao to je to sluaj s
primjerom u tabeli, gdje komentatori raspravljaju o tome da li su Radnika
partija i Liberalni demokrati zamijenili strane u smislu ljevice i desnice.
Kada priamo o varijablama, moramo napraviti jo jednu distinkciju i to
izmeu varijabli koje pokuavamo objasniti (dependent variables zavisne
varijable) i varijable koje korisitimo kako bi ih objasnili (independent
variables nezavisne varijable). U primjeru koji smo ranije koristili, kvalitet
demokratske vladavine je bila zavisna varijabla jer smo pokuavali
odgovoriti
na
pitanje
Od
ega
zavisi
kvalitet
vladavine?.
Rasprostranjenost mrea i postojanje preduzetnikog talenta su bile
nezavisne varijable jer u toj analizi nismo pitali od ega one zavise. (Ipak u
nekoj drugoj vrsti istraivanja neka od ovih varijabli veoma lako moe biti
zavisna, ako bi recimo pitali od ega zavisi postojanje preduzetnikog
talenta.)
Jedinice i nivoi analize
Kvalitativna kao i kvantitativna analiza moe se usredotoiti na vie
razliitih tipova jedinki (tijela). Mogu se analizirati drave, godine, regije,
gradovi, kole, ljudi i dogaaji te mnoge druge stvari. Jedinke koje
analiziramo se nazivaju jedinicama analize ili sluajevima. Broj sluajeva
oznaava se simbolom N , kao to smo ve ranije spomenuli. Jedinice
analize mogu se razlikovati na osnovu nivoa analize kojoj pripadaju:
nacionalna jedinica je na viem nivou nego gradska jedinica, koja je opet
na viem nivou od fizikog lica koje ivi u tom gradu ili dravi. U Tabeli 13.6
primjer intervalne varijable je primjer varijable izmjerene na viem nivou,

ne samo viem nivou mjerenja, ve i analize. Kako bi mogli rei da je


radnika partija dobila 43% glasova, moramo govoriti o kumuliranju
podataka o individualcima (najvjerovatnije svi oni koji glasaju na
odreenim izborima u odreenoj zemlji). Poto analize vieg nivoa tako
esto ukljuuju informacije o veem broju osoba, podaci koji se odnose na
takve analize esto se zovu aggregate data agregatnim podacima.
Drugi primjeri u tabeli dvosmisleni (nejasni) u smislu da se mogu odnositi
na politike partije kao i na osobe) , ali je vea vjerovatnoa da postoje
varijable koje se mjere na individualnom nivou analize.
Iako je mogue baviti se istraivakim pitanjima koja ukljuuju upite to se
odnose na razliite nivoe analize, vano je da nam bude jasno kako su te
jedinice meusobno povezane. Ovo je istinito kako u kvalitativnim, tako i
kvantitativnima studijama, ali kod velikih N-studija lake se zbuniti o nivou
analize razliitih komponenti studije. Najbitnija stvar koju treba shvatiti o
nivou analize jeste da tipovi varijabli koje nalazimo na razliitim nivoima
imaju tendenciju da budu razliiti. Ve je spomenuto da s podacima na
individualnom nivou dobijamo jako malo intervalnih varijabli kako bismo
pronali primjer varijable na intervalnom nivou koja se odnosi na stranke
morali smo se pomjeriti na agregatni nivo analize. Nadalje, podaci na
individualnom nivou obino sadre veliki nivo greke ili noise buke. Ljudi
prave greke kada otvaraju na anketna pitanja ili kada popunjavaju
formulare. Osobe koje uestvuju u anketi ne uspijevaju da razumiju pitanja
koja im bivaju postavljena , a ne razumiju ni odgovore koje daju. to je
najvanije, uvijek postoji nepovezanost izmeu osobe koja kreira pitanja
(samim i tim kodni sistem za takva pitanja) i osobe koja odgovara na takva
pitanja (koja daje vrijednosti koje e biti kodirane). Zbog ovog razloga,
pitanja esto ne uspijevaju komunicirati tano znaenje kako je to
prvobitno smiljeno. Sve ovo rezultira grekom. Openito postoji mnogo
manje greke kod podataka na viem nivou jer je greki na individualnom
nivou izraunat prosjek tokom procesa agregacije. Takoer, prije emo
pronai intervalne varijable u agregatnim podacima jer sam in agregacije
stvara varijable koje izraunjavaju broj (ili proporciju ili procent) osoba u
razliitim kategorijama ili s razliitim karakteristikama. Konzervativac s
glasanjem u procentima (agregatni fenomen) je intervalna varijabla, dok je
ista varijabla na individualnom nivou (oni koji su glasali za konzervativce)
nominalna varijabla, kao to smo ve vidjeli.
Ovo se moe initi kao dobar razlog da se fokusiramo na agregatne radije
nego na individualne podatke, ali postoji problem izvoenja ponaanja na
individualnom nivou iz podataka na agregatnom nivou i obrnuto.
Naprimjer, otkrivanje injenice da su drave SAD-a okarakterisane s veom
crnakom populacijom ujedno drave s veim stepenom nepismenosti ne
dozvoljava nam da zakljuimo kako su crnci ti koji e prije biti nepismeni. U
uvenom lanku (Robinson 1950) otkriveno je da u takvim dravama nije
postojala razlika u nivou pismenosti izmeu bijelaca i crnaca. I bijelci i
crnci su bili ti koji imaju veu ansu da budu nepismeni u dravama u

kojima ivi vei broj crnaca. Greka zakljuivanja o vezama na


individualnom nivou iz rezultata na agregatnom nivou naziva ecologic
fallacy. Postoji takoer individualistic falacy individualistika greka
koja se odnosi na zakljuivanje o vezama na agregatnom nivou iz veza na
individualnom nivou. Naprimjer, snana pozitivna veza na individualnom
nivou izmeu obrazovanja i glasanja se ne prenosi na pozitivnu vezu na
nacionalnom nivou. Naprotiv, dvije zemlje koje imaju ponajbolje obrazovne
sisteme na svijetu (SAD i vicarska) spadaju meu najloije kada je u
pitanju izlaznost na izbore. (Franklin 2004).
Stoga se podaci moraju skupljati i analizirati na nivou analize koji je
prikladan istraivakom pitanju koje se postavlja i analitiari trebaju
izbjegavati s generalizacijama na razliitom nivou analize od nivoa
podataka koji su doveli do rezultata. Takoer, openitiji zahtjev koji se
odnosi na sve tipove istraivanja (kvantitativnog ili kvalitativnog), paljivog
promiljanja o tome kako se varijable mjere i o zakljucima koji se mogu
izvui iz razliitih tipova varijabli koje se koriste na razliite naine. Greka
u mjerenju je uvijek prijetnja zakljuku, kako u kvalitativnom, tako i u
kvantitativnom radu (vidjeti King, Keohane and Verba 1994).

Statistika
Kako bi razgovarali o kvantitativnom istraivanju i rezultatima istog,
moramo se koristiti statistikom. U tehnikom smislu, statistika predstavlja
koefcijente koji saimaju stvari od interesa (bitne stvari) o podacima.
Statistika je takoer procedura kojom osoba dolazi do takvih koefcijenata,
inae jo poznatija kao statistika analiza. Procent ili prosjek jeste
statistiki koefcijent (inae se jo naziva descriptive statistic deskriptivna
statistika jer opisuje tijelo podataka), ali ono to je mnogo interesantnije
drutvenim naunicima su koefcijenti koji se odnose na pitanja koja smo
saeli ranije: Koliko rasprostranjeno? Koliko snano? Koliko znaajno? Poet
emo s posljednjim od ova tri.
Koliko znaajno?
Znaaj se odnosi na vjerovatnost pogreke prilikom davanja neke
tvrdnje. Statistiki metodi omoguavaju nam da odredimo koliki su izgledi
da smo u krivu po pitanju zakljkuaka izvuenih iz sluajnog uzorka.
Nadalje, veina istraivaa koristi ove metode na bilo kojem datasetu za
koji ne postoji razlog sumnje u njegovu reprezantitivnu prirodu. Pitanje
znaaja moe se primjeniti na tzv. POINT ESTIMATES POJEDINANE
PROCJENE PARAMETARA POPULACIJE (naprimjer statistika nam moe rei
koliko je mogue da smo u krivu ako procijenimo da e Demokrati dobiti
53% glasova na sljedeim Predsjednikim izborima u SAD-u); ali i mnogo
interesantnija drutvenim naunicima su pitanja odnosa izmeu varijabli.
Ukoliko uzmemo raniji primjer veze izmeu zastupljenosti mrea i kvalitete
demokratske vladavine, bilo bi korisno da znamo da su anse kako su veze

pronaene od strane Putnama i Smyrla znaajne to jeste,


vjerovatnost da su one sluaj happenstance odnosno da
rijedak sluaj da ga moemo zanemariti, naprotiv takve
pronaliziti konstantno kako budeemo istraivali u drugim
zemljama.

da je mala
su to tako
veze emo
regijama i

Tri stvari odreuju znaajnost veze (odnosa):


1) Snaga veze (odnosa);
2) Broj ispitanih sluajeva kada se uspostavlja veza (odnos)
3) Nivo (izvjesnosti ) prije nego to smo voljni da iskaz proglasimo
istinitim.
Ponimo sa zadnjom od ove tri odrednice (ako nam je potrebno 100%
izvjesnosti certitude to jo nazivamo confidence pouzdanje)
uslijedit e zakljuak da nijedna veza nije znaajna. Po prirodi su svi
drutveni iskazi probabilistiki (vjerojatnosni) (bilo da se do tih iskaza
dolo kvalitativnom ili kvantitativnom metodom). Industrijski standard u
kvantitativnim drutvenim naukama je da se iskaz prihvata kao istinit
ukoliko je vjerovatnoa da e u 95% sluajeva biti onako kako je
generalizovano, to je isto kao da smo rekli da e iskaz u 5% sluajeva biti
pogrean. zbog toga se o ovom znaaju govori kao o znaaju na nivou
0,05 significance at the 0,05 level.
Treba napomenuti da ovo nije veoma strog test. Ako 5% situacija prema
kojim otkrie moe biti generalizovano ne uspije pokazati vezu na koju se
istraivanje odnosi, to znai e se jedna od dvadeset situacija pokazati
neuspjenom u pokazivanju te veze.
Ako elimo veu izvjesnost
certitude, moramo sprovesti stroi test; npr. zahtijevajui znaaj na
nivou 0,01 significance at the 0,01 level, to bi impliciralo da smo u
krivu samo jednom u 100 sluajeva kada generaliziramo iz rezultata
istraivanja. Meutim za ovo nam je potrebno vie sluajeva, kao to emo
u produetku teksta objasniti.
Ukoliko elimo tvrditi da postoji veza izmeu obima drutvenih mrea i
dobre demokratske vladavine, bit e bolje da ispitamo to je vie mogue
sluajeva u dolasku do takve tvrdnje. Ukoliko ispitamo svaki mogui
relevantni sluaj i otkrijemo da svaki takav sluaj pokazuje istu vezu bili
bismo dosta sigurni u nau tvrdnju. S adekvatnim sluajnim uzorkom
sluaja, moemo rei koliko smo sigurni da e svi neispitani sluajevi
pokazati iste veze kao one pronaene meu ispitanim sluajevima.
Dovoljno sluajeva moe prikazati bilo koju vezu znaajnom, tako da s
dovoljnim brojem sluaja pitanje znaaja prestaje biti zanimljivo; ali
openito to je vie sluajeva, to je bolje.
Ipak, bitno je shvatiti da i kod relativno malog N, veze mogu biti znaajne
ukoliko su dovoljno snane, to je trea stvar potrebna za znaaj, dok je
prva predstavljena u gornjem dijelu teksta. Kao to do sada ve treba biti

poznato, potrebno je mnogo sluajeva kako bi se utvrdilo da je slaba veza


znaajna, dok se dosta snana veza moe utvrditi ak i s relativno malo
sluajeva. U neobinim situacijama u kojima bi oekivali definitivne
(iskljuive) veze kao to su: Svi X-ovi su Y-i ili nijedan X nikad nije Y, samo
nam je potrebno dovoljno sluajeva kako bismo izbacili greku u mjerenju.
Ukoliko oekujemo da emo pronai manje
deterministiku
(predodreenu) vezu (a veina veza u drutvenim naukama je via
probabilistika, a ne deterministika, kao to je ve spomenuto), onda nam
je potrebno vie sluajeva kako bi bili sigurna u svoje nalaze, svoje
rezultate istraivanja.
Koliko snano?
Kako bi odredili koliko je snana veza, moramo odrediti koliinu promjene u
zavisnoj varijabli koja dolazi s promjenama u nezavisnim varijablama. Mala
promjena e prije biti happenstansical sluajnost koja moe biti
zanemarena, nego to e to biti sluaj s velikom promjenom, ali to je
bitnije, mala promjena nije pretjerano interesantna ak iako bi se pokazala
znaajnom. Kada govorimo o snagama veza
100
80
60
40
20
0
________________________
Low
High
Popularity of Conservative leader
%

Fig. 13.1 Chances of a Conservative electoral victory

prisjetimo se grafikona koji ima zavisnu varijablu poredanu vertikalnom


osi, dok je nezavisna varijabla poredana du horizontalne osi. Za odreeno
kretanje u horizontalnoj osi moemo itati odgovarajue kretanje u
vertikalnoj osi, kao to je prikazano na Slici 13.1.
Na tom grafikonu vidimo kako se anse za pobjedu Konzervativaca
poveavaju sa samo 20% na oko 60% kako se popularnost lidera
Konzervativne partije poveava s niske popularnosti na visoku. Ovo
predstavlja razliku od 40% ILI effect efekt od 0.4, s obzirom da je
efekt, utjecaj inae predstavljen kao proporcija).
Veza koja se moe vidjeti u ranijim tabelama, moe se veoma lako
konvertirati u grafikon kao to je onaj 13.1 i to tako to emo unositi
procente u tabelu u smjeru zavisne varijable. U Tabeli 13.2 zavisna
varijabla (kvalitet dem. Vladavine) ide prema dolje; tako sputamo procent
i vidimo da 67% regija sa rasprostranjenim drutvenim mreama (2 od 3)
imaju visoko-kvalitetnu vladavinu, a 0% regija bez rasprostranjenih mrea

vide visoko-kvalitetnu vladavinu. Oduzimajui dolazimo do zakljuka da


drutvene mree prave razliku od 67-0 = 67% na kvalitet vladavine ( to
znai da drutvene mree imaju utjecaj na vladavinu od 0.67). To je
poprilino snaan utjecaj (efekt) na skali od 0 do , to bi ako se pretvori u
grafikon znailo jo strmije opadanje krivulje nego to je to sluaj s
Figurom 13.1. Strmost krivulje u ovom primjeru podudara se s naom
intuicijom da jedna iznimka Putnamovog pravila ne postie mnogo; ali mali
broj sluajeva bi iskljuio utjecaj tako da ne bude statistiki znaajan, ak
iako su sluajevi izabrani sluajnim uzorkom.
Korelacije izmeu varijabli
U ovom trenutku moramo malo skrenuti s teme kako bismo razgovarali o
korelacijama. Radije nego da se pozovemo na utjecaj jedne varijable na
drugu varijablu, kada se suoavaju s dvije varijable drutveni naunici
esto govore o korelaciji izmeu varijabli, koja se najee oznaava
simbolom r (ili ponekad R). R oznaava relationship (vezu), i kada
priamo o vezama izmeu varijabli ne zahtijeva se od nas da razlikujemo
zavisne i nezavisne varijable. Dvije varijable su povezane ukoliko njihove
vrijednosti imaju tendenciju da se pomjeraju zajedno (vii ljudi imaju
tendenciju da budu tei, tako da postoji veza izmeu visine i teine).
Takoer se kae kako postoji veza negativna veza ukoliko dvije varijable
imaju tendenciju da se pomjeraju obrnuto (to su oblaci gui, to je dan
mraniji). Ukoliko obje varijable imaju skalu od 0 do 1 (ili, ako se obje
mjere prema istoj skali), mjere korelacije e iznositi otprilike iste vrijednosti
kao i utjecaji o kojima smo priali. Utjecaj od 0.4 i 0.67 na koje smo
upuivali bi se podudarao s korelacijama od 0.4 i 0.67, ili bi bili veoma
blizu podudaranja. Ipak, korelacije su poeljne za koritenje u odreene
svrhe, s obzirom da vrijednost korelacijskog koefcijenta ne ovisi o skali
mjerenja predmetnih varijabli. Ukoliko bismo istraivali vezu izmeu dobi u
godinama i prihoda u eurima, utjecaj dobi na prihod bi sigurno bio puno
vei od 1.0 (poveanje od jedne godine u dobi bi rezultiralo u prihodu
veem za nekoliko stotina eura) to bi bilo teko protumaiti (interpretirati),
jer bi korelacijski koefcijent bio u dometu od
-1.0 do +1.0, isto kao to
je sluaj s koefcijentima o kojima smo ve govorili. Tabela 13.7 pokazuje
priblino nezavisno znaenje koje se moe pripisati korelacijskim
koefcijentima razliitih znaaja kada koristimo podatke na individualnom
nivou i agregatne podatke (granice nisu vrste i mnogi bi ih analitiari
osporili).

Tabela 13.7 Snaga korelacije

Snaga korelacije

Interpretacija s
podacima na
individualnom nivou

Interpretacija s
agregatnim
podacima

nR = 0.00-0.06

Trivijalno

Trivijalno

nR = 0.07-0.19

Beznaajno

Trivijalno

nR = 0.20-0.34

Umjereno

Beznaajno

nR = 0.35-0.49

Snano

Umjereno

nR = 0.50-0.65

Spektakularno

Snano

nR = 0.66-0.80

Visoko spektakularno

Jako snano

nR = 0.81-0.95

Sumnjivo

Spektakularno

nR = 0.96-1.00

Veoma sumnjivo

Sumnjivo

Napomena: Interpretacija se odnosi na r za bivarijabilne analize i


R2 za multivarijabilne analize (vidjeti tekst dolje).
Kao to smo ranije kazali, teko je pronai snane veze izmeu podataka
na individualnom nivou jer oni koji kreiraju kategorije pitanja, obino nisu
oni koji odgovaraju na ista, tako da ta injenica moe dovesti do brojnih
nesporazuma. Takoer, osobe su ponekad nesigurno i kako odgovoriti na
pitanja koja tano razumiju i takoer nisu u stanju da se zamaraju kako bi
paljivo razmislili o pojedinim pitanjima. Ovo rezultira velikim stepenom
greke koja je u velikoj mjeri odsutna kod agregatnih podataka, ili je
uprosjeena kada se podaci na individualnom nivou agregiraju (skupe se u
grupu). Stoga oekujemo snanije korelacije [i snanije efekte (utjecaje)] s
agregatnim podacima, nego to je to sluaj s podacima na individualnom
nivou. Podaci na individualnom nivou iznad 0.8 su doista toliko neobini da
bi se izvukla generalizacija kako je analiza uraena pogreno ili da neto s
podacima nije u redu. esto, kod takvih sluajeva, analitiar je upotrijebio
dvije varijable koje su u stvarnosti razliite mjere iste stvari, tako da su
pronalaci tautoloki (gr. tautologija nain izraavanja u kojem se isti
sadraj izrava dva puta, na razliit nain). S agregatnim podacima,
korelacije iznad 0.9 su prilino ostvarljive (ipak neobine) i samo korelacije
iznad 0.95 sugeriraju na testiranje tautolokih veza.
Koliko rasprostranjeno?
Opseg do kojeg je odreena veza rasprostranjena je pitanje broja situacija
u kojima se moe pronai. Veza koja se moe pronai samo tamo gdje
postoje rasprostranjene drutvene mree je manje rasprostranjena, nego
veza koja se nalazi tamo gdje drutvenih mrea nema. Odreivanje
injenice koliko je neka veza rasprostranjena zahtijeva koritenje vie
nezavisnih varijabli kako bi se precizirale razliite okolnosti na koja se ta
veza odnosi ili ne odnosi. U Putnamovom primjeru, poeli smo s vezom
izmeu mrea i vladavine koja je se odravala (koja je pila vode) samo u

sluaju kada je prisutno bilo i preduzetnitvo, tako da se ova veza nije


pokazala toliko rasprostranjena, kao to je to Putnam u poetku smatrao.
Za vezu koja je odriva samo u odreenim uvjetima kaemo da je
subject to an interaction (podlona interakciji). U ovom sluaju
postojala je interakcija (meusobno djelovanje) izmeu preduzetnitva i
obima drutvenih mrea, koja je bila takva da je svaka imala utjecaj jedino
u sluaju prisustva druge. Kako bi testirale interakcijski utjecaj (interaction
effect) potrebno je upotrijebiti znatan broj nezavisnih varijabli, po jednu
varijablu za svaku okolnost u kojoj bi utjecaj mogao ili ne bi mogao biti
istinit. Meutim, znatan broj nezavisnih varijabli potreban nam je i iz
drugog razloga, razloga na koji emo se okrenuti sada.
Multivarijabilna analiza
Do sada smo, osim u sluaju kada smo spominjali Putnamovu tezu, govorili
samo o takozvanim bivarijabilnim vezama, odnosno vezama koje
moemo pronai kada se jedna zavisna varijabla provjerava u odnosu na
jednu nezavisnu varijablu. Neuobiajeno objanjavati bilo ta o svijetu s
bivarijabilnim vezama, uglavnom zato to postoji toliko greke u naim
podacima (pogotovo u podacima na individualnom nivou) greke koja
esto mora biti mjerena i precizirana kako bi se tano procijenili utjecaji
(efekti) predmetne varijable (varijable od interesa). to je jo vanije,
drutveni svijet je kompleksno mjesto. Sve okolnosti koje mogu utjecati na
rasprostranjenost veze (kao to je ve objanjeno) mogu takoer
doprinijeti objanjenju zavisne predmetne varijable. Kada upotrijebimo
dodatne nezavisne varijable, kaemo kako na taj nain elaboriramo
(elaborate) nae objanjenje, kao to je spomenuto u uvodnom paragrafu
ovog poglavlja. Zaista, potreba da se u obzir uzme vie simultanih utjecaja
(efekata) na zavisnu varijablu ee se pojavljuje u praksi nego potreba da
se u obzir uzmu interakcijski utjecaji (efekti). Ipak, u trenutku kada se
odmaknemo dalje od bivarijabilne analize, potrebni su nam novi alati za
razmiljanje o vezama i kada koristimo takve alate kae se kako provodimo
multivarijabilnu analizu.
Strogo govorei, analiza koju smo obavili u tabelama 13.3 i 13.4 su
multivarijabilne analize jer je u njima ukljuena vie od jedne nezavisne
varijable. Meutim, alati koje smo koristili (tabele, procenti, procentne
razlike) su bili alati bivarijabilne analize. Kada se pomjerimo ka
multivarijabilnoj analizi efekte (utjecaje) moramo posmatrati kroz
jednaine i ovo je jo jedan korak koji je mnogim drutvenim naunicima
poprilino izazovan osim ako im se ne objasni da su jednaine
jednostavan alat koji koriste svaki put kad dodaju trokove koje oekuju da
e imati kada im se dostavi sljedei raun za mobilni telefon.
Tipini raun za mobilni telefon je rezultat zbira pretplate + dodavanje
iznosa za pozive koji prelaze maksimum ukljuen u pretplatu + iznos koji
se dodaje za pozive u roamingu + moda dio za pdv itd. Rezultat je zbir
koji se moe izraziti sljedeom jednainom.

Totalni dug = mjesena pretplata + naplaene minute *po


naplata roaminga *po minuti u roamingu

minuti

(Moda treba dodati jo jednu komponentu za porez). U jednaini, znak


plus (+) oznaava zbrajanje, a zvjezdica, asterisk (*) mnoenje. Ljudima je
obino veoma jednostavno pomnoiti broj minuta sa cijenom po minuti i
broj roaming minuta sa cijenom roaming minute i da nakon toga saberu
dva takva rezultata s mjesenom pretplatom kako bi dobili cijenu
konanog duga. Problem poinje kada se rijei koje stoje u gore pomenutoj
jednaini zamijene simbolima, kao to je sluaj:
Y=a+b1X1+b2X2
Ovdje je totalni dug zamijenjen simbolom Y, pretplata simbolom a, broj
minuta koji nisu uraunati u pretplatu simbolom X i donjim indeksom 1 i
broj minuta u roamingu sa simbolom X i donjim indeksom 2.
Svako b je naplata po minuti za odgovarajui broj minuta (takoer s
prikladnim donjim indeksom).
Koritenje simbola umjesto rijei, ustvari je jako moan trik.
Zdravorazumski uvijek koristimo sibmol Y da slui kao zavisna varijabla i X
(s razliitim donjim indeksima) da oznaava razliite zavisne varijable.
Svako b mjeri utjecaj relevantnog X na zavisnu varijablu. Simbol a se
uvijek koristi da bi se oznaila konstanta, koja bi mogla biti 0 (nula) ako
npr. na telefonskom raunu ne bi bilo mjesene pretplate (ULTRA). Iz
priloenog vidimo da jednainu moemo proiriti sa mnogo vie X-ova, bez
da nam ponestane prostora u liniji i pojmovno moemo govoriti o tome ta
radimo bez da koristimo neke specifine primjere stvarnih varijabli. U
Putnamovom primjeru, moemo napisati jednainu koju emo implicitno
evaluirati isto kao gore, gdje e Y predstavljati kvalitet demokratske
vladavine, X1 obim drutvenih/politikih mrea i X2 za postojanje
preduzetnitva. U praksi, u ovom primjeru konstanta (a) je implicitno 0
(nula) jer je kvalitet vladavine bio tako nizak u nedostatku dva potrebna
uvjeta. Napomenuti treba, kako ne moemo u stvarnosti procijeniti utjecaje
(efekte) prisutne u Tabeli 13.2 bez znaajnog kruenja.
Jedini efekt (utjecaj) koji smo izraunali 0.67 utjecaj mrea na kvalitet
vladavine u sluaju kada je prisutno preduzetnitvo to se naziva partial
effect parcijalni utjecaj (efekt), odnosno utjecaj koji postoji samo u
specifinim okolnostima. Za izraunavanje efekata (utjecaja) nezavisnih
varijabli na zavisne varijable u multivarijabilnoj analizi, dostupno nam je
nekoliko alata, ali onaj u najiroj upotrebi je regression analysis
regresijska analiza.

Regresijska analiza
[Ispitivanje ovisnosti jedne zavisne (regresand) varijable o jednoj
(ili vie) nezavisnih (regresorskih) varijabli s ciljem da se utvrdi
analitiki izraz takve povezanosti (model).
Osnova regresijske analize je regresijski model.
Regresijski model - algebarski model kojim se analitiki izraava
statistilki odnos meu pojavama.
Model: - deterministiki (funkcionalan)
- statistiki (stohastiki).
Deterministiki model - za svaku vrijednost nezavisne varijable X
jednoznano je odreena vrijednost zavisne varijable Y.
Y fX

Statistiki model - vrijednost zavisne varijable Y nije jednoznano


odreena za zadanu vrijednost nezavisne varijable X.

Y f X e
pri emu je :
- funkcionalna (deterministika) komponenta
e stohastika varijabla koja predouje nesistematske utjecaje
na zavisnu varijablu.

Korelacijska analiza - metode utvrivanja pokazatelja jakosti i


smjera statistikih veza meu pojavama.

Regresijski model koji sadri jednu zavisnu, (Y) i jednu nezavisnu


varijablu (X) je model jednostavne regresije, a model koji sadri
jednu zavisnu i dvije ili vie nezavisnih varijabli je model
viestruke (multiple) regresije.

Model jednostavne regresije:


Y f X e

Model viestruke (multiple) regresije:


Y f X 1 , X 2 ,... X j ,... X k e

Regresijska analiza

Ovaj tip analize svoje je ime dobio na vrlo neuobiajen nain, i to iz


injenice da su ga razvili genetiari kako bi prouavali nain na koji
potomci koji su vii ili nii od svojih roditelja imaju tendenciju da raaju
djecu ija visina je regresivna po tom pogledu. U ovom kratkom uvodu
nema potrebe da objanjavamo kalkulacije koje su oni obavljali. Sve to je
potrebno znati jeste da za svaku zavisnu varijablu Y, regresijska analiza
proizvodi vrijednosti za konstantu a i vrijednosti za svaki od b koji se
koriste za istraivanje predmetnih veza. Analitiari moraju obezbijediti
podatke za Y i za svaki od X-ova, koji e se obino nalaziti u data matrixu
podatkovnoj matrici kao u jednoj od ranije prezentovanih. Koristei iste
podatke iz Tabele 13.5, moemo istraiti da li se pretpostavlja da e nivo
izlaznosti na Izborima za Evropski parlament u razliitim zemljama biti
povezan s izlaznou na sljedee nacionalne izbore, zajedno s korekcijom
na prisilno glasanje (zemlje s prisilnim glasanjem imaju puno veu
izlaznost na Izborima za EU parlament nego druge zemlje.) Rezultati se
mogu izraziti sljedeom jednainom:
EPizlaznost = 24.7 + 0.30*Nacionalnaizlaznost
glasanje+7.2*Prvo glasanje za EP

32.9*Prisilno

Ova jednaina nam govori kako je strop izlaznosti na Izbore za EP otprilike


25%, na ta se moe dodati mala proporcija (0.30) prethodnih nacionalnih
izbora, ali s korekcijom koja se dodaje od skoro 33% u zemljama s
obaveznim glasanjem i dodatnih 7.2% u sluaju prvog glasanja za EP u
jednoj zemlji. Naravno izvlaenje tih informacija iz outputa statistikog
paketa nije potpuno jasno. Tabela 13.8 reproducira (prikazuje) dio tog
outputa iz tipinog softverskog paketa. Imena varijabli pojavljuju se na
lijevoj strani (zavisna varijabla je na vrhu). Koefcijenti u sljedeoj koloni su
oni koefcijenti koji se koriste u jednaini.
Epturnout

Coeff.

s.e.

Prob

Natturnout

0.30

0.18

1.66

0.10

Compulsory

32.90

3.30

9.95

0.00

First

7.16

2.90

2.47

0.02

(Constant)

24.67

14.02

1.76

0.08

Broj observacija

64

F(3,60)

66.38

Prob > F
0.00
R2

0.77

Adjusted R2
0.76
Drugi koefcijenti e biti objanjeni kasnije, ali kolumna pod naslovom Prob
(Nekada je Prob skraeno P) daje nivo znaaja od po svakog utjecaja.
injenica da utjecaj nacionalne izlaznosti ima vjerovatnost od 0.10 da e
biti laan govori nam da izlaznost na Izborima za EP vjerovatno nije pod
utjecajem nacionalne izlaznosti na prethodnim izborima, tako da bi u
praksi, prema tome ova komponenta trebala biti eliminisana. (I bit e
elimisana u Tabeli 13.9 kako ova pria bude odmicala.)
Output iz regresijskog programa nam takoer govori o R 2 koji je povezan s
analizom, kao, meu drugim statistikama. R2 bez iznenaenja je kvadrat
od R (ili r) koefcijent koji se esto koristi da bi se objasnile bivarijabilne
veze o kojima smo prethodno govorili. Vrijednost R je kvadratna u
multivarijabilnoj analizi dijelom zbog toga to je s vie nezavisnih varijabli
lake postii visoku R vrijednost. Kada je ovaj koefcijen kvadratni (R 2),
dolazimo do manjeg koefcijenta koji je prikladniji za upotreb u
multivarijabilnoj analizi (proporcija proporcije je manja proporcija
naprimjer, polovina polovine je etvrtina.) Kako bi evaluirali vrijednosti R 2 ,
moemo se koristiti Tabelom 13.7 radi interpretacije razliitih vrijednosti r.
Spektakularan multivarijabilni nalaz (rezultat) na individualnom nivou je
onaj koji proizvede R2 iznad 0.5, dok s agregatnim podacima R2 treba biti
iznad 0.8 kako bi bio spektakularan itd. Tabela 13.8 sadri listu adjusted R 2
prilagoenog R2, to je vrijednost koja se obino prikazuje. U ostatku
ovog dijela, opisat emo analizu koja uslijedila nakon otkria (ilustriranog u
Tabeli 13.8) da izlaznost na nacionalne izbore nije znaajno utjecala na
izlaznost na Izbore za Evropski parlament. Ovo otkrie nas je iznenadilo,
jer bi Izbori za EP trebali biti sekundarni u odnosu na nacionalne izbori koji
su primarni (Reif and Schmitt 1980), demonstrirajui tako karakteristike
nacionalne situacije, prije nego karakteristike koje se odnose na same
Izbore za EP. Prema tome, iako je prirodno teoretizirati da je primarna
determinanta izlaznosti na Izbore za EP izlaznost na nacionalnim izborima,
relevantni koefcijent nije znaajan u Tabeli 13.8.
Table 13.9. European Election turnout (3)
Model A
Nezavisne

Model B

(s.e.)

0.30

(0.18)

varijable
Nacionalna

Model C
(s.e.)

Model D
(s.e.)

(s.e.)

izlaznost
Prisilno

32.90

(3.30)**

36.22

(2.66)**

38.30

(2.98)**

7.15

(2.90)*

8.30

(3.86)*

1.51

(5.38)

9.41

47.15

38.62

(2.74)**

(6.34)

10.92

(3.31)**

(1.66)**

47.14

(1.65)**

glasanje
Prvo
glasanje za
EP
Prvo
glasanje
*Ne-prisilna
(konstanta

24.67

(14.02)

47.80

(1.62)**

)
Prilagoeno

0.76

0.75

0.75

0.76

64

64

64

64

R2
N

Napomena: Zavisna varijabla je Epturnout (izlaznost na izbore za EP);


p=*0.05, **0.01.
Tabela 13.9 predstavlja rezultate serije razliitih regresijskih analiza
(opisanih kao modeli u tabeli), svaka regresijska analiza koristi razliite
nezavisne varijable, kako bi u koracima itaoca provela kroz rezultate koji
su doveli do odbacivanja intuitivno prihvatljivije teorije i prihvatanja
modela (koji bi za neke mogao biti iznenaujui) koji ne koristi nacionalnu
izlaznost na izbore kao nezavisnu varijablu. Tabela je postavljena na nain
uobiajen kod savremenih novinskih lanaka, s imenima nezavisnih
varijabli niz krajnju lijevu kolumnu i onda par koefcijenata za svaku
varijablu za svaki model. Prvi u svakom paru koefcijenata za svaki model je
koefcijent primarnog interesa odnosno b koefcijent koji se moe uzeti iz
outputa kompjuterskog programa (kao to je ilustrirano u Tabeli 13.8) i
preneseno u jednainu (kao to je ona koju smo ranije prezentovali). Drugi
koefcijent kod svakog para naziva se s.e. (to znai standard error
standardna greka koefcijenti koji se mogu pronai i u Tabeli 13.8), koja
mjeri koliko greke je u svakom b koefcijentu ; nekad se standardna greka
u zagradi pojavljuje pod njenim korespondirajuim b koefcijentom. Za
svrhe ovog poglavlja nije nuno shvatanje ovih koefcijenata, ali oni se
koriste da bi odredio nivo znaaja efekta (utjecaja) (Prob koefcijenti u
Tabeli 13.8), koje su onda u publiciranim tabelama poput Tabele 13.9
prikazane s jednom ili vie zvijezda nakon koefcijenta. Kljuno pitanje na
koje ti koefcijenti daju odgovor jeste Koliko je greke u b koefcijentu u
relaciji s njegovom veliinom?; kako nivo greke prilazi ili prelazi veliinu
koefcijenta, znaajnost se smanjuje. U Tabeli 13.9, koefcijentima je dodana
jedna zvijezda kako bi se pokazalo da im je znaaj na nivou 0.5 i dvije
zvijezde ako im je znaaj na nivou 0.01. Meutim postoje i druga pravila.
Znaenje zvijezdica koje se dodaju koefcijentima uvijek je objanjeno u

fusnoti ispod tabele. Kada podaci dolaze i sluajnih uzoraka, imamo samo
ansu 1 od 100 da pogrijeimo kada tvrdimo da su utjecaji (efekti) s dvije
zvijezdice ** stvarni. U posljednja dva reda, na dnu svakog modela
prezentovan je broj sluajeva koji su ukljueni u analizu (N) i R 2 povezan s
analizom, koji smo ve opisali u vezi s Tabelom 13.8.
Na osnovu poprilino minimalistikog uvoda, moemo nadalje objasniti
zato je intuitivno prihvatljivije stajalite (Ono da izlaznost na izbore za EP
zavisi od izlaznosti na nacionalne izbore) odbaeno rad objanjenja koje ni
ne spominje nacionalne izbore.
Model A je model koji je ve prezentovan u Tabeli 13.8, koji je ponovljen u
referentne svrhe. Ovo je teoretski oekivani model u kojem se ipak
nacionalna izlaznost ne pokazuje znaajno utjecajnom na izlaznost na EP
izbore. (bez zvijezdica za efekt od 0.30).
U Modelu B vidimo ta se deava kada jednostavno otklonimo nacionalu
izlaznost iz modela. Drugim varijablama se malo povea utjecaj, ali utjecaj
prvih izbora je i dalje znaajan samo na nivou 0.05 i odstupanje (varijanca)
koja je objanjena (R2) se isto tako malo sputa. Postoje miljenja, da
moda pogreno specificiramo nau varijabl prvih izbora, jer teoretski
injenica da postoji neto posebno kod izbora ne bi trebalo utjecati na
izlaznost u zemlji koja ve ima uvedeno prisilno glasanje. Specificiranje
adekvatne interakcije izmeu prvih izbora i prisilnog glasanja, izraa novi
Model C u kojem se pokazuje da nijedna od ovih varijabli nije znaajna, ali
interakcijsku utjecaj je snaniji od dva utjecaja. Poto su prvi izbori bili
znaajni kada su bili jedina mjera koncepta (Model B), neuspjeh te
varijable da se pokae znaajnom kada je popraena svojom novom
varijacijom (u Modelu C) moe biti jer dvije varijable veinom mjere istu
stvar (to se naziva multicollinearity multikolinearnost). Postoji nekoliko
naina da se uhvatimo u kotac s multikolinearnou, ali u ovom primjeru
jednostavno to radimo eliminacijom manje snane od dvije alternativne
mjere. Rezultat je onda Model D, gdje su svi utjecaji jako znaajni i
objanjeno odstupanje (varijanca) je tamo gdje je bila i kod Modela A.
(Franklin 2001.)

Daljni koraci
Jo uvijek ima mnogo toga da se naui o kvantitativnoj analizi. Naroito,
postoje mnogi tipovi multivarijabilne analize, od kojih su mnoge
dizajnirane za specijalne istraivake situacije, a izbor meu njima bit e
odreen najee prirodom podataka koji se analiziraju. Naprimjer, podaci
u kojima sluajevi predstavljaju razliite vremenske periode zahtijevaju
cijeli set specijaliziranih postupaka, kao to zahtijevaju i podaci izmjereni
na razliitim nivoima agregacije.
Ipak, regresijska analiza je neto to se moe smatrati industrijskim
standardom za multivarijabilnu analizu. Biti u mogunosti da razumijemo

koefcijente predstavljene u naunim radovima koji dolaze od regresijske


analize (zajedno s vokabularom koji se koristi kako bi se opisali takvi
koefcijenti) je dug put pred svakim drutvenim naunikom. Njihova
sposobnost da obavljaju regresijsku analizu u njihovom vlastitom radu i
istraivanju pomoi e im da budu kritini konzumeri takvih istraivakih
nalaza (rezultata). Takva vjetina e najvjerovatnije pokriti veinu situacija
s kojim se mogu sresti u svijetu kvantitativnog istraivanja.
Ovo poglavlje je takoer ilustrovalo mogunost kvantitativne analize koja
se esto zna predvidjeti. esto se zna rei da znanstveni metod postupa
deduktivno testirajui propozicije koje proizlaze iz teorija koja su nastale
negdje drugdje (iz nekih drugih istraivanja). Ono to je tipinije za sluaj
drutvenog istraivanja (ne samo u drutvenim naukama) je primjer koji
moemo vidjeti u prethodnom dijelu koji opisuje nae razumijevanje naina
elaboriranja izlaznosti na Izbore za Evropski parlament. Naunici ne koriste
podatke samo kako bi testirali svoju teoriju. Oni podatke koriste da bi
preispitali svoje teorije i/ili da bi doli do novih. Arhimed je otkrio svoj
Princip posmatrajui plavljenje vode iz svoje kade i doslovno svako
znanstveno otkrie bazira se na kraju zasniva na posmatranju. Nekad je
posmatranje direktno (Arhimed, Putnam), a nekad indirektno, kada se
bazira na analizi podataka prikupljenih za druge svrhe, kao to je sluaj s
primjerom u Tabeli 13.9. Ova veoma bitna distinkcija je obraena u
drugom dijelu ove knjige.
Veliki dio onoga to znamo o svijetu bazira se na analizi podataka, i ovo je
pogotovo istinito kada govorimo o drutvenoj nauci. U ovim disciplinama,
poveznice (veze) esto tako kompleksne da je mnoge varijable potrebno
posmatrati i manipulirati simultano (istovremeno) kako bi se kontrolirale
sve stvari koje se deavaju u svijetu, a koje nisu primarni interes, ali mogu
kontaminirati nae nalaze (rezultate) istraivanja.
Jako esto se jasan pogled jedino moe dobiti kvantitativnom analizom
podataka. Takav jasan pogled e generalno biti na visokom nivou
apstrakcije, ali iako apstraktan; moe uveliko pomoi onima koji provode
studije sluaja kako bi odluili na ta da se fokusiraju, isto kao to studije
sluaja mogu pomoi kvantitativnim istraivaima da odlue ta mjeriti.

You might also like