Download as pdf or txt
Download as pdf or txt
You are on page 1of 35

Usporedba dviju

aritmetičkih sredina: t-
test
Uvod u deskriptivnu i inferencijalnu statistiku
14.12.2020.
Izv. prof. dr. sc. Irena Burić
Što je t-test?

• t–odnos se općenito odnosi na razlomak kod kojeg se u


brojniku nalazi neka vrijednost, a u nazivniku standardna
pogreška te vrijednosti
• t–odnos je najpoznatiji kod testiranja značajnosti razlika između
dvije aritmetičke sredine i u tom slučaju on pokazuje KOLIKO
JE PUTA NEKA RAZLIKA VEĆA OD SVOJE POGREŠKE


t Δ - razlika između dvije aritmetičke sredine
 σΔ- standardna pogreška razlike
Distribucija t-vrijednosti
• zamislimo sljedeći pokus:
• iz iste populacije izvlačimo neizmjerno velik broj parova velikih uzoraka
• izračunamo aritmetičke sredine uzoraka
• odredimo razlike između aritmetičkih sredina pojedinih parova uzoraka – d
• nacrtamo distribuciju tih razlika → aritmetička sredina te distribucije
jednaka je PRAVOJ RAZLICI, a standardna devijacija te distribucije
jednaka je STANDARDNOJ POGREŠCI RAZLIKE među aritmetičkim
sredinama
Distribucija t-vrijednosti
• zamislimo dalje da smo za svaku pojedinu razliku između dvije
aritmetičke sredine odredili i pripadajuću t-vrijednost tako što smo
izračunali omjer te razlike i pripadajuće standardne pogreške
razlike
• naposljetku, nacrtali smo i distribuciju tako dobivenih t-
vrijednosti

• Koliko bi iznosila aritmetička sredina ove distribucije?


• Kako bi izgledala distribucija t-vrijednosti?
Distribucija t-vrijednosti

→ako su uzorci dovoljno veliki, razlike između aritmetičkih sredina i


pripadajuće t-vrijednosti distribuirale bi se po NORMALNOJ
RASPODJELI s aritmetičkom sredinom koja iznosi 0 (0±3t) i kojoj
standardna devijacija približno odgovara izračunatoj standardnoj
pogrešci razlike

→t predstavlja jednu vrstu z–vrijednosti: kao i z, t predstavlja


odstupanje rezultata od aritmetičke sredine izraženo u terminima
standardne devijacije → t=1 znači da je neka nađena razlika među
aritmetičkim sredinama na jednoj standardnoj devijaciji raspršenja svih
slučajnih razlika koje se mogu dogoditi (pritom prava razlika iznosi 0)
Distribucija t-vrijednosti
• ako isti pokus ponovimo na malim uzorcima, razlike između
aritmetičkih sredina oko prave razlike u populaciji također će se
distribuirati po NORMALNOJ RASPODJELI
• ali distribucija njihovih pripadajućih t-vrijednosti neće biti
normalna, već će se t-vrijednosti distribuirati po tzv. t-
RASPODJELI
Distribucija t-vrijednosti
• oblik t-raspodjele ovisi o veličini uzorka tj. o STUPNJEVIMA
SLOBODE
• kao i normalna raspodjela, t-distribucija je zvonolika i
simetrična, ali je šira od normalne raspodjele tim više što je
veličina uzorka (tj. stupnjevi slobode) manja
• u normalnoj distribuciji 99.74% svih rezultata obuhvaćeno je
rasponom između M±3SD
• kod t-distribucija taj je postotak to manji što je manji uzorak:
t-distribucija je šira od normalne distribucije tim više što je
uzorak manji
t–distribucija
Stupnjevi slobode
• engl. “degrees of freedom” – df
• broj događaja koji pri izračunavanju neke statističke vrijednosti
mogu slobodno (nezavisno) varirati
• npr. ako u uzorku imamo 10 rezultata i izračunamo M, samo 9
devijacija pojedinačnih rezultata od aritmetičke sredine može
varirati; 10. devijacija mora iznositi točno onoliko koliko je
potrebno da suma svih devijacija od M iznosi 0
• npr. ako zbrajanjem 4 broja moramo dobiti 10, tada prva tri
broja biramo kako želimo, ali posljednji mora biti jednak razlici
između zbroja prva tri broja i broja 10
Stupnjevi slobode
• njihov broj ovisi o tome što je sve zajedničko u dvije skupine
rezultata koje uspoređujemo – npr. ako testiramo je li neka
distribucija “normalna”, onda opažene distribucije i idealne
(očekivane) distribucije imaju isti N, istu M i istu SD, pa zato
stupnjevi slobode iznose broj kategorija – 3
• ako provjeramo pripadaju li dva uzorka istoj ili različitim
populacijama, tada oba uzorka, prema nul-hipotezi, imaju istu
M, pa stupnjevi slobode iznose broj ispitanika prvog uzorka
minus 1 (za M prvog uzorka) + broj ispitanika drugog
uzorka minus 1 (za M drugog uzorka)
t - distribucija
• što t-distribucija nije, a što jest?
1. t-raspodjela nije distribucija rezultata na malom uzorku
2. t-raspodjela nije distribucija aritmetičkih sredina ili distribucija razlika
među aritmetičkim sredinama malih uzoraka oko prave aritmetičke
sredine ili prave razlike jer je ta distribucija normalna
3. t-distribucija jest distribucija t-odnosa kakva se dobiva kada se
računski određuje standardna pogreška aritmetičke sredine,
odnosno standardna pogreška razlike između dvije aritmetičke
sredine, a pri tome se u računu koristi standardna devijacija
uzorka (koja je to lošija procjena σ populacije što je N manji).
t-distribucija
• s obzirom da mi gotovo nikad ne raspolažemo s vrijednošću standardne
devijacije populacije, prilikom izračunavanja standardne pogreške razlike
koristimo se STANDARDNOM DEVIJACIJOM UZORKA
• kod velikih uzoraka, dobivamo uglavnom točnu procjenu standardne
devijacije razlika mnoštva uzoraka oko prave razlike među populacijama tj.
standardne pogreške razlike
• stoga, činjenica što u računu t-testa ne koristimo pravu standardnu
devijaciju populacije, ne uzrokuje odstupanje od t-distribucije od normalne
distribucije
• ali, kod MALIH UZORAKA, razlike između aritmetičkih sredina
(neizmjerno) velikog broja uzoraka distribuiraju se normalno oko prave
razlike, no izračunati t-odnosi ne distribuiraju se normalno, već po t-
distribuciji
Razina rizika ili nivo značajnosti – p
• p je vjerojatnost da ćemo u našem mjerenju dobiti t-vrijednost koja
će u apsolutnom smislu biti jednaka ili veća od određene granične t-
vrijednosti
• kada su UZORCI VELIKI, vjerojatnost da ćemo po slučaju dobiti t
koji će u apsolutnom smislu biti veći od 1.96 iznosi 5%; vjerojatnost
da ćemo po slučaju dobiti t koji će u apsolutnom smislu biti veći od
2.58 iznosi 1%
→ u distribuciji t-vrijednosti, kada su UZORCI VELIKI, apsolutna
t-vrijednost koja je jednaka ili veća od 1.96 može se pojaviti u
manje od 5% slučaja, a apsolutna t-vrijednosti koja je jednaka ili
veća od 2.58 može se pojaviti u manje od 1% slučajeva
Razina rizika ili nivo značajnosti – p

• 5% i 1% predstavljaju konvencionalne razine rizika ili nivoe


značajnosti
• najčešće se zapisuju kao p<0.05 i p<0.01
• obrnuto su proporcionalne STUPNJU SIGURNOSTI → ako je
razina rizika manja od 5%, stupanj sigurnosti je veći od 95%;
ako je razina rizika manja od 1%, stupanj sigurnosti je veći od
99%
Razina rizika
• uvriježeni kriteriji:
• RAZINA RIZIKA MANJA OD 5%: razlika mora biti barem 1.96 puta
veća od svoje pogreške (t>1.96) da bi se proglasila statistički
značajnom → svaka razlika koja se nalazi izvan intervala 0±1.96·σM1-M2
statistički je značajna
• RAZINA RIZIKA MANJA OD 1%: razlika mora biti barem 2.58 puta
veća od svoje pogreške (t>2.58) da bi se proglasila statistički
značajnom → svaka razlika koja se nalazi izvan intervala 0±2.58·σM1-M2
statistički je značajna

• Napomena: ovo vrijedi samo kad su uzorci veliki!!!


Tablica t-vrijednosti
• sadrže GRANIČNE t-VRIJEDNOSTI za određenu razinu rizika
i određene stupnjeve slobode:
• t-vrijednost koju smo mi dobili u svom istraživanju mora biti jednaka ili
veća od one u tablici da bismo taj parametar (npr. razliku između dvije
M) mogli proglasiti statistički značajnim uz odabranu razinu rizika
(najčešće je to razina rizika od 1% ili 5%)
Tablica t-vrijednosti
• što je uzorak manji, imamo manje stupnjeva slobode, a
granična t-vrijednost je veća pa je i kriterij za proglašavanje
neke razlike statistički značajnom je stroži
• primjer: kad imamo 10 stupnjeva slobode, granična t-vrijednost
uz nivo rizika p<0.05 (ili <5%) iznosi 2.23 (što je veće od
granične vrijednosti 1.96 koja se pronalazi kod velikih uzoraka)
→ razlika između dvije aritmetičke sredine mora biti barem 2.23
puta veća od svoje pogreške da bi je mogli smatrati statistički
značajnom uz p<0.05
Kad su uzorci veliki…
• kada dobijemo t>1.96, to znači da je razlika između dvije
aritmetičke sredine statistički značajna uz rizik od pogrešnog
zaključka manji od 5% (u 5 od 100 slučajeva, što je malo
vjerojatno, ovako velika razlika može se pojaviti slučajno) → dakle,
odabravši ovaj kriterij, odlučili smo se za RAZINU ZNAČAJNOSTI ili
NIVO RIZIKA manju od 5% (sa sigurnošću većom od 95% možemo
tvrditi da dobivena razlika nije rezultat djelovanja slučajnih faktora)
• kada nam je važno uzeti stroži kriterij, razliku između dvije
aritmetičke sredine uz t>2.58 proglašavamo statistički značajnom uz
rizik pogrešnog zaključka manji od 1% (u 1 od 100 slučajeva, što je
malo vjerojatno, ovako velika razlika može se pojaviti slučajno) →
odabrali smo razinu značajnosti ili nivo rizika manji od 1% (sa
sigurnošću većom od 99% možemo tvrditi da razlika nije slučajna)
Formule za računanje t-testa
• t-test na jednom uzroku
• t-test za velike nezavisne uzorke
• t-test za male nezavisne uzorke
• t-test za velike zavisne uzorke
• t-test za male zavisne uzorke
t-test na jednom uzroku
t-test na jednom uzorku
• koristi se za provjeravanje razlika između aritmetičke sredine
uzorka (M) i prave aritmetičke sredine (µ), pri čemu nam je
poznata vrijednost µ, ali ne i σ populacije
• računa se po formuli:

M  M-aritmetička sredina
t µ-aritmetička sredina populacije
M σM-standardna pogreška
aritmetičke sredine

df=N-1
Vježba 1
• Na nekom sveučilištu studenti u prosjeku uče 17 h tjedno.
Jedan student je primijetio da njegovi kolege iz studentskog
doma uče više od 17 h tjedno. Na skupini od 16 studenata koji
žive u domu utvrdio je da u prosjeku uče 21 h tjedno (uz
SD=6.80). Razlikuju li se studenti koji žive u domu od studenata
sveučilišta općenito u broju sati koje tjedno provedu u učenju?
• nul-hipoteza: nema razlike u broju sati učenja između studenata
koji žive u domu i ostalih studenata na sveučilištu
Vježba 1
1. izračunati standardnu pogrešku aritmetičke sredine: σM=1.70
2. izračunat t-test: t  M    21  17  2.35
M 1.70
3. odrediti stupnjeve slobode: df=N-1=16-1=15 → df=15
• dobivena t-vrijednost iznosi 2.35; za N=16 imamo 15 stupnjeva
slobode; uz razinu rizika od 1% i uz 15 stupnjeva slobode, granična
vrijednost t iznosi 2.947, a uz razinu rizika od 5% granična t-
vrijednost iznosi 2.132
• naša t-vrijednost je VEĆA OD GRANIČNE vrijednosti uz razinu rizika
od 5%, ali ne i uz graničnu vrijednost t uz rizik od 1% → to
zapisujemo ovako:
t=2.35, df=15, p<0.05, p>0.01
Vježba 1
• Interpretacija: Utvrđena je statistički značajna razlika u broju
sati provedenih u učenju tjedno između studenata koji žive u
studentskom domu i ostalih studenata na sveučilištu uz razinu
rizika od pogrešnog zaključka manju od 5%, ali ne i uz razinu
rizika manju od 1%. Studenti koji žive u domu uče veći broj sati
tjedno.
• praktično, to znači da sa sigurnošću većom od 95% možemo
tvrditi da ova razlika postoji i u populaciji, ali to isto ne možemo
tvrditi sa sigurnošću većom od 99%, odnosno vjerojatnost da
razlika ne postoji i u populaciji je manja od 5%, ali veća od 1%.
t-test: veliki nezavisni uzorci
2 nezavisne skupine ispitanika
N>30 ?
Standardna pogreška razlike između dvije
aritmetičke sredine – VELIKI NEZAVISNI
UZORCI

 M1  M 2   M1
2
 M 2 2

• σM1-M2 - standardna pogreška razlike
• σM1 – standardna pogreška aritmetičke sredine prvog uzorka
• σM2 – standardna pogreška aritmetičke sredine drugog uzorka
t-test: veliki nezavisni uzorci
• koliko je puta neka razlika veća od svoje pogreške možemo
odrediti tako što ćemo neku razliku podijeliti s njezinom
pogreškom → tako se dobiva t-odnos ili t-vrijednost

M1  M 2
t df=(N1-1)+(N2-1)
 M1   M 2
2 2
Vježba 2
• Na skupini od 500 dipl. ing. arhitekture i skupini od 500
profesora hrvatskog jezika primijenjen je test spacijalnih
sposobnosti i utvrđeni su sljedeći deskriptivni pokazatelji:
MA=120, SDA=10; MH=109, SDH=12
• istraživačko pitanje: je li razlika između MA i MH statistički značajna tj.
postoji li ova razlika i u populaciji?
• istraživačka (direktivna) hipoteza: diplomirani inženjeri arhitekture imaju
razvijenije spacijalne sposobnosti od profesora hrvatskog jezika
• H0=nema razlike u spacijalnim sposobnostima između diplomiranih
inženjera arhitekture i profesora hrvatskog jezika
Vježba 2
• Izračunati standardne pogreške aritmetičkih sredina:

𝑆𝐷 10 𝑆𝐷 12
𝜎𝑀 𝐴 = = = 0.447 ; 𝜎𝑀 𝐻 = = = 0.537
𝑁 500 𝑁 500

• Izračunati standardnu pogrešku razlike: σM1-M2= =0.70

• Izračunati t-omjer:
𝑀1 − 𝑀2 120 − 109
𝑡= = = 15.71
2 2 0.4472 + 0.5372
𝜎𝑀1 + 𝜎𝑀2

• Izračunati stupnjeve slobode: df=(N1-1)+(N2-1)=(500-1)+(500-1)=998


Vježba 2

• dobivena t–vrijednost je puno veća od granične 1.96, ali i 2.58,


što znači da je utvrđena razlika između dvije aritmetičke sredine
statistički značajna uz nivo rizika manji od 1%
• to se piše ovako: t=15.71, df=998, p<0.01
• pitanje: kako glasi interpretacija ovih rezultata?
Vježba 2
• utvrđena je statistički značajna razlika u prosječnom rezultatu
na testu spacijalnih sposobnosti između skupine dipl. ing.
arhitekture i skupine profesora hrvatskog jezika uz razinu rizika
manju od 1% - arhitekti postižu veće rezultate na testu
spacijalnih sposobnosti od profesora hrvatskog jezika
• praktično, to znači da sa sigurnošću većom od 99% možemo
tvrditi da ova razlika postoji i u populaciji tj. da po pitanju
spacijalnih sposobnosti arhitekti i profesori hrvatskog jezika
pripadaju dvjema različitim populacijama;
• ili, tako velika razlika može se po slučaju pojaviti u manje od 1%
slučajeva što je dovoljno maleno da nam bude prihvatljivo
t-test: veliki nezavisni uzorci
• statistička značajnost t - testa:
• t<1.96, p>0.05 (razlika nije statistički značajna; rizik od pogrešnog zaključka veći
je od 5%; ovako velika razlika po slučaju se dobiva u više od 5% slučajeva;
možemo biti sigurni više od 95% da razlika ne postoji i u populaciji)
• 1.96<t<2.58, p<0.05, p>0.01 (razlika je statistički značajna uz rizik pogešnog
zaključka manji od 5%, ali veći od 1%; ovako velika razlika se dobiva u manje od
5% slučajeva, ali više od 1% slučajeva; možemo biti sigurni više od 95%, ali
manje od 99% da razlika postoji i u populaciji)
• t>2.58, p<0.01 (razlika je statistički značajna uz rizik pogrešnog zaključka manji
od 1%; ovako velika razlika se po slučaju dobiva u manje od 1% slučajeva;
možemo biti sigurni više od 99% da razlika postoji i u populaciji)

• granične vrijednosti t=1.96 i t=2.58 vrijede samo ako su uzorci vrlo veliki (npr.
N=500) – što je N manji, granična vrijednost t mora biti veća da bi se neka razlika
proglasila statistički značajnom (pogledati u t-tablicu!)
t-test: veliki nezavisni uzorci
• ako je razlika između dviju aritmetičkih sredina uzoraka
statistički značajna, to znači da se aritmetičke sredine dviju
populacija međusobno razlikuju
• to ne znači da se svi individualni rezultati jedne populacije
razlikuju od svih individualnih rezultata druge populacije – može
biti “prekrivanja” distribucija
• pitanje: koliko velika treba biti razlika u aritmetičkim sredinama
(izražena u standardnim devijacijama) da se distribucije gotovo
uopće ne preklapaju?

You might also like