Professional Documents
Culture Documents
Predavanje 9
Predavanje 9
aritmetičkih sredina: t-
test
Uvod u deskriptivnu i inferencijalnu statistiku
14.12.2020.
Izv. prof. dr. sc. Irena Burić
Što je t-test?
t Δ - razlika između dvije aritmetičke sredine
σΔ- standardna pogreška razlike
Distribucija t-vrijednosti
• zamislimo sljedeći pokus:
• iz iste populacije izvlačimo neizmjerno velik broj parova velikih uzoraka
• izračunamo aritmetičke sredine uzoraka
• odredimo razlike između aritmetičkih sredina pojedinih parova uzoraka – d
• nacrtamo distribuciju tih razlika → aritmetička sredina te distribucije
jednaka je PRAVOJ RAZLICI, a standardna devijacija te distribucije
jednaka je STANDARDNOJ POGREŠCI RAZLIKE među aritmetičkim
sredinama
Distribucija t-vrijednosti
• zamislimo dalje da smo za svaku pojedinu razliku između dvije
aritmetičke sredine odredili i pripadajuću t-vrijednost tako što smo
izračunali omjer te razlike i pripadajuće standardne pogreške
razlike
• naposljetku, nacrtali smo i distribuciju tako dobivenih t-
vrijednosti
M M-aritmetička sredina
t µ-aritmetička sredina populacije
M σM-standardna pogreška
aritmetičke sredine
df=N-1
Vježba 1
• Na nekom sveučilištu studenti u prosjeku uče 17 h tjedno.
Jedan student je primijetio da njegovi kolege iz studentskog
doma uče više od 17 h tjedno. Na skupini od 16 studenata koji
žive u domu utvrdio je da u prosjeku uče 21 h tjedno (uz
SD=6.80). Razlikuju li se studenti koji žive u domu od studenata
sveučilišta općenito u broju sati koje tjedno provedu u učenju?
• nul-hipoteza: nema razlike u broju sati učenja između studenata
koji žive u domu i ostalih studenata na sveučilištu
Vježba 1
1. izračunati standardnu pogrešku aritmetičke sredine: σM=1.70
2. izračunat t-test: t M 21 17 2.35
M 1.70
3. odrediti stupnjeve slobode: df=N-1=16-1=15 → df=15
• dobivena t-vrijednost iznosi 2.35; za N=16 imamo 15 stupnjeva
slobode; uz razinu rizika od 1% i uz 15 stupnjeva slobode, granična
vrijednost t iznosi 2.947, a uz razinu rizika od 5% granična t-
vrijednost iznosi 2.132
• naša t-vrijednost je VEĆA OD GRANIČNE vrijednosti uz razinu rizika
od 5%, ali ne i uz graničnu vrijednost t uz rizik od 1% → to
zapisujemo ovako:
t=2.35, df=15, p<0.05, p>0.01
Vježba 1
• Interpretacija: Utvrđena je statistički značajna razlika u broju
sati provedenih u učenju tjedno između studenata koji žive u
studentskom domu i ostalih studenata na sveučilištu uz razinu
rizika od pogrešnog zaključka manju od 5%, ali ne i uz razinu
rizika manju od 1%. Studenti koji žive u domu uče veći broj sati
tjedno.
• praktično, to znači da sa sigurnošću većom od 95% možemo
tvrditi da ova razlika postoji i u populaciji, ali to isto ne možemo
tvrditi sa sigurnošću većom od 99%, odnosno vjerojatnost da
razlika ne postoji i u populaciji je manja od 5%, ali veća od 1%.
t-test: veliki nezavisni uzorci
2 nezavisne skupine ispitanika
N>30 ?
Standardna pogreška razlike između dvije
aritmetičke sredine – VELIKI NEZAVISNI
UZORCI
M1 M 2 M1
2
M 2 2
• σM1-M2 - standardna pogreška razlike
• σM1 – standardna pogreška aritmetičke sredine prvog uzorka
• σM2 – standardna pogreška aritmetičke sredine drugog uzorka
t-test: veliki nezavisni uzorci
• koliko je puta neka razlika veća od svoje pogreške možemo
odrediti tako što ćemo neku razliku podijeliti s njezinom
pogreškom → tako se dobiva t-odnos ili t-vrijednost
M1 M 2
t df=(N1-1)+(N2-1)
M1 M 2
2 2
Vježba 2
• Na skupini od 500 dipl. ing. arhitekture i skupini od 500
profesora hrvatskog jezika primijenjen je test spacijalnih
sposobnosti i utvrđeni su sljedeći deskriptivni pokazatelji:
MA=120, SDA=10; MH=109, SDH=12
• istraživačko pitanje: je li razlika između MA i MH statistički značajna tj.
postoji li ova razlika i u populaciji?
• istraživačka (direktivna) hipoteza: diplomirani inženjeri arhitekture imaju
razvijenije spacijalne sposobnosti od profesora hrvatskog jezika
• H0=nema razlike u spacijalnim sposobnostima između diplomiranih
inženjera arhitekture i profesora hrvatskog jezika
Vježba 2
• Izračunati standardne pogreške aritmetičkih sredina:
𝑆𝐷 10 𝑆𝐷 12
𝜎𝑀 𝐴 = = = 0.447 ; 𝜎𝑀 𝐻 = = = 0.537
𝑁 500 𝑁 500
• Izračunati t-omjer:
𝑀1 − 𝑀2 120 − 109
𝑡= = = 15.71
2 2 0.4472 + 0.5372
𝜎𝑀1 + 𝜎𝑀2
• granične vrijednosti t=1.96 i t=2.58 vrijede samo ako su uzorci vrlo veliki (npr.
N=500) – što je N manji, granična vrijednost t mora biti veća da bi se neka razlika
proglasila statistički značajnom (pogledati u t-tablicu!)
t-test: veliki nezavisni uzorci
• ako je razlika između dviju aritmetičkih sredina uzoraka
statistički značajna, to znači da se aritmetičke sredine dviju
populacija međusobno razlikuju
• to ne znači da se svi individualni rezultati jedne populacije
razlikuju od svih individualnih rezultata druge populacije – može
biti “prekrivanja” distribucija
• pitanje: koliko velika treba biti razlika u aritmetičkim sredinama
(izražena u standardnim devijacijama) da se distribucije gotovo
uopće ne preklapaju?