6) Procjena Razlike Dva Parametra Populacija Koristeci Interval Pouzdanosti

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

Procjena razlike

dva parametra populacija


koristedi interval pouzdanosti
• Cilj:
– Formirati interval pouzdanosti (confidence interval) za
Procjena razlike procjenu razlike između dva parametra populacije
dva parametra populacija • dvije aritmetičke sredine populacija μ1 – μ2
koristedi interval pouzdanosti • dvije proporcije populacija p1 – p2
• Interval pouzdanosti Ci (confidence interval):
Tačka procjene ± (kritična vrijednost)(standardna greška)
Prof. dr. Mugdim Pašid
• Tačka procjene
– za razliku aritmetičkih sredina populacije μ1 – μ2 je
razlika aritmetičkih sredina uzoraka je 𝑥1 − 𝑥2
– za razliku proporcija populacija p1 – p2 je razlika
proporcija populacija 𝑝1 − 𝑝2 2

Dvije populacije
Standardne devijacije
populacija σ1 i σ2 poznate, Nezavisni uzorci
popul. nor. dist. ili n1 i n2  30

Procjena (μ1 - μ2) Standardne devijacije • Uzorak uzet iz jedne populacije nema uticaj na
Nezavisni uzorci populacija σ1 i σ2 nepoznate, uzorak uzet iz druge populacije
n1 i n2  30
• Uzorci nisu u odnosu
Standardne devijacije
populacija σ1 i σ2 nepoznate,
n1 ili n2 < 30
Procjena razlike
Proporcije
dva parametra
Procjena (p1 - p2)
populacija

Procjena (μ1 i μ2)


Upareni uzorci
3 4

Dvije populacije Nezavisni uzorci,


Standardne devijacije
populacija σ1 i σ2 poznate, σ1 i σ2 poznate
popul. nor. dist. ili n1 i n2  30

Procjena (μ1 - μ2) Standardne devijacije


populacija σ1 i σ2 nepoznate, Standardne devijacije
Nezavisni uzorci populacija σ1 i σ2 poznate,
n1 i n2  30
popul. nor. dist. ili n1 i n2  30
Standardne devijacije
populacija σ1 i σ2 nepoznate, Procjena (μ1 - μ2) Standardne devijacije
n1 ili n2 < 30 Nezavisni uzorci populacija σ1 i σ2 nepoznate,
Procjena razlike n1 i n2  30
Proporcije
dva parametra
Procjena (p1 - p2) Standardne devijacije
populacija
populacija σ1 i σ2 nepoznate,
n1 ili n2 < 30

Procjena (μ1 i μ2)


Upareni uzorci
5 6 6

1
Nezavisni uzorci, Nezavisni uzorci,
σ1 i σ2 poznate σ1 i σ2 poznate
• CI = Tačka procjene ± (kritična vrijednost)(standardna greška)
• Standardne devijacije populacija su poznate
• Tačka procjene: 𝑥1−𝑥2
• Distribucije populacija su normalne ili n1 i n2  30 • Standardna greška za 𝑥1−𝑥2 :
• Za procjenu razlike aritmetičkih sredina populacije 2 2
σ1 σ
koristiti razliku između dvije aritmetičke sredine  2
uzorka n1 n2
• Prilikom računanja intervala pouzdanosti (CI) • Interval pouzdanosti (CI) razlike dvije aritmetičke sredine
koristiti z test populacije μ1 - μ2:
• Ako n1 i n2 nije  30 distribucije populacije trebaju biti
x 
2 2
σ1 σ
normalne 1  x 2  zα/ 2  2
n1 n2
7 8

Nezavisni uzorci, σ1 i σ2 poznate Nezavisni uzorci, σ1 i σ2 poznate


Zadatak Zadatak (nastavak)
• Lanac prodavnica odjede je napravio istraživanje da • Pošto su standardne devijacije populacija
izračuna razliku u vremenu provedenom u poznate i pošto su uzorci  30 koristi se z test
prodavnicama između muškaraca i žena.
• Prethodne studije su pokazale da su standardne • Za 95% interval pouzdanosti iz tabele se očita
devijacije dužine boravka u prodavnici za muškarce 11 kritična vrijednost z/2  z0,025  1,96
minuta, a za žene 16 minuta.
• Uzeti su nezavisni uzorci od 100 muškaraca i 100 žena • Tačaka procjene je:
u različito vrijeme i u različitim prodavnicama i
dobijeno prosječno vrijeme boravka za muškarce 34,5
 
x1  x 2  34,5  42,4  7,9 minuta
minuta, a za žene 42,4 minute,. • Standardna greška je
• Izračunati razliku dvije aritmetičke sredine vremena 2 2
σ1 σ 112 162
koje u prodavnicama provedu muškarci i žene (μ1 – μ2  2  
) koristedi 95% interval pouzdanosti. n1 n2 100 100
9 10

Nezavisni uzorci, σ1 i σ2 poznate Nezavisni uzorci,


Zadatak (nastavak) σ1 i σ2 nepoznate, n1 i n2  30
• Interval pouzdanosti je

x 
2 2
σ1 σ
1  x 2  zα/ 2  2
n1 n2 Standardne devijacije
populacija σ1 i σ2 poznate,
11 16 2 2 popul. nor. dist. ili n1 i n2  30
 7,9  1,96   7,9  3,8056
100 100 Procjena (μ1 - μ2) Standardne devijacije
Nezavisni uzorci populacija σ1 i σ2 nepoznate,
-11,7056 -4,0944
-7,9 n1 i n2  30

Standardne devijacije
3,8056 3,8056 populacija σ1 i σ2 nepoznate,
n1 ili n2 < 30
• Na osnovu 95% intervala pouzdanosti i uzoraka žene u
prosjeku provode više vremena u prodavnicama od
muškaraca između 4,0944 i 11,7056 minuta
11 12

2
Nezavisni uzorci, Nezavisni uzorci,
σ1 i σ2 nepoznate, n1 i n2  30 σ1 i σ2 nepoznate, n1 i n2  30
• Za procjenu standardne devijacije populacije • CI = Tačka procjene ± (kritična vrijednost)(standardna greška)
koristi se standardna devijacija uzorka • Tačka procjene: 𝑥1−𝑥2
• Standardna greška za 𝑥1−𝑥2 :
• Prilikom računanja intervala pouzdanosti (CI)
2 2
koristiti z test s1 s
 2
n1 n2
• Interval pouzdanosti (CI) razlike dvije aritmetičke sredine
populacije μ1 - μ2:

x 
2 2
s1 s
1  x 2  zα/ 2  2
n1 n2
13 14

Nezavisni uzorci, Nezavisni uzorci,


σ1 i σ2 nepoznate, n1 i n2  30 σ1 i σ2 nepoznate, n1 i n2  30
Primjer Primjer (nastavak)
• Menadžer želi da utvrdi razliku u vremenu (broj • Pošto su standardne devijacije populacija
dan) od prvog oglašavanja do prodaje stanova u nepoznate i pošto su uzorci  30 koristi se z
dva grada A i B
• Uzeo je uzorke od 60 stanova u oba grada i dobio test sa standardnim devijacijama uzoraka
sljedede podatke: • Za 99% interval pouzdanosti iz tabele se očita
Grad A : x1  39,4 dana Grad B : x 2  36,1 dana kritična vrijednost
s1  5 dana s2  4,3 dana
z/2  z0,005  2,575
• Izračunati razliku dvije aritmetičke sredine
vremena koje prođe od oglašavanja do prodaje • Tačaka procjene je
stanova u gradovima A i B, (μ1 – μ2), koristedi
99% interval pouzdanosti. x 1 
 x 2  39,4  36,1  3,3 dana
15 16

σ1 i σ2 nepoznate, veliki uzorci


Nezavisni uzorci,
Primjer
σ1 i σ2 nepoznate, n1 ili n2< 30
Interval pouzdanosti je:  x  x   z
2 2
s s
• 1 2 α/ 2
1 2
n n 1 2

52 4,32 Standardne devijacije


3,3  2,575   3,3  2,192
60 60 populacija σ1 i σ2 poznate,
1,108 3,3 5,492 popul. nor. dist. ili n1 i n2  30

Procjena (μ1 - μ2) Standardne devijacije


2,192 2,192 Nezavisni uzorci populacija σ1 i σ2 nepoznate,
n1 i n2  30

Standardne devijacije
• 99% interval pouzdanosti za procjenu razlike dvije populacija σ1 i σ2 nepoznate,
aritmetičke sredine broja dana od oglašavanja do n1 ili n2 < 30

prodaje stanova u gradovima A i B kaže da je ta


razlika između 1,108 i 5,492 dana.
17 18

3
Nezavisni uzorci, Nezavisni uzorci,
σ1 i σ2 nepoznate, n1 ili n2< 30, σ1 i σ2 nepoznate, n1 ili n2< 30
• Pošto se pretpostvlja da su varijanse populacija
• Standardne devijacije populacija su nepoznate jednake, za procjenu standardne devijacije
populacije (σ) koristi se zajednička standardna
• Pretpostavke: devijacija s p (pooled standard deviation)
– Populacije su normalno distribuirane
– Populacije imaju iste varijanse
sp 
n1  1s12  n2  1s2 2
• Koristiti t test sa (n1 + n2 – 2) stepeni slobode n1  n2  2

• Pa se ovaj test naziva i t test zajedničke varijanse


(pooled variance t test)
19 20

Nezavisni uzorci,
Nezavisni uzorci,
σ1 i σ2 nepoznate, n1 ili n2< 30
σ1 i σ2 nepoznate, n1 ili n2< 30
Primjer
• CI = Tačka procjene ± (kritična vrijednost)(standardna greška)
• Farmaceutska kompanija je htjela da utvrdi razliku između
• Tačka procjene: 𝑥1−𝑥2 prosječnog vremena kod muškaraca i žena koje prođe od trenutka
1 1
• Standardna greška za 𝑥1−𝑥2 : sp  uzimanja novog lijeka do trenutka kada se lijek detektuje u krvi.
n1 n2 • Uzet je slučajni uzorak 6 muškaraca i 8 žena
• Interval pouzdanosti (CI) razlike dvije aritmetičke sredine Muškarci : x1  13,6 minuta Žene: x 2  11,2 minuta
populacije μ1 - μ2: s1  3,1 minuta s2  5,0 minuta

 
x1  x 2  tα/ 2 s p
1 1

n1 n2
• Populacije su normalno distribuirane sa jednakim varijansama
• Izračunati razliku dvije aritmetičke sredine vremena koje prođe od
uzimanja novog lijeka do detekcije lijeka u krvi kod muškaraca i
• gdje t/2 ima (n1 + n2 – 2) stepeni slobode i
žena, (μ1 – μ2), koristedi 95% interval pouzdanosti.
sp 
n1  1s12  n2  1s2 2
n1  n2  2 21 21 22

Nezavisni uzorci, Nezavisni uzorci,


σ1 i σ2 nepoznate, n1 ili n2< 30 σ1 i σ2 nepoznate, n1 ili n2< 30
Primjer (nastavak) Primjer (nastavak)
• Pošto su • Za 95% interval pouzdanosti i za 12 stepeni
– standardne devijacije populacija nepoznate slobode ...
– n1 ili n2 < 30 – broj stepeni slobode d.f=(n1 + n2 -2) = 6 + 8 -2 = 12
– varijanse populacija iste • iz tabele se očita kritična vrijednost: t/2  t0,025  2,1788
– populacije su normlano distribuirane
• Tačaka procjene je:  x1  x 2   13,6  11,2  2,4 minuta
• Koristi se t test zajedničke varijanse • Zajednička standardna devijacija je
• Interval pouzdanosti je:
x1 
 x 2  tα/ 2 s p
1 1

n1 n2 sp 
n1  1s12  n2  1s2 2 
( 6  1 )3,12  ( 8  1 )52
 4,31
n1  n2  2 682
23 24

4
Nezavisni uzorci, Nezavisni uzorci,
σ1 i σ2 nepoznate, n1 ili n2< 30 σ1 i σ2 nepoznate, n1 ili n2< 30,
Primjer (nastavak) varijanse populacija nisu iste
• CI = Tačka procjene ± (kritična vrijednost)(standardna greška)
• Interval pouzdanosti je:  x  x   t s n1  n1
1 2 α/ 2 p
• Tačka procjene: 𝑥1−𝑥2
s12 s22
1 2

2,4  2,1788( 4,31)


1 1
  2,4  5,0715 • Standardna greška za 𝑥1−𝑥2 : 
6 8 7,4715
n1 n2
-2,6715 2,4
• Interval pouzdanosti (CI) razlike dvije aritmetičke sredine
5,0715

• Iz razloga što interval prelazi nulu menadžer ne


5,0715 populacije μ1 - μ2:
x 1 
s12 s22
 x 2  tα/ 2
n1

n2
može zaključiti da postoji razlika dvije aritmetičke t/2  t vrijednost iz t distribucije sa stepenima slobode(df) :
sredine vremena koje prođe od uzimanja novog
( s12 / n1  s22 / n2 ) 2
lijeka do detekcije lijeka u krvi kod muškaraca i df 
 ( s12 / n1 ) 2 ( s22 / n2 ) 2 
 
žena  n 1  n 1 
25  1 2  26

Upareni uzorci
Standardne devijacije
populacija σ1 i σ2 poznate, Upareni uzorci
popul. nor. dist. ili n1 i n2  30

Procjena (μ1 - μ2) Standardne devijacije • Testiranje aritmetičkih sredina dvije odnosne
Nezavisni uzorci populacija σ1 i σ2 nepoznate, populacije
n1 i n2  30 – Vrijednosti u jednom uzorku su uparene sa
Standardne devijacije vrijednostima u drugom uzorku
populacija σ1 i σ2 nepoznate, – Nazivaju se i zavisni uzorci
n1 ili n2 < 30
Procjena razlike
Proporcije • Koristi se razlika uparenih vrijednosti:
dva parametra
populacija
Procjena (p1 - p2) 𝑑 = 𝑥1 − 𝑥2
• Pretpostavka:
– Obje populacije su normalno distribuirane ili su
uzorci veliki, n1 i n2  30
Procjena (μ1 i μ2)
Upareni uzorci
27 28

Upareni uzorci Upareni uzorci


• i-ta uparena razlika je: 𝑑𝑖 = 𝑥1𝑖 − 𝑥2𝑖 • Interval pouzdanosti je:
𝑠𝑑
• Tačka procjene za aritmetičku sredinu uparene 𝑑 ± 𝑡𝛼/2
𝑛
razlike: 𝑛
𝑖=1 𝑑𝑖
𝑑= 𝑔𝑑𝑗𝑒 𝑡𝛼/2 𝑖𝑚𝑎 (𝑛 − 1) 𝑠𝑡𝑒𝑝𝑒𝑛𝑖 𝑠𝑙𝑜𝑏𝑜𝑑𝑒
𝑛
• n je broj parova (uparenih vrijednosti) u uparenim uzorcima
n je broj parova (uparenih vrijednosti) u uparenim
• Standardna devijacija uzorka za uparene razlike uzorcima
𝑖=𝑛 𝑖=𝑛
− 𝑑 )2
𝑖=1 (𝑑𝑖 − 𝑑 )2
𝑖=1 (𝑑𝑖
𝑠𝑑 = 𝑠𝑑 =
𝑛−1 𝑛−1
29 30

5
Upareni uzorci Upareni uzorci
Primjer Primjer (nastavak)
• Novi proizvođač loptica za golf je, koristedi Trenutne Nove
Igrač loptice loptice
nove tehnologije, proizvela nove loptice. 1 278 285
• Da bi testirala koliko daleko mogu otidi loptice 2 299 301
kada ih igrač udari uzeli su loptice od 3 280 276
4 295 300
konkurentske kompanije (trenutne loptice) i 5 268 273
svoje loptice (nove loptice). 6 301 299

• 6 profesionalnih igrača golfa je svaku lopticu


• Izračunati razliku prosječne udaljenosti do koje
udarilo jedanput.
loptice proizvedene od konkurentskog proizvođača
• Rezultati su dati u sljededoj tabeli: (trenutne loptice) i novog proizvođača (nove
loptice) koristedi 95% interval pouzdanosti.
31 31 32

Upareni uzorci Upareni uzorci


Primjer (nastavak) Primjer (nastavak)
• Tačka procjene: Trenutne Nove • Standardna devijacija uparenih uzoraka
Igrač loptice loptice di
1
2
278
299
285
301
-7
-2 sd 
 (d i  d )2
 4,36
n 1
3 280 276 4
4 295 300 -5 • Kritična vrijednost je t vrijednost iz t
5 268 273 -5
6 301 299 2 distribucije sa n-1 stepeni slobode
– (6-1)=5 stepeni slobode
d
d i

 7  2  4  5  5  2  13
  2,17 t/2  t0,025  2,5706
n 6 6

33 34

Upareni uzorci Upareni uzorci


Primjer (nastavak) Primjer (uraditi sam)
sd
• Interval pouzdanosti je: d  t/2 • Novi proizvođač loptica za golf je, koristedi
n
 2,17  2,5706
4,36
 2,17  4,58
nove tehnologije, proizveo nove loptice.
-6,75
6
-2,17 2,41
• Da bi testirao koliko daleko mogu otidi loptice
kada ih igrač udari uzeli su loptice od
4,58 4,58 konkurentske kompanije (trenutne loptice) i
svoje loptice (nove loptice).
• Iz razloga što interval prelazi nulu proizvođač novih
loptica ne može zaključiti da postoji razlika • 6 profesionalnih igrača golfa je svaku lopticu
prosječne udaljenosti do koje loptice proizvedene udarilo jedanput.
od konkurentskog proizvođača (trenutne loptice) i • Rezultati su dati u sljededoj tabeli:
novog proizvođača (nove loptice) koristedi 95%
interval pouzdanosti
35 36

6
Upareni uzorci Dvije proporcije populacija
Standardne devijacije
Primjer (uraditi sam - nastavak) populacija σ1 i σ2 poznate,
popul. nor. dist. ili n1 i n2  30
Trenutne Nove Standardne devijacije
Procjena (μ1 - μ2)
Igrač loptice loptice populacija σ1 i σ2 nepoznate,
Nezavisni uzorci
1 278 285 n1 i n2  30
2 299 301
3 280 276 Standardne devijacije
4 295 300 populacija σ1 i σ2 nepoznate,
n1 ili n2 < 30
5 268 273 Procjena razlike
Proporcije
6 301 299 dva parametra
Procjena (p1 - p2)
populacija
• Izračunati razliku prosječne udaljenosti do koje
loptice proizvedene od konkurentskog proizvođača
(trenutne loptice) i novog proizvođača (nove Procjena (μ1 - μ2)
loptice) koristedi 99% interval pouzdanosti. Upareni uzorci
37 38

Dvije proporcije populacija Dvije proporcije populacija


• Sampling distribucija od p1 – p2 imade • CI = Tačka procjene ± (kritična vrijednost)(standardna greška)
aproksimativno normalnu distribuciju ako je: • Tačka procjene za razliku dvije proporcije populacije je:
• n1p1  5 , n1(1-p1)  5 𝑝1− 𝑝2 (razlika proporcije uzoraka)
• n2p2  5 , n2(1-p2)  5 • Interval pouzdanosti (CI) razlike dvije proporcije populacije
• Pošto su p1 i p2 nepoznate koristi se p1 i p2 p1-p2:
(proporcije uzoraka) da se utvrdi da li je uzorak
dovoljno velik. p 1 
 p 2  z/2
p 1 (1  p 1 ) p 2 (1  p 2 )
n1

n2
• n1p1  5 , n1(1-p1)  5
• n2p2  5 , n2(1-p2)  5

39 40

Dvije proporcije populacija Dvije proporcije populacija


Primjer Primjer (nastavak)
• Jendo preduzede je napravilo promotivnu kampanju za • p1 = 240/425 = 0,565
novi proizvod.
• Menadžer kampanje želi da utvrdi kako osobe muškog i • p2 = 196/370 = 0,530
ženskog spola reagiraju na oglase u novinama. • Provjeriti da li uzorak dovoljno velik:
• Oglas je pokazan osobama iz slučajnog uzorka 425
muškaraca i 370 žena. • n1p1  5 , n1(1-p1)  5;
• Broj muškaraca (x1) kojima se sviđa oglas je bio 240, • (425)(0,565)  5 , (425)(1- 0,565)  5
dok je broj žena (x2) kojima se sviđa oglas je bio 196.
• Koristedi 95% interval pouzdanosti izračunati stvarnu • n2p2  5 , n2(1-p2)  5
razliku u proporciji muškaraca i žena kojima se sviđa • (370)(0,530)  5; (370)(1- 0,530)  5
oglas.

41 42

7
Dvije proporcije populacija Dvije proporcije populacija
Primjer (nastavak) Primjer (nastavak)
• Interval pouzdanosti je:  p1  p 2   zα/ 2 p1( 1  p1 ) p 2( 1  p 2 )

n1 n2
• Za 95% interval pouzdanosti iz tabele se očita (0,565)(1 0,565) (0,530)(1 0,530)
0,565  0,530  1,96   0,035  0,069
kritična vrijednost 425 370

z/2  z0,025  1,96 -0,034 0,035 0,104

• Tačka procjene je 0,069

p 
0,069

1  p 2  0,565  0,530  0,035


• Na osnovu 95% intervala pouzdanosti i uzoraka menadžer
zaključuje da je stvarna razlika u proporciji muškaraca i žena
kojima se sviđa oglas je između
-0,034 do 0,104.
• Šta se može iz ovoga rezultata zaključiti?
43 44

Dvije proporcije populacija


Primjer (nastavak)
• Pošto je uzorak 1 muškarci a uzorak 2 su žene
može se zaključiti ...
• ...da u jednom ekstremu 3,4% više žena vole
oglas nego muškarci ...
• ...dok u drugom ekstremu 10,4% više muškaraca
vole oglas nego žene.
• Pošto je nula uključena u interval može se desiti
da nema uopde razlike
• Stoga menadžer nije u mogudnosti zaključiti da
jedna grupa ili druga grupa više vole oglase za fast
food restorane od druge grupe.
45

You might also like