Samenvatting Statistiek

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 6

Binomiaal toets voor 1 proportie (H6)

Betrokken variabele
Alternatief verdeelde variabele A/Bernoulli verdeelde variable

0.7 p
0.6
0.5
1-p
Pr(A)

0.4
0.3
0.2
0.1 A
0 Alternatieve verdeling van A,
0 1
bijvoorbeeld met p=0.6

I. SCHATTEN

0.20

0.15
Pr(p)

0.10 Sampling distribution van 𝑝̂ ,


bijvoorbeeld met n=18, p=0.6
0.05
p - μ𝑝̂ = p
0.00
𝑝(1−𝑝)
- σ𝑝̂ = √ (=SE𝑝̂ )
𝑛

Puntschatting
𝐴
p = p̂ =
𝑛

Intervalschatting
- Wald methode (np̂ ≥ 5 en n(1-p̂) ≥ 5)
𝑝(1−𝑝)
p̂ - Zα(2) σ𝑝̂ < p < p̂ + Zα(2) σ𝑝̂ met Zα(2) = invNorm(area,=0,=1) en σ𝑝̂ = √ (=SE𝑝̂ )
𝑛

- Agresti-Coull methode (95% CI)

𝑝′(1−𝑝′ ) 𝑝′(1−𝑝′ ) 𝐴+2


p’ – 1.96√ < p < p’ + 1.96√ met p’ =
𝑛+4 𝑛+4 𝑛+4
II. TOETSEN

0.20

0.15
Pr(X)

0.10

0.05
X
0.00 Null distribution, bijvoorbeeld met
0 2 4 6 8 10 12 14 16 18 n=18, p=0.6, X=7

1. Statistische hypothesen
H0: p = p0
HA: p < p0 of p > p0 of p ≠ p0

2. Toetsingsgrootheid (test statistic)


Binomiaal verdeelde variabele X

3. P-waarde (P-value)
Linkszijdig toetsen
P = Pr(X ≤ x) = binomcdf(n, p0, x)
Rechtszijdig toetsen
P = Pr(X ≥ x) = 1- binomcdf(n, p0, x-1)
Tweezijdig toetsen
- als observed value (x) < expected value (np0),
dan P = 2Pr(X ≤ x) = 2*binomcdf(n, p0, x)
- als observed value (x) > expected value (np0),
dan P = 2Pr(X ≥ x) = 2*(1-binomcdf(n, p0, x-1))

4. Conclusie
- Als P > α, dan is P NIET significant, wordt H0 NIET verworpen en is het NIET
aannemelijk dat … (tweezijdige conclusie)
- Als P ≤ α, dan is P WEL significant, wordt H0 WEL verworpen en is het WEL
aannemelijk dat … (eenzijdige conclusie)

* Normale benadering van binomiale verdeling (n>30)


 continuïteitscorrectie toepassen:

Linkszijdig toetsen
P = Pr(X ≤ x + 0.5) = normalcdf(lower=-10^9, upper=x + 0.5, np0, √np0 (1 − p0 ))
Rechtszijdig toetsen
P = Pr(X ≥ x – 0.5) = normalcdf(lower+x – 0.5, upper=10^9, np0, √np0 (1 − p0 ))
Tweezijdig toetsen
P = 2Pr(X ≤ x + 0.5) = 2*normalcdf(lower=-10^9, upper=x + 0.5, np0, √np0 (1 − p0 ))
Of: P = 2Pr(X ≥ x – 0.5) = 2*normalcdf(lower=x – 0.5, upper=10^9 np0, √np0 (1 − p0 ))
Z-toets voor 1 gemiddelde (H10)
σY is bekend

Betrokken variabele
Normaal of willekeurig verdeelde variabele Y

Voorwaarden
De sampling distribution van ̅Y volgt een normale verdeling;
- als Y normaal verdeeld is, dan is ̅
Y ook normaal verdeeld
̅ bij benadering normaal verdeeld als n>30
- als Y willekeurig verdeeld is, dan is Y

0.05

0.04

0.03
f(Y)

0.02

0.01 Y
0 Normale verdeling van Y,
140 150 160 170 180 190 200 210 220 bijvoorbeeld met μ=180 cm=10
cm

I. SCHATTEN

0.30
0.25
0.20
Sampling distribution van 𝑌̅,
f(Y)

0.15
0.10 bijvoorbeeld met μ=180 cm,
=10cm, n=36
0.05
Y
0.00 - μ𝑌̅ = μY
140 150 160 170 180 190 200 210 220 σ𝑌
- σ𝑌̅ = (=SE𝑌̅ )
√𝑛

Puntschatting
μY = ̅
Y

Intervalschatting

̅
Y - Zα(2) σ𝑌̅ < μ < ̅
Y + Zα(2) σ𝑌̅ met Zα(2) = invNorm(area,=0,=1) en
σ𝑌
σ𝑌̅ = (=SE𝑌̅ )
√𝑛
II. TOETSEN

0.30
0.25
0.20
f(Y)

0.15
0.10
0.05
Y
0.00
Null distribution, bijvoorbeeld met
140 150 160 170 180 190 200 210 220
μ=180, =10, n=36, 𝑌̅=178

1. Statistische hypothesen
H0: μ = μ0
HA: μ < μ0 of μ > μ0 of μ ≠ μ0

2. Toetsingsgrootheid (test statistic)


Normaal verdeelde variabele ̅ Y

3. P-waarde (P-value)
Linkszijdig toetsen
P = Pr(Y ≤ y) = normalcdf(lower=-10^9, upper=y, μ0, σ𝑌̅ )
Rechtszijdig toetsen
P = Pr(Y ≥ y) = normalcdf(lower=y, upper=10^9, μ0, σ𝑌̅ )
Tweezijdig toetsen
̅) < expected value (μ0),
- als observed value (Y
dan P = 2Pr(Y ≤ y) = 2*normalcdf(lower=-10^9, upper=y, μ0, σ𝑌̅ )
̅) > expected value (μ0),
- als observed value (Y
dan P = 2Pr(Y ≥ y) = 2*normalcdf(lower=y, upper=E9, μ0, σ𝑌̅ )

4. Conclusie
- Als P > α, dan is P NIET significant, wordt H0 NIET verworpen en is het NIET
aannemelijk dat … (tweezijdige conclusie)
- Als P ≤ α, dan is P WEL significant, wordt H0 WEL verworpen en is het WEL
aannemelijk dat … (eenzijdige conclusie)
T-toets voor 1 gemiddelde (H11)
σY is onbekend

Betrokken variabele
Normaal of willekeurig verdeelde variabele Y

Voorwaarden
De sampling distribution van ̅Y volgt een normale verdeling;
- als Y normaal verdeeld is, dan is ̅
Y ook normaal verdeeld
̅ bij benadering normaal verdeeld als n>30
- als Y willekeurig verdeeld is, dan is Y

I. SCHATTEN

Puntschatting
μY = ̅
Y

Intervalschatting
s𝑌
̅
Y – tα(2),n-1 SE𝑌̅ < μ < ̅
Y + tα(2),n-1 SE𝑌̅ met tα(2),n-1=invT(area,df) met df=n-1en SE𝑌̅ =
√𝑛

II. TOETSEN

0.50

0.40

0.30
Pr(t)

0.20

0.10 t(n-1)
0.00
-5 -4 -3 -2 -1 0 1 2 3 4 5 Null distribution, bijvoorbeeld met
df=35

1. Statistische hypothesen
H0: μ = μ0
HA: μ < μ0 of μ > μ0 of μ ≠ μ0

2. Toetsingsgrootheid (test statistic)


𝑌̿− μ0
tn-1 verdeelde variabele
𝑠𝑌 ⁄√𝑛

3. P-waarde (P-value)
Linkszijdig toetsen
P = Pr(t ≤ tn-1) = tcdf(lower=-10^9, upper=tn-1, df)
Rechtszijdig toetsen
P = Pr(t ≥ tn-1) = tcdf(lower=tn-1, upper=10^9, df)
Tweezijdig toetsen
- als observed value (tn-1 ) < expected value (0),
dan P = 2Pr(t ≤ tn-1) = 2*tcdf(lower=-10^9, upper=tn-1, df)
- als observed value (tn-1) > expected value (0),
dan P = 2Pr(Y ≥ y) = 2*tcdf(lower=tn-1, upper=10^9, df)

4. Conclusie
- Als P > α, dan is P NIET significant, wordt H0 NIET verworpen en is het NIET
aannemelijk dat … (tweezijdige conclusie)
- Als P ≤ α, dan is P WEL significant, wordt H0 WEL verworpen en is het WEL
aannemelijk dat … (eenzijdige conclusie)

You might also like