Professional Documents
Culture Documents
Samenvatting Statistiek
Samenvatting Statistiek
Samenvatting Statistiek
Betrokken variabele
Alternatief verdeelde variabele A/Bernoulli verdeelde variable
0.7 p
0.6
0.5
1-p
Pr(A)
0.4
0.3
0.2
0.1 A
0 Alternatieve verdeling van A,
0 1
bijvoorbeeld met p=0.6
I. SCHATTEN
0.20
0.15
Pr(p)
Puntschatting
𝐴
p = p̂ =
𝑛
Intervalschatting
- Wald methode (np̂ ≥ 5 en n(1-p̂) ≥ 5)
𝑝(1−𝑝)
p̂ - Zα(2) σ𝑝̂ < p < p̂ + Zα(2) σ𝑝̂ met Zα(2) = invNorm(area,=0,=1) en σ𝑝̂ = √ (=SE𝑝̂ )
𝑛
0.20
0.15
Pr(X)
0.10
0.05
X
0.00 Null distribution, bijvoorbeeld met
0 2 4 6 8 10 12 14 16 18 n=18, p=0.6, X=7
1. Statistische hypothesen
H0: p = p0
HA: p < p0 of p > p0 of p ≠ p0
3. P-waarde (P-value)
Linkszijdig toetsen
P = Pr(X ≤ x) = binomcdf(n, p0, x)
Rechtszijdig toetsen
P = Pr(X ≥ x) = 1- binomcdf(n, p0, x-1)
Tweezijdig toetsen
- als observed value (x) < expected value (np0),
dan P = 2Pr(X ≤ x) = 2*binomcdf(n, p0, x)
- als observed value (x) > expected value (np0),
dan P = 2Pr(X ≥ x) = 2*(1-binomcdf(n, p0, x-1))
4. Conclusie
- Als P > α, dan is P NIET significant, wordt H0 NIET verworpen en is het NIET
aannemelijk dat … (tweezijdige conclusie)
- Als P ≤ α, dan is P WEL significant, wordt H0 WEL verworpen en is het WEL
aannemelijk dat … (eenzijdige conclusie)
Linkszijdig toetsen
P = Pr(X ≤ x + 0.5) = normalcdf(lower=-10^9, upper=x + 0.5, np0, √np0 (1 − p0 ))
Rechtszijdig toetsen
P = Pr(X ≥ x – 0.5) = normalcdf(lower+x – 0.5, upper=10^9, np0, √np0 (1 − p0 ))
Tweezijdig toetsen
P = 2Pr(X ≤ x + 0.5) = 2*normalcdf(lower=-10^9, upper=x + 0.5, np0, √np0 (1 − p0 ))
Of: P = 2Pr(X ≥ x – 0.5) = 2*normalcdf(lower=x – 0.5, upper=10^9 np0, √np0 (1 − p0 ))
Z-toets voor 1 gemiddelde (H10)
σY is bekend
Betrokken variabele
Normaal of willekeurig verdeelde variabele Y
Voorwaarden
De sampling distribution van ̅Y volgt een normale verdeling;
- als Y normaal verdeeld is, dan is ̅
Y ook normaal verdeeld
̅ bij benadering normaal verdeeld als n>30
- als Y willekeurig verdeeld is, dan is Y
0.05
0.04
0.03
f(Y)
0.02
0.01 Y
0 Normale verdeling van Y,
140 150 160 170 180 190 200 210 220 bijvoorbeeld met μ=180 cm=10
cm
I. SCHATTEN
0.30
0.25
0.20
Sampling distribution van 𝑌̅,
f(Y)
0.15
0.10 bijvoorbeeld met μ=180 cm,
=10cm, n=36
0.05
Y
0.00 - μ𝑌̅ = μY
140 150 160 170 180 190 200 210 220 σ𝑌
- σ𝑌̅ = (=SE𝑌̅ )
√𝑛
Puntschatting
μY = ̅
Y
Intervalschatting
̅
Y - Zα(2) σ𝑌̅ < μ < ̅
Y + Zα(2) σ𝑌̅ met Zα(2) = invNorm(area,=0,=1) en
σ𝑌
σ𝑌̅ = (=SE𝑌̅ )
√𝑛
II. TOETSEN
0.30
0.25
0.20
f(Y)
0.15
0.10
0.05
Y
0.00
Null distribution, bijvoorbeeld met
140 150 160 170 180 190 200 210 220
μ=180, =10, n=36, 𝑌̅=178
1. Statistische hypothesen
H0: μ = μ0
HA: μ < μ0 of μ > μ0 of μ ≠ μ0
3. P-waarde (P-value)
Linkszijdig toetsen
P = Pr(Y ≤ y) = normalcdf(lower=-10^9, upper=y, μ0, σ𝑌̅ )
Rechtszijdig toetsen
P = Pr(Y ≥ y) = normalcdf(lower=y, upper=10^9, μ0, σ𝑌̅ )
Tweezijdig toetsen
̅) < expected value (μ0),
- als observed value (Y
dan P = 2Pr(Y ≤ y) = 2*normalcdf(lower=-10^9, upper=y, μ0, σ𝑌̅ )
̅) > expected value (μ0),
- als observed value (Y
dan P = 2Pr(Y ≥ y) = 2*normalcdf(lower=y, upper=E9, μ0, σ𝑌̅ )
4. Conclusie
- Als P > α, dan is P NIET significant, wordt H0 NIET verworpen en is het NIET
aannemelijk dat … (tweezijdige conclusie)
- Als P ≤ α, dan is P WEL significant, wordt H0 WEL verworpen en is het WEL
aannemelijk dat … (eenzijdige conclusie)
T-toets voor 1 gemiddelde (H11)
σY is onbekend
Betrokken variabele
Normaal of willekeurig verdeelde variabele Y
Voorwaarden
De sampling distribution van ̅Y volgt een normale verdeling;
- als Y normaal verdeeld is, dan is ̅
Y ook normaal verdeeld
̅ bij benadering normaal verdeeld als n>30
- als Y willekeurig verdeeld is, dan is Y
I. SCHATTEN
Puntschatting
μY = ̅
Y
Intervalschatting
s𝑌
̅
Y – tα(2),n-1 SE𝑌̅ < μ < ̅
Y + tα(2),n-1 SE𝑌̅ met tα(2),n-1=invT(area,df) met df=n-1en SE𝑌̅ =
√𝑛
II. TOETSEN
0.50
0.40
0.30
Pr(t)
0.20
0.10 t(n-1)
0.00
-5 -4 -3 -2 -1 0 1 2 3 4 5 Null distribution, bijvoorbeeld met
df=35
1. Statistische hypothesen
H0: μ = μ0
HA: μ < μ0 of μ > μ0 of μ ≠ μ0
3. P-waarde (P-value)
Linkszijdig toetsen
P = Pr(t ≤ tn-1) = tcdf(lower=-10^9, upper=tn-1, df)
Rechtszijdig toetsen
P = Pr(t ≥ tn-1) = tcdf(lower=tn-1, upper=10^9, df)
Tweezijdig toetsen
- als observed value (tn-1 ) < expected value (0),
dan P = 2Pr(t ≤ tn-1) = 2*tcdf(lower=-10^9, upper=tn-1, df)
- als observed value (tn-1) > expected value (0),
dan P = 2Pr(Y ≥ y) = 2*tcdf(lower=tn-1, upper=10^9, df)
4. Conclusie
- Als P > α, dan is P NIET significant, wordt H0 NIET verworpen en is het NIET
aannemelijk dat … (tweezijdige conclusie)
- Als P ≤ α, dan is P WEL significant, wordt H0 WEL verworpen en is het WEL
aannemelijk dat … (eenzijdige conclusie)