Formular I Um

Basisbegrippen Statistiek voor Criminologen: formularium
2 Beschrijvende statistiek
Transformaties
Frequenties
g (x i ) = a + bx i
g (x) = a + b x
s g = |b|s x
Qbg (p) = a + b Qbx (p) als b > 0
g (x) monotoon stijgend
med(g 1 , . . . , g n ) = g (med(x 1 , . . . , x n )) voor n oneven

Qbg (p) = g (Qbx (p))
absolute frequentie n j
relatieve frequentie f j =
nj
n
cumulatieve verdelingsfunctie Fbn (x) = n1 ( aantal x i x; i = 1, . . . , n)

kwantielfunctie Qbn (p) = x (i ) indien
i 1
n
<p
Verbanden tussen variabelen
i
n
steekproefcovariantie: s x y =
Centrum- en spreidingskenmerken
n
k
1X
1 X
xi =
mj nj
steekproefgemiddelde: x =
n i =1
n j =1
steekproefmediaan: med(x) =
x ( n+1
2 )
steekproefvariantie: s x2 =
x (n/2) +x (n/2+1)
2
n
1 X
2
(x i x)
n 1 i =1
interkwartielafstand: IQR= Qbn (0.75) Qbn (0.25)
(n oneven)
n
1 X
i y)
(x i x)(y
n 1 i =1
Pearson correlatiecofficint: r x y = r =
sx y
sx s y
Spearman correlatiecofficint: wordt verkregen door de geobserveerde

waarden te vervangen door hun rangnummers, en dan de Pearson correlatiecofficint van de rangnummers te berekenen
(n even)
Lineaire combinaties
v i = a + bx i + c y i
v = a + b x + c y
s v2 = b 2 s x2 + c 2 s 2y + 2bc s x y
3 Kansen en toevalsvariabelen
Centrum- en spreidingskenmerken
Kansregels
P (AC ) = 1 P (A)
= E (X )
DISCREET
CONTINU
k
X
m j f (m j )
x f (x)d x
g (m j ) f (m j )
g (x) f (x)d x
j =1
P (A B ) = P (A) + P (B ) P (A B )
P (A \ B ) = P (A) P (B ) als B A
E (g (X ))
k
X
j =1
P (A B )
voorwaardelijke kans: P (A | B ) =
als P (B ) 6= 0
P (B )
Med(X )
Q(0.5)
Q(0.5)
k
X
(m j E X )2 f (m j )
(g (m j ) E (g (X )))2 f (m j )
A en B onafhankelijk: P (A B ) = P (A)P (B )
2 = Var(X )
Dichtheids-, verdelings- en kwantielfunctie

DISCREET
CONTINU
dichtheid
f (m j ) = P (X = m j )
f (x)
P (X A)
F (x)
P (X x) =
Q(p)
m j A
f (m j )
P
m j x
f (m j )
de kleinste x waarvoor F (x) p
Var(g (X ))
k
X
j =1
IQR
f (x)d x
P (X x) =
j =1
Rx
Q(0.75) Q(0.25)
(x E X )2 f (x)d x
g (x) E (g (X ))
f (x)d x
Q(0.75) Q(0.25)
f (y)d y
Lineaire combinaties en transformaties
de inverse functie van F
E (a + bX ) = a + bE X
Var(a + bX ) = b 2 Var(X )
Var(X ) = E (X 2 ) (E X )2
QG (p) = g (Q X (p)) voor elke 0 < p < 1 met G = g (X ) monotoon stijgend
E (a + bX + cY ) = a + bE (X ) + cE (Y )
Var(a + bX + cY ) = b 2 Var(X ) + c 2 Var(Y ) + 2bcCov(X , Y )
Var(a + bX + cY ) = b 2 Var(X ) + c 2 Var(Y ) als X en Y onafhankelijk zijn
4 Univariate kansmodellen
NAAM
f (m) of f (x)
E (X )
Var(X )
Bernoulli
f (1) = p, f (0) = 1 p
m = 0, 1
p(1 p)
m = 0, . . . , n
np
np(1 p)
som van n onafhankelijke Bernoulli variabelen
B (n, p)
n
m
p m (1 p)nm
EIGENSCHAPPEN
Poisson()
e m!
m = 0, 1, 2, . . .
limiet van binomiaalverdeling met np
N (, 2 )
1 x 2
1
e 2 , R, > 0
p
2
x R
Z = N (0, 1), F (x) =
5 Schatters en hun verdeling

Verdeling van het steekproefgemiddelde
Voor een zuiver toevallige steekproef geldt
E ( X ) = E (X 1 )
1
Var( X ) = Var(X 1 )
n
2
Als X 1 , . . . , X n N (, 2 ) en onafhankelijk, dan geldt X N , n
Centrale limietstelling
Als X 1 , . . . , X n onafhankelijk en identiek verdeeld zijn met eindige variantie,
dan geldt voor n voldoende groot
X N E (X 1 ),
Var(X 1 )
n
Indien X B (n, p) dan geldt voor np 5 en n(1 p) 5 dat

X N (np, np(1 p))
p(1p)
P = Xn N p, n
Benaderen we een kans onder een binomiaalverdeling door een normaalkans, dan is een continuteitscorrectie aangewezen.
6 Univariate inferentie
VOORWAARDEN
TESTSTATISTIEK EN VERDELING ONDER
= 0
2 bekend en normaliteit
X 0
p N (0, 1)
/ n
= 0
2 onbekend en normaliteit
X 0
p t n1
S/ n
p = p0
test: np 0 5 en n(1 p 0 ) 5
5
BI: n p 5 en n(1 p)
P p 0
q
p:
p = p0
H0
100(1 )% BI VOOR
H0
x z /2 pn
s
x t n1,/2 p
n
p 0 (1p 0 )
n
N (0, 1)
p z
2
p(1
p)
n
X = n Pb B (n, p 0 )
7 Bivariate kansmodellen
Gezamenlijke verdeling van twee toevalsvariabelen
Onafhankelijkheid van twee toevalsvariabelen
DISCREET
onafhankelijkheid: f (m x , m y ) = f X (m x ) f Y (m y )(X , Y discreet)
gezamenlijke dichtheid
f (m x , m y ) = P (X = m x , Y = m y )
marginale dichtheid
f X (m x ) =
E (k(X )l (Y )) = E (k(X )) E (l (Y )) als X en Y onafhankelijk zijn
f (m x , m y )
my
Cov(X , Y ) = E (X E (X ))(Y E (Y )) = E (X Y ) E (X )E (Y )
voorwaardelijke dichtheid
f X |Y (m x |m y ) =
voorwaardelijke verwachtingswaarde
E (X | m y ) =
X
mx
E (g (X , Y ))
XX
f (m x , m y )
Cov(X , Y )
(Pearson) populatiecorrelatiecofficint: (X , Y ) = p
Var(X )Var(Y )
f Y (m y )
m x f X |Y (m x | m y )
g (m x , m y ) f X ,Y (m x , m y )
mx m y
8 Inferentie bij twee variabelen

H0
VOORWAARDEN
TESTSTATISTIEK EN VERDELING ONDER
p1 = p2
n 1 p1 5, n 1 (1 p1 ) 5
n 2 p2 5, n 2 (1 p2 ) 5
P1 P2
P (1P )
P1 (1P1 )
+ 2n 2
n1
2
100(1 )% BI VOOR
H0
P1 P2
N (0, 1) of r
N (0, 1)
P0 (1 P0 ) n1 + n1
1
2
n P +n P
met P0 = 1 1 2 2
p1 p2 :
p1 (1p1 )
p (1p )
+ 2n 2
n1
2
21
22
n1 + n2
p1 p2 z /2
n 1 +n 2
X en Y onafhankelijk
absolute frequenties 5
1 = 2
ongepaard, normaliteit van Y1 en Y2
P geobserveerde absolute frequentieverwachte waarde

X2 =
verwachte waarde
met v = (r 1)(k 1)
2v
1 2 :
"
21 , 22 bekend
Y1 Y2
r
21 = 22 onbekend
Y1 Y2
(n 1 1)S 12 +(n 2 1)S 22
t n1 +n2 2 met S 2p =
q
n 1 +n 2 2
1
1
Sp n + n
22
21
n1 + n2
y1 y2 z /2
N (0, 1)
21 6= 22 onbekend
Y1 Y2
r
21 = 22
ongepaard, normaliteit van Y1 en Y2
F = S 12 /S 22 F n1 1,n2 1
1 = 2
gepaard, normaliteit van V = X Y
V
p t n1
SV / n
=0
bivariate normaliteit van (X , Y )
R n2
p
t n2
S 12
S 22
n1 + n2
y1 y2 t n1 +n2 2,/2 S p
1
1
n1 + n2
S = 0
t r met r =
s 12
s 22
n1 + n2
2
"
(s 12 /n 1 )2
(s 22 /n 2 )2
n 1 1 + n 2 1
1 2 :
1R 2
p
Rq
s n2
t n2
1R s2
r
y1 y2 t r,/2
sV
v t n1,/2 p
n
s 12
s 22
n1 + n2
i
z
z
g h(r ) p/2 , g h(r ) + p/2
n3
n3
exp(2x)1
met h(r ) = 21 log 1+r
1r en g (x) = exp(2x)+1
9 Lineaire regressie
model
schatters
Yi = a + bx i + i , i = 1, 2, . . . , n, met i N (0, 2 ) en onderling onafhankelijk
b =
Pn
i x)
(y i y)(x
i =1
Pn
2
(x x)
i =1 i
sy
cov(x,y)
=r s
x
s x2
a = y b x
s2 =
n
1 X
r2
n 2 i =1 i
residuen
i)
r i = y i (a + bx
ANOVA tabel
SST = SSM + SSE

n
X
2=
(y i y)
n
X
2+
( yi y)
i =1
i =1
n
X
(y i yi )2
i =1
R 2 = SSM
SST
F = SSM
1
inferentie schatters
SSE
n2 als b = 0, dan is F F 1,n2 .
Aa
=s
t n2 met s.e.(a)
s.e.( A)
1
x 2
n + (n1)s 2
x
B b
=s
t n2 met s.e.(b)
s.e.(B )
1
(n1)s x2

Formular I Um

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Formular I Um

Uploaded by

Copyright:

Available Formats

Basisbegrippen Statistiek voor Criminologen: formularium

g (x) monotoon stijgend

med(g 1 , . . . , g n ) = g (med(x 1 , . . . , x n )) voor n oneven

cumulatieve verdelingsfunctie Fbn (x) = n1 ( aantal x i x; i = 1, . . . , n)

Verbanden tussen variabelen

interkwartielafstand: IQR= Qbn (0.75) Qbn (0.25)

Spearman correlatiecofficint: wordt verkregen door de geobserveerde

Dichtheids-, verdelings- en kwantielfunctie

de kleinste x waarvoor F (x) p

Lineaire combinaties en transformaties

de inverse functie van F

som van n onafhankelijke Bernoulli variabelen

limiet van binomiaalverdeling met np

Z = N (0, 1), F (x) =

5 Schatters en hun verdeling

Indien X B (n, p) dan geldt voor np 5 en n(1 p) 5 dat

TESTSTATISTIEK EN VERDELING ONDER

Onafhankelijkheid van twee toevalsvariabelen

onafhankelijkheid: f (m x , m y ) = f X (m x ) f Y (m y )(X , Y discreet)

E (k(X )l (Y )) = E (k(X )) E (l (Y )) als X en Y onafhankelijk zijn

8 Inferentie bij twee variabelen

TESTSTATISTIEK EN VERDELING ONDER

ongepaard, normaliteit van Y1 en Y2

P geobserveerde absolute frequentieverwachte waarde

ongepaard, normaliteit van Y1 en Y2

gepaard, normaliteit van V = X Y

bivariate normaliteit van (X , Y )

Yi = a + bx i + i , i = 1, 2, . . . , n, met i N (0, 2 ) en onderling onafhankelijk

SST = SSM + SSE

You might also like