Download as pdf or txt
Download as pdf or txt
You are on page 1of 6

Basisbegrippen Statistiek voor Criminologen: formularium

2 Beschrijvende statistiek

Transformaties

Frequenties

g (x i ) = a + bx i

g (x) = a + b x
s g = |b|s x
Qbg (p) = a + b Qbx (p) als b > 0

g (x) monotoon stijgend

med(g 1 , . . . , g n ) = g (med(x 1 , . . . , x n )) voor n oneven


Qbg (p) = g (Qbx (p))

absolute frequentie n j
relatieve frequentie f j =

nj
n

cumulatieve verdelingsfunctie Fbn (x) = n1 ( aantal x i x; i = 1, . . . , n)


kwantielfunctie Qbn (p) = x (i ) indien

i 1
n

<p

Verbanden tussen variabelen

i
n

steekproefcovariantie: s x y =

Centrum- en spreidingskenmerken
n
k
1X
1 X
xi =
mj nj
steekproefgemiddelde: x =
n i =1
n j =1

steekproefmediaan: med(x) =

x ( n+1
2 )

steekproefvariantie: s x2 =

x (n/2) +x (n/2+1)
2

n
1 X
2
(x i x)
n 1 i =1

interkwartielafstand: IQR= Qbn (0.75) Qbn (0.25)

(n oneven)

n
1 X
i y)

(x i x)(y
n 1 i =1

Pearson correlatiecofficint: r x y = r =

sx y
sx s y

Spearman correlatiecofficint: wordt verkregen door de geobserveerde


waarden te vervangen door hun rangnummers, en dan de Pearson correlatiecofficint van de rangnummers te berekenen

(n even)

Lineaire combinaties
v i = a + bx i + c y i

v = a + b x + c y
s v2 = b 2 s x2 + c 2 s 2y + 2bc s x y

3 Kansen en toevalsvariabelen

Centrum- en spreidingskenmerken

Kansregels
P (AC ) = 1 P (A)

= E (X )

DISCREET

CONTINU

k
X

m j f (m j )

x f (x)d x

g (m j ) f (m j )

g (x) f (x)d x

j =1

P (A B ) = P (A) + P (B ) P (A B )
P (A \ B ) = P (A) P (B ) als B A

E (g (X ))

k
X
j =1

P (A B )
voorwaardelijke kans: P (A | B ) =
als P (B ) 6= 0
P (B )

Med(X )

Q(0.5)

Q(0.5)

k
X

(m j E X )2 f (m j )

(g (m j ) E (g (X )))2 f (m j )

A en B onafhankelijk: P (A B ) = P (A)P (B )
2 = Var(X )

Dichtheids-, verdelings- en kwantielfunctie


DISCREET

CONTINU

dichtheid

f (m j ) = P (X = m j )

f (x)

P (X A)

F (x)

P (X x) =

Q(p)

m j A

f (m j )
P

m j x

f (m j )

de kleinste x waarvoor F (x) p

Var(g (X ))

k
X
j =1

IQR

f (x)d x

P (X x) =

j =1

Rx

Q(0.75) Q(0.25)

(x E X )2 f (x)d x

g (x) E (g (X ))

f (x)d x

Q(0.75) Q(0.25)

f (y)d y

Lineaire combinaties en transformaties

de inverse functie van F

E (a + bX ) = a + bE X
Var(a + bX ) = b 2 Var(X )
Var(X ) = E (X 2 ) (E X )2
QG (p) = g (Q X (p)) voor elke 0 < p < 1 met G = g (X ) monotoon stijgend
E (a + bX + cY ) = a + bE (X ) + cE (Y )
Var(a + bX + cY ) = b 2 Var(X ) + c 2 Var(Y ) + 2bcCov(X , Y )
Var(a + bX + cY ) = b 2 Var(X ) + c 2 Var(Y ) als X en Y onafhankelijk zijn

4 Univariate kansmodellen
NAAM

f (m) of f (x)

E (X )

Var(X )

Bernoulli

f (1) = p, f (0) = 1 p

m = 0, 1

p(1 p)

m = 0, . . . , n

np

np(1 p)

som van n onafhankelijke Bernoulli variabelen

B (n, p)

n
m

p m (1 p)nm

EIGENSCHAPPEN

Poisson()

e m!

m = 0, 1, 2, . . .

limiet van binomiaalverdeling met np

N (, 2 )

1 x 2
1
e 2 , R, > 0
p
2

x R

Z = N (0, 1), F (x) =

5 Schatters en hun verdeling


Verdeling van het steekproefgemiddelde
Voor een zuiver toevallige steekproef geldt
E ( X ) = E (X 1 )
1
Var( X ) = Var(X 1 )
n

2
Als X 1 , . . . , X n N (, 2 ) en onafhankelijk, dan geldt X N , n

Centrale limietstelling
Als X 1 , . . . , X n onafhankelijk en identiek verdeeld zijn met eindige variantie,
dan geldt voor n voldoende groot

X N E (X 1 ),

Var(X 1 )
n

Indien X B (n, p) dan geldt voor np 5 en n(1 p) 5 dat


X N (np, np(1 p))

p(1p)
P = Xn N p, n
Benaderen we een kans onder een binomiaalverdeling door een normaalkans, dan is een continuteitscorrectie aangewezen.

6 Univariate inferentie
VOORWAARDEN

TESTSTATISTIEK EN VERDELING ONDER

= 0

2 bekend en normaliteit

X 0
p N (0, 1)
/ n

= 0

2 onbekend en normaliteit

X 0
p t n1
S/ n

p = p0

test: np 0 5 en n(1 p 0 ) 5
5
BI: n p 5 en n(1 p)

P p 0
q

p:

p = p0

H0

100(1 )% BI VOOR

H0

x z /2 pn

s
x t n1,/2 p
n

p 0 (1p 0 )
n

N (0, 1)

p z
2

p(1
p)
n

X = n Pb B (n, p 0 )

7 Bivariate kansmodellen
Gezamenlijke verdeling van twee toevalsvariabelen

Onafhankelijkheid van twee toevalsvariabelen

DISCREET

onafhankelijkheid: f (m x , m y ) = f X (m x ) f Y (m y )(X , Y discreet)

gezamenlijke dichtheid

f (m x , m y ) = P (X = m x , Y = m y )

marginale dichtheid

f X (m x ) =

E (k(X )l (Y )) = E (k(X )) E (l (Y )) als X en Y onafhankelijk zijn

f (m x , m y )

my

Cov(X , Y ) = E (X E (X ))(Y E (Y )) = E (X Y ) E (X )E (Y )

voorwaardelijke dichtheid

f X |Y (m x |m y ) =

voorwaardelijke verwachtingswaarde

E (X | m y ) =

X
mx

E (g (X , Y ))

XX

f (m x , m y )
Cov(X , Y )
(Pearson) populatiecorrelatiecofficint: (X , Y ) = p
Var(X )Var(Y )

f Y (m y )

m x f X |Y (m x | m y )

g (m x , m y ) f X ,Y (m x , m y )

mx m y

8 Inferentie bij twee variabelen


H0

VOORWAARDEN

TESTSTATISTIEK EN VERDELING ONDER

p1 = p2

n 1 p1 5, n 1 (1 p1 ) 5
n 2 p2 5, n 2 (1 p2 ) 5

P1 P2
P (1P )
P1 (1P1 )
+ 2n 2
n1
2

100(1 )% BI VOOR

H0

P1 P2
N (0, 1) of r

N (0, 1)
P0 (1 P0 ) n1 + n1
1
2
n P +n P
met P0 = 1 1 2 2

p1 p2 :

p1 (1p1 )
p (1p )
+ 2n 2
n1
2

21
22
n1 + n2

p1 p2 z /2

n 1 +n 2

X en Y onafhankelijk

absolute frequenties 5

1 = 2

ongepaard, normaliteit van Y1 en Y2

P geobserveerde absolute frequentieverwachte waarde


X2 =
verwachte waarde
met v = (r 1)(k 1)

2v

1 2 :
"

21 , 22 bekend

Y1 Y2
r

21 = 22 onbekend

Y1 Y2
(n 1 1)S 12 +(n 2 1)S 22
t n1 +n2 2 met S 2p =
q
n 1 +n 2 2
1
1
Sp n + n

22
21
n1 + n2

y1 y2 z /2

N (0, 1)

21 6= 22 onbekend

Y1 Y2
r

21 = 22

ongepaard, normaliteit van Y1 en Y2

F = S 12 /S 22 F n1 1,n2 1

1 = 2

gepaard, normaliteit van V = X Y

V
p t n1
SV / n

=0

bivariate normaliteit van (X , Y )

R n2
p
t n2

S 12
S 22
n1 + n2

y1 y2 t n1 +n2 2,/2 S p

1
1
n1 + n2

S = 0

t r met r =

s 12
s 22
n1 + n2

2
"

(s 12 /n 1 )2
(s 22 /n 2 )2
n 1 1 + n 2 1

1 2 :

1R 2

p
Rq
s n2
t n2
1R s2

r
y1 y2 t r,/2

sV
v t n1,/2 p
n

s 12
s 22
n1 + n2

i
z
z
g h(r ) p/2 , g h(r ) + p/2
n3
n3

exp(2x)1
met h(r ) = 21 log 1+r
1r en g (x) = exp(2x)+1

9 Lineaire regressie
model

schatters

Yi = a + bx i + i , i = 1, 2, . . . , n, met i N (0, 2 ) en onderling onafhankelijk

b =

Pn

i x)

(y i y)(x
i =1
Pn
2
(x x)
i =1 i

sy
cov(x,y)
=r s
x
s x2

a = y b x
s2 =

n
1 X
r2
n 2 i =1 i

residuen

i)
r i = y i (a + bx

ANOVA tabel

SST = SSM + SSE


n
X

2=
(y i y)

n
X

2+
( yi y)

i =1

i =1

n
X

(y i yi )2

i =1

R 2 = SSM
SST
F = SSM
1

inferentie schatters

SSE
n2 als b = 0, dan is F F 1,n2 .

Aa
=s
t n2 met s.e.(a)
s.e.( A)

1
x 2
n + (n1)s 2
x

B b
=s
t n2 met s.e.(b)
s.e.(B )

1
(n1)s x2

You might also like