Download as pdf or txt
Download as pdf or txt
You are on page 1of 105

2

o Vi

a l

ra

t



×


Karl Pearson (27 March 1857 – 27 April 1936)




F1 1 2 3 4
1 11 6 9 14 40 r1
2 7 6 7 9 29
3 14 5 7 11 37
4 11 4 7 20 42
5 22 2 12 16 52 n
65 23 42 70 200

c1





συχν τητα κελιο


× 100 Cros stabulation
∆είγµατα F1 απογόνων * Κλάσεις Παραγ ωγής Γύρης
σ νολο γραµµ ς

11 16
× 100 = 27.5 × 100 = 30.8
40 52
11
× 100 = 27.5
40

F1 1 2 3 4
1 11 6 9 14 40
2 7 6 7 9 29
3 14 5 7 11 37
4 11 4 7 20 42
5 22 2 12 16 52
65 23 42 70 200

16
× 100 = 30.8
52


σ νολο γραµµ ς × σ νολο στ λης


αναµεν µενη συχν
∆είγµατα τητα = * Κλάσεις Παραγ ωγής Γύρης
F1 απογόνων
γενικ σ νολο

40 × 65 50 × 72
= 13.0 = 18.2
200 200
40 × 65
= 13.0
200

F1 1 2 3 4
1 11 6 9 14 40
2 7 6 7 9 29
3 14 5 7 11 37
4 11 4 7 20 42
5 22 2 12 16 52
65 23 42 70 200
∆είγµατα F1 απογόνων * Κλ άσεις Παραγ ωγής Γύρης Cros stabulation

Count: Συχνότητα
Expected Count: Αναµενόµενη Συχνότητα
2

 2

(παρατηρο µενη συχν τητα − αναµεν µενη συχν τητα )


2

Χ =∑
2

αναµεν µενη συχν τητα

(11 − 13,0 ) ( 6 − 4,6 ) (16 − 18, 2 )


2 2 2

Χ = 2
+ +⋯ + = 12,125
13,0 4,6 18, 2
2

 2
2

Ανατρέχουµε στους Πίνακες


της 2 Κατανοµής
2(12)
 0,05=21,03

 2=12,125

 2=12,125<21,03= 2(12)
0,05

 2 < 2
α

χ
χ2α

Περιοχή Μη Απόρριψης της Η0





Από το δείγµα…

…γενικεύουµε για τον


αντίστοιχο Πληθυσµό
Βαθµοί Παρατηρούµενη Στάθµη
X2 δειγµατικό Ελευθερίας Σηµαντικότητας p-value

Chi-Square Te s ts

b
a

b
b
b

b
c

Αν p<α, τότε απορρίπτεται η Η0


≥α, η Η0 δεν απορρίπτεται
Αν p≥
2
× ×
×
Φυλλοφόρα µοσχεύµατα έξι ποικιλιών ελιάς που ριζοβόλησαν ή όχι
µετά από 84 ηµέρες κάτω από υδρονέφωση

85 75 160
87 73 160
97 63 160
109 51 160
109 51 160
150 10 160
637 323 960


Στατιστικός Έλεγχος

Η 0 : p1 = p2 = ⋯ = p6
Η1 : τουλ χιστον δ ο ποσοστ διαφ ρουν

 ×
2

2 2 2
85 87 150
+ +⋯ + = 440, 406
160 160 160

 637 2 
440, 406 −  
 960  = 79, 40
X2 =
637 × 323
9602
2(5)
 0,05=11,07

 2=79,40

 2=79,40>11,07= 2(5)
0,05

 2 > 2



Φυλλοφόρα µοσχεύµατα δύο ποικιλιών ελιάς που ριζοβόλησαν ή όχι
µετά από 84 ηµέρες κάτω από υδρονέφωση

100 60 160
109 51 160
209 111 320
n11 n12 n1.
n21 n22 n2.
n.1 n.2 n..


Στατιστικός Έλεγχος

Η 0 : p1 = p2
Η1 : τα δ ο ποσοστ διαφ ρουν ( p1 ≠ p2 )


160 × 209
(1,1) 11= = 104,5
320

160 × 209
(2,1) 21= = 104,5
320

160 × 111
(1,2) 12= = 55,5
320

160 × 111
(2,2) 22= = 55,5
320
∆ιόρθωση Συνέχειας του Yates

( 100 − 104,5 − 0,5) + ( 60 − 55,5 − 0,5) + ( 109 − 104,5 − 0,5) + ( 51 − 55,5 − 0,5)
2 2 2 2

X2 = =
104,5 55,5 104,5 55,5
= 0,88

2
 1
Γενική Σχέση  O−E − 
X =∑
2  2
E

Ο: Παρατηρούµενη Συχνότητα
Ε: Αναµενόµενη-Θεωρητική Συχνότητα
Β’ Τρόπος

2
 320 
 (100 × 51) − (109 × 60) −  × 320
X =
2  2 
= 0,88
209 × 111× 160 × 160

2
 n.. 
 n11n22 − n12 n21 −  n..
X2 = 
Γενική Σχέση 2
n1.n2.n.1n.2
2(1)
 0,05=3,84

 2=0,88

 2=0,88<3,84= 2(1)
0,05

 2 < 2

z

( pˆ1 − pˆ 2 )
2
pˆ1 − pˆ 2
z= X =
2
1 1 1 1
ˆ ˆ( + )
pq ˆ ˆ( + )
pq
n1 n2 n1 n2





{
R = z > za / 2 } Σύµφωνα µε τη Μηδενική Υπόθεση τα δύο
pˆ1 − pˆ 2 ποσοστά είναι ίσα και εποµένως µπορούµε να
z= συγχωνεύσουµε τα δύο δείγµατα σε ένα και να
s υπολογίσουµε ένα κοινό p (και q=1-p)
1 1
s ≈ pq
ˆ ˆ  + 
 n1 n2 

Τυπικό Σφάλµα της ∆ιαφοράς


των ∆ύο Ποσοστών


pˆ1qˆ1 pˆ 2qˆ2
s 2pˆ − pˆ = + ⇒
1 2 n1 n2
pˆ1qˆ1 pˆ 2 qˆ2
s pˆ − pˆ = +
1 2 n1 n2





 2

×


 ×
2






18-24 24 4 23 82 12
25-34 42 2 20 146 13
35-44 54 0 12 136 18
45-54 40 1 6 121 9
55-64 37 1 7 68 15
65+ 20 5 3 61 13

Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation
i i

L L

e P
N

ne
k

s h

so

ar
b a

e
f

. .
l

r
ar

so

Th

'

c
i

e s

a
l

y b

n
e

se

x E

l
d

 i

Chi

L
n

ac

i
ne

(


2
t
se

q S

o
n

0
ar

ar 1

d
s ar

%)

ze

mp

5 5 59

2
5

. . . .

ue

06
9 36 48
c

36

2 0
5 5

b
c
a

n
th

e
f

2 2

ar

0 0

th

se

sy

e
5

Th mp

e
27

. . .

S
d)

28

0 0
5

8 i

0 0
48

n
6

0 0

37

. . . .

0 0 0
56

0 0 0

0 0 0
3

b b b b

o
L

we

ar

t
r

s
Chi-Square Tests

B
o

o
C

. . . .

0 0 0
5

i g

n
.
n

0 0 0
5

0 0 0 0
(

nc

e
U
p

d)

rv

. . . .

u
l

0 0 0
57

0 0 0

d
Sig.

0 0 0
5

29

o
L

9
p-value

we

ar

r
σε επίπεδο σηµαντικότητας α=0,05

B
o

o
C

27

i g

n
.
n

d
1
e

nc

e
U

d)

rv

o
Αφού p<0,05 η Μηδενική Υπόθεση απορρίπτεται

u
l

3

Symmetric Measures

c
c
Η τιµή του δείκτη συνάφειας V του Cramer µαρτυρά ασθενούς
εντάσεως συσχέτιση µεταξύ των δύο χαρακτηριστικών που
διασταυρώνονται
V

X 2 p=min(k-1, l-1).
V=
Np k
l

Παίρνει τιµές στο διάστηµα [0, 1]


V Cramer (συνέχεια)
 
Οι Νόρµες αυτές είναι
  γενικές. Το τι είναι
βιολογικά σηµαντικό
  εξαρτάται κάθε φορά από
το πεδίο έρευνας και τα
  χαρακτηριστικά που
  εξετάζονται.

 
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation

Adjusted Residual:
∆ιορθωµένο Τυποποιηµένο Υπόλοιπο


α
2


α
α
α
συνέχεια


fi + f + j
fij −
N
fi + f + j  fi +   f+ j 
1 −  1 − 
N  N  N 

fi+ f+ j i j

F fij ( i = 1,… k , j = 1,… , l ) .


συνέχεια

fij

fij
100%

90%

80%

70%

60% Υγεία
Οικονοµικό
50% Σπουδές
Στεγαστικό

40% Τζόγος

30%

20%

10%

0%
18-24 ετών 25-34 35-44 45-54 55-64 65+
Κλάσεις Ηλικιών
Παραγοντικό Επίπεδο της Correspondence Analysis


συνέχεια


32 268 300
51 199 250
. 67 233 300
150 700 850

Τα σύνολα γραµµών
προκαθορισµένα π.χ. λόγω
Στρωµατοποιηµένης Τυχαίας
∆ειγµατοληψίας
One-Sample Kolmogorov-Smirnov Test

Αφού p<0,05 η Μηδενική Υπόθεση


Απορρίπτεται, τα δεδοµένα ∆ΕΝ
προσαρµόζονται στην Κανονική
Κατανοµή
∆οθείσα
Αναλογία
Test Statistics

Αφού p>0,05 η Μηδενική Υπόθεση ∆ΕΝ


Απορρίπτεται, τα δεδοµένα
προσαρµόζονται στην δοθείσα αναλογία
p α
συνέχεια

0 1 0,03125 2,72
1 12 0,15625 13,59
2 27 0,31250 27,19
3 32 0,31250 27,19
4 12 0,15625 13,59
5 3 0,03125 2,72
87 1,0000 87

???
συνέχεια


n p
0 5
  1   1 
5
P ( X = 0) =       = 0,03125
 0 2   2 
1 4
  1   1 
5
P ( X = 1 =       = 0,15625
1 2   2 
κ .λπ .
συνέχεια


×
×
συνέχεια

p
συνέχεια
 2

(1 − 2,72 ) (12 − 13,59 ) ( 3 − 2,72 )


2 2 2

X 2
= + +⋯ + = 2,34
2,72 13,59 2,72

 2
2

α
συνέχεια
2(5)
 0,05=11,07

 2=2,34

 2=2,34<11,07= 2(5)
0,05

 2 < 2

Η µηδενική Υπόθεση παραµένει


συνέχεια

α


α
<0,55 0 0,0154 2,59
0,55-1,05 5 0,0247 4,15
1,05-1,55 8 0,0500 8,40
1,55-2,05 20 0,0861 14,46
2,05-2,55 20 0,1253 21,05
2,55-3,05 27 0,1547 25,99
3,05-3,55 30 0,1617 27,17
3,55-4,05 20 0,1432 24,06
4,05-4,55 13 0,1075 18,06
4,55-5,05 11 0,0684 11,49
5,05-5,55 7 0,0368 6,18
5,55-6,05 7 0,0168 2,82
>6,05 0 0,0094 1,58
168 1,0000 168,00
συνέχεια

X = 3,18 Στην πράξη


υπολογίζονται από
s = 1, 22 το δείγµα
συνέχεια

α
συνέχεια


 Y − 3,18 0,55 − 3,18 


P (Y ≤ 0,55) = P  ≤  = P ( z ≤ −2,16) =
 1, 22 1, 22 
= 0,5000 − 0, 4846 = 0,0154
 0,55 − 3,18 Y − 3,18 1,55 − 3,18 
P (0,55 ≤ Y ≤ 1,55) = P  ≤ ≤  =
 1, 22 1, 22 1, 22 
= P (−2,16 ≤ z ≤ −1,75) = 0, 4846 − 0, 4599 = 0,0247
συνέχεια
-2,16 +2,16
συνέχεια

συνέχεια


×
×
συνέχεια


Πόσοι είναι οι βαθµοί ελευθερίας στην


περίπτωση που δίνονται οι παράµετροι µ και σ;
συνέχεια
 2

( 0 − 2,59 ) ( 5 − 4,15 ) ( 0 − 1,58 )


2 2 2

X 2
= + +⋯ + = 15,30
2,59 4,15 1,58

 2
2

α
συνέχεια
2(10)
 0,05=18,31

 2=15,30

 2=15,30<18,31= 2(10)
0,05

 2 < 2

Η µηδενική Υπόθεση παραµένει


συνέχεια

α


α


Cochran


: P(A) ≠ 0 P(B) ≠ 0 ,
:
( / )= ( )
P(A ∩ B)
: P(A / B) =
P(B)
: P(A ∩ B) = P(A) ⋅ P(B)
,
,
.
1, 2, …, n ,
P(A1) ≠ 0 , P(A 2) ≠ 0 ,…, P(An ) ≠ 0 :
P(A1 ∩ A2 ∩ A3... ∩ An) = P(A1) ⋅ P(A2) ⋅ P(A3) ⋅ ... ⋅ P(An)
.

,


Η 0 : p1 j = p2 j = p3 j = p4 j = p5 j , j = 1,… 4

Η αναλογία (%) για την j κλάση


γύρης στο πρώτο δείγµα µηδικής
συνέχεια



r1:
r1
Ρ( Α = ∆ε γµα1) = c1 :
n:
n
c1 r c r ×c
Ρ(Β = Κλ ση1) = αναµεν µενη συχν τητα = n × ( 1 × 1 ) = 1 1
n n n n
r1 c1
Ρ(∆1 ∩ Κ1) = ×
n n
1 2 … j … l
X

1 f11 f12 … f1 j … f1l f1+


2 f 21 f 22 … f2 j … f 2l f 2+
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
i fi1 fi 2 … fij … f il fi +
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
k f k1 fk 2 … f kj … f kl fk +

f +1 f +2 … f+ j … f+l
1 2 … j … l
X
f11 f12 f1 j f1l
1 … … 1
f1+ f1+ f1+ f1+
f 21 f 22 f2 j f 2l
2 … … 1
f 2+ f 2+ f 2+ f 2+
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
fi1 fi 2 fij f il
i … … 1
fi+ fi+ fi+ fi+
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
f k1 fk 2 f kj f kl
k … … 1
fk + fk + fk + fk +

f +1 f +2 f+ j f+l
… …
N N N N
1 2 … j … l
X
f11 f12 f1 j f1l f1+
1 f +1 f +2 … … f+l
f+ j N
f 21 f 22 f2 j f 2l f 2+
2 f +1 f +2 … … f+l
f+ j N
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
f i1 fi 2 fij f il fi +
i … …
f +1 f +2 f+ j f+l N
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
f k1 fk 2 f kj f kl fk +
k … …
f +1 f +2 f+ j f+l N
1 1 … 1 … 1
Υ
1 2 … j … l
X

Χ
f1+
1 f11 f12 … f1 j … f1l = r1
N
f 2+
2 f 21 f 22 … f2 j … f 2l = r2
N
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
fi +
i f i1 fi 2 … f ij … f il = ri
N
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
fk +
k fk1 fk 2 … f kj … f kl = rk
N

f +1 f +2 f+ j f+l
= c1 = c2 … = cj … = cl =1
Υ

N N N N
1 2 … j … l
X
1 f11 / N f12 / N … f1 j / N … f1l / N
2 f 21 / N f 22 / N … f2 j / N … f 2l / N
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
i f i1 / N fi 2 / N … f ij / N … f il / N
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
k f k1 / N fk 2 / N … f kj / N … f kl / N
 Εισαγωγή στη Στατιστική για Βιολογικές
Επιστήµες
 Στατιστική: Θεωρία-
Εφαρµογές
 Περιγραφική Στατιστική

 Στατιστική: Θεωρία-
Εφαρµογές
 Πολυδιάστατη Ανάλυση ∆εδοµένων:
Μέθοδοι και Εφαρµογές
o Vi

a l

You might also like