Professional Documents
Culture Documents
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Δημήτριος Παντελής Πανεπιστήμιο Θεσσαλίας
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Δημήτριος Παντελής Πανεπιστήμιο Θεσσαλίας
Παντελής Δημήτριος
Τμήμα Μηχανολόγων Μηχανικών
Πανεπιστήμιο Θεσσαλίας
ΕΝΝΟΙΑ ΠΙΘΑΝΟΤΗΤΑΣ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΔΕΙΓΜΑΤΙΚΟΣ ΧΩΡΟΣ
Ω={1,2,3,4,5,6}
Ω={περιττός, άρτιος}
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΠΑΡΑΔΕΙΓΜΑ ΔΙΑΚΡΙΤΟΥ ΔΕΙΓΜΑΤΙΚΟΥ
ΧΩΡΟΥ
4
Y3
2
1
1 2 3 4
X
• 16 ενδεχόμενα
Ω={(1,1), (1,2), . . . ., (4,4)}
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΠΑΡΑΔΕΙΓΜΑ ΣΥΝΕΧΟΥΣ ΔΕΙΓΜΑΤΙΚΟΥ
ΧΩΡΟΥ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ
• Αξιώματα πιθανοτήτων
1. P A 0
2. P Ω =1
3. P Α Β =P Α +P Β αν
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ: ΠΑΡΑΔΕΙΓΜΑ
1
Y 2
3
4
1 2 3 4
X
• Νόμος πιθανότητας: ίδια πιθανότητα για κάθε αποτέλεσμα
1
16
– Πρόβλημα αρίθμησης
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 8
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ: ΠΑΡΑΔΕΙΓΜΑ
ΣΥΝΕΧΟΥΣ ΔΕΙΓΜΑΤΙΚΟΥ ΧΩΡΟΥ
• Βελάκι σε στόχο
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 9
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ: ΠΑΡΑΔΕΙΓΜΑ
ΣΥΝΕΧΟΥΣ ΔΕΙΓΜΑΤΙΚΟΥ ΧΩΡΟΥ
1 1 1 1
P
3 2 3 3
1 1
– εμβαδόν τριγώνου με κορυφές (0,0), (0, ), ( ,0)
3 3
P (, ) (0,2),(0, 3) 0
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 10
ΙΔΙΟΤΗΤΕΣ ΝΟΜΩΝ ΠΙΘΑΝΟΤΗΤΑΣ
P 1 2 3 = P A1 + P A2 + P A3 +
– δεν ισχύει για ένωση μη αριθμήσιμων γεγονότων
P A B = P A Ac B = P A + P Ac B
P B = P A B Ac B = P A B + P Ac B
P = P + P - P
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 11
ΠΑΡΑΔΕΙΓΜΑ ΥΠΟΛΟΓΙΣΜΟΥ
ΠΙΘΑΝΟΤΗΤΩΝ
=1- P KKKK = 1- =
1 15
16 16
• Επιλέγουμε χαρτί από τράπουλα
Άσος ή ρήγας:
PA K = P A P K
4 4 1
52 52 13
Άσος ή μαύρο:
PA M = P A + P M - P A M =
4 26 2 7
+ -
52 52 52 13
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 12
ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ
P
• P | = αν P 0
P
– «μερίδιο» του A στο νέο δειγματικό χώρο
P 1 2 | = P 1 | + P 2 | - P 1 2 |
P c | = 1- P |
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 13
ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ
ΠΑΡΑΔΕΙΓΜΑ
4
3
2
1
1 2 3 4
•
P max X,Y = 2 | min X,Y = 2 =
1
5
•
P max X,Y = 3| min X,Y = 2 =
2
5
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 14
ΠΟΛΛΑΠΛΑΣΙΑΣΤΙΚΟΣ ΚΑΝΟΝΑΣ
• Γενίκευση: P 1 2 n = P 1 P 2 | 1
P 3 | 1 2 P n | 1 2 n-1
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 15
ΠΟΛΛΑΠΛΑΣΙΑΣΤΙΚΟΣ ΚΑΝΟΝΑΣ
39 38 37
Απάντηση: 52 51 50
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 16
ΘΕΩΡΗΜΑ ΣΥΝΟΛΙΚΗΣ ΠΙΘΑΝΟΤΗΤΑΣ
1 2 n =
• P | i γνωστές
• P P | 1 P 1 P | 2 P 2 P | n P n
– σταθμισμένος μέσος όρος των δεσμευμένων
πιθανοτήτων
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 17
ΘΕΩΡΗΜΑ ΣΥΝΟΛΙΚΗΣ ΠΙΘΑΝΟΤΗΤΑΣ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 18
ΚΑΝΟΝΑΣ ΤΟΥ BAYES
P Αi P | i P i P B | Ai P Ai
• P i |
P P n
j=1
P B| Aj P Aj
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 19
ΑΝΕΞΑΡΤΗΣΙΑ ΓΕΓΟΝΟΤΩΝ
• A,B ανεξάρτητα αν P A | B = P A
– Πραγματοποίηση του B δεν προσφέρει πληροφορίες
για το A
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 20
ΔΕΣΜΕΥΜΕΝΗ ΑΝΕΞΑΡΤΗΣΙΑ
P( | ) = P | P |
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 21
ΔΕΣΜΕΥΜΕΝΗ ΑΝΕΞΑΡΤΗΣΙΑ:
ΠΑΡΑΔΕΙΓΜΑ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 22
ΑΝΕΞΑΡΤΗΣΙΑ ΠΟΛΛΩΝ ΓΕΓΟΝΟΤΩΝ
P Αi1 Αi2
Αik = P Αi1 P Αi2 P Αi k
π.χ. Α, B, Γ ανεξάρτητα αν
P P P
P P P
P P P
P P P P
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 23
ΑΡΙΘΜΗΣΗ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 24
ΒΑΣΙΚΗ ΑΡΧΗ ΑΡΙΘΜΗΣΗΣ
• Πείραμα σε r στάδια
Απάντηση: n1 n2 n7 = 8 106
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 25
ΜΕΤΑΘΕΣΕΙΣ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 26
ΣΥΝΔΥΑΣΜΟΙ
n
• : Για σύνολο n στοιχείων, αριθμός υποσυνόλων με k
k
στοιχεία
n
• Αριθμός k-μεταθέσεων = k!
k
n
– 1ο στάδιο: επιλογή k αντικειμένων επιλογές
k
– 2ο στάδιο: επιλογή μετάθεσης των k αντικειμένων
(k! επιλογές)
n n! n n!
• Άρα, k!= =
k (n- k)! k k!(n- k)!
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 27
ΣΥΝΔΥΑΣΜΟΙ
10
: τρόποι με τους οποίους μπορούν να επιλεγούν 3
3 θέσεις για Γ από σύνολο 10 θέσεων
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 28
ΔΙΑΜΕΡΙΣΕΙΣ
n
• : τρόποι διαχωρισμού n αντικειμένων σε r
n1,n 2 , ,n r ομάδες μεγέθους n ,n , ,n
1 2 r
n n!
•
n1 ,n 2 , ,n r n1!n 2! n r!
52 52!
Απάντηση:
13,13,13,13 13!13!13!13!
11 11!
1,4,4,2 1!4!4!2!
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 29
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ ΜΕΣΩ
ΑΡΙΘΜΗΣΗΣ
65 43 2
– P
65
• Ρίχνουμε νόμισμα 10 φορές, P = p
Α={ 3 φορές Γ }
P ;
10
– διαφορετικές ακολουθίες με 3 γράμματα
3
– Κάθε ακολουθία έχει πιθανότητα p3 1- p
7
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 30
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ ΜΕΣΩ
ΑΡΙΘΜΗΣΗΣ
10 3
– P p 1- p (συνέχεια από το
7
3 προηγούμενο παράδειγμα)
4!48!
– P
12!4
134 4!
52! 49 50 51 52
13!4
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 31
ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ
• Παραδείγματα
– αριθμός Κ σε 3 ρίψεις νομίσματος (0, 1, 2, 3)
– άθροισμα δύο ρίψεων ζαριού (2, 3, , 12)
– χρόνος παραγωγής προϊόντων (τιμή σε κάποιο συνεχές
διάστημα)
• Συμβολισμός
X : τυχαία μεταβλητή
x: αριθμητική τιμή
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΔΙΑΚΡΙΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ
– pX x 0, pX x =1
X
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΔΙΑΚΡΙΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ
pX 0 P X 0 P
1
4
pX 2 P X 2 P
1
4
pX 1 P X 1 P P
1
2
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΠΑΡΑΔΕΙΓΜΑΤΑ ΔΙΑΚΡΙΤΩΝ ΤΥΧΑΙΩΝ
ΜΕΤΑΒΛΗΤΩΝ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΠΑΡΑΔΕΙΓΜΑΤΑ ΔΙΑΚΡΙΤΩΝ ΤΥΧΑΙΩΝ
ΜΕΤΑΒΛΗΤΩΝ
λk
– pX k = P X = k = e ,
-λ
k=0,1,2,
k!
5
Προσεγγιστικά, Χ: Poisson με λ=100•0,01=1
e-1 15
P X = 5 = 0,00306
5!
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
• Y = g X
•
pY y = P Y = y = P g X = y pX x
x:g(x)=y
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 7
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
• Παράδειγμα
pX x ,
1
x= - 4,-3,-2,-1,0,1,2,3,4
9
Y X
pY 0 = pX 0 =
1
9
Για k=1,2,3,4, pY k = pX k + pX -k =
2
9
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 8
ΜΕΣΗ ΤΙΜΗ
• Ορισμός: E X x pX x
X
• Ερμηνείες
– Μέσος όρος αποτελεσμάτων σε μεγάλο αριθμό
επαναλήψεων του πειράματος
– Κέντρο βάρους της συνάρτησης μάζας πιθανότητας
• Παράδειγμα
X : αποτέλεσμα ρίψης ζαριού
pX x = ,
1
x=1,2,3,4,5,6
6
E X (1 2 3 4 5 6)
1
6
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 9
ΜΕΣΗ ΤΙΜΗ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 10
ΙΔΙΟΤΗΤΕΣ ΜΕΣΗΣ ΤΙΜΗΣ
• E Y = y pY (y)
y
– E Y = E g X = g(x) pX x
x
• Παράδειγμα
V: ταχύτητα (km/h), P(V = 5) = 0,6 , P(V = 30) = 0,4
Τ: χρόνος για απόσταση 2 km
2 2
E T E 0,6
2 4
0,4
V 5 30 15
• Γενικά, Ε g X g E X
– Εξαίρεση: γραμμικές συναρτήσεις
Ε αX+ β αE X β
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 11
ΔΙΑΣΠΟΡΑ
2
• var X E X-E X
– Μέτρο δικύμανσης των τιμών της X
• Ιδιότητες
– var X 0
– var αX+ β α2 var X
H σταθερά β μετατοπίζει τις τιμές της τυχαίας
μεταβλητής χωρίς να αλλάζει τη διακύμανσή τους
var X E 2 - E X
2
• Τυπική απόκλιση
var(X)
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 12
ΔΙΑΣΠΟΡΑ
• Παράδειγμα
X : αποτέλεσμα ρίψης ζαριού
7
2
2 12 22 32 42 52 62 1 91
6 6
2
91 7 35
var X
6 2 12
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 13
ΜΕΣΗ ΤΙΜΗ ΚΑΙ ΔΙΑΣΠΟΡΑ
BERNOULLI, POISSON
• Bernoulli
pX 0 =1- p, pX 1 = p
E X 0 (1- p)+1 p = p
E X2 02 (1- p)+12 p = p
var X = p- p2 = p (1-p)
• Poisson
λk
pX k = e , k = 0,1,2,
-λ
k!
λk
E X k e
k!
=λ -λ
k=0
E X 2
k e
k=0
λk
2
k!
= λ (λ+1)
-λ
var X λ (λ+1) - λ2 λ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 14
ΑΠΟ ΚΟΙΝΟΥ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ
– pX,Y x, y = 1
x,y
– pX x = P X = x = P X = x και Y = y pX,Y x, y
y y
– pY y = pX,Y x, y
x
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 15
ΑΠΟ ΚΟΙΝΟΥ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ
• Παράδειγμα
1 2 3 4 Χ
pX 2 = pX,Y 2,1 + pX,Y 2,2 + pX,Y 2,3 + pX,Y 2,4 =
6
20
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 16
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
• Z = g X,Y
– pZ z = P g X,Y = z = pX,Y x, y
(x,y):g(x,y)=z
• Παράδειγμα: Z = X+ 2Y
Υ 0 1/20 1/20 1/20
4
1 2 3 4 Χ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 17
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
(συνέχεια παραδείγματος)
E Z = E X + 2E Y
pX 1 = , p X 2 = , p X 3 = , p X 4 =
3 6 8 3
20 20 20 20
Ε X =1
3 6 8 3
2 +3 +4 2,55
20 20 20 20
pY 1 = , p Y 2 = , p Y 3 = , p Y 4 =
3 7 7 3
20 20 20 20
Ε Y =1
3 7 7 3
2 +3 +4 2,5
20 20 20 20
E Z 2,55 2 2,5 7,55
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 18
ΠΟΛΛΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ
pX x = pX,Y,Z x, y,z
y z
E g X,Y,Z = g x, y,z pX,Y,Z x, y,z
x y z
• E α1 X1 α2 X2 αn Xn α1 E X1 α2 E X2 α n E Xn
– Μέση τιμή διατηρεί την γραμμικότητα της συνάρτησης
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 19
ΔΕΣΜΕΥΜΕΝΗ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ
pX|A x = P X = x | A =
P X = x A
PA
• Πολλαπλασιαστικός κανόνας
pX,Y x, y pY y pX|Y x, y
pX x = pX,Y x, y = pX|Y x, y pY y
y y
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 20
ΔΕΣΜΕΥΜΕΝΗ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ
E X = E X | Ai P A i
i
– E X = E X | Y = y pY y
y
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 21
ΓΕΩΜΕΤΡΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
• Μέση τιμή
– E X = x 1- p p
x-1
x=1
E X = X | X = 1 P X = 1 E X | X > 1 P X > 1
1 p+ 1 + E X 1- p E X =
1
p
• Διασπορά
E X 2 = X 2 | X = 1 P X = 1 E X 2 | X > 1 P X > 1
2
1 p E 1 X 1- p E X 2 2 -
2 1
p p
var X =
2 1 1 1- p
- - = 2
p2 p p2 p
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 22
ΑΝΕΞΑΡΤΗΣΙΑ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
• Παράδειγμα
Υ4 0 1/20 1/20 1/20
1 2 3 4 Χ
• Είναι οι X,Y ανεξάρτητες;
– Όχι: pX,Y 2,4 = pX 2 pY 4 =
1 18
20 400
– Εναλλακτικά, pX|Y 1| 4 = 0 pX 1
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 23
ΑΝΕΞΑΡΤΗΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ
• Αν X,Y ανεξάρτητες
– E XY = E X E Y
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 24
ΣΥΝΔΙΑΣΠΟΡΑ
• cov X,Y = E XY - E X E Y
– Χ,Υ ανεξάρτητες cov X,Y = 0
(Το αντίθετο δεν ισχύει απαραίτητα)
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 25
ΣΥΝΔΙΑΣΠΟΡΑ
n n
var Xi =
var Xi +
cov Xi ,X j
i=1 i=1 i,j: i j
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 26
ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ
• -1 ρ 1
– ρ =1 Y = αX+ β (γραμμική σχέση)
– ρ=0: X,Y ασυσχέτιστες
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 27
ΣΥΝΕΧΕΙΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ
b
P a X b = f X x dx
a
– fX x dx = 1
-
– Για μικρό δ
P x X x+ δ fX x δ
– PX = a = 0
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΜΕΣΗ ΤΙΜΗ ΚΑΙ ΔΙΑΣΠΟΡΑ
• E X = x fX x dx , κέντρο βάρους
-
• E g X = g x fX x dx
-
var X = E X - E X = x f X x dx- E X
2 2
• 2 2
-
– E X =
a+ b
2
b- a
2
– var X =
12
– E X =
1
λ
– var X =
1
λ2
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΑΘΡΟΙΣΤΙΚΗ ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΑΘΡΟΙΣΤΙΚΗ ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΙΔΙΟΤΗΤΕΣ ΕΚΘΕΤΙΚΗΣ ΤΥΧΑΙΑΣ
ΜΕΤΑΒΛΗΤΗΣ
• Έλλειψη μνήμης
– Αν ο χρόνος μεταξύ διαδοχικών γεγονότων είναι
εκθετική τυχαία μεταβλητή, τα μελλοντικά γεγονότα
δεν εξαρτώνται από τα προηγούμενα
– FX x =1- e-λ x P X > x = e-λ x
PX > t + x
– PX > t + x | X > t = = P X > x
PX > t
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ
• Y = g X
• X: τυχαία μεταβλητή με γνωστή pdf f X x
• Ζητούμενο: pdf της Y , f Y y
– g X 1-1, h y αντίστροφη της g X
dh y
fY y fX h y dy
E X = μ, var X = σ2
• Συμβολισμός X N μ,σ2
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 8
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
•
X N μ,σ2 aX+ b N aμ + b, a 2 σ2
– Y = aX+ b
2
1 y-b-a μ
1 y- b
– fY y =
1 2 a σ
fX = e
a a a σ 2π
X- μ
• Y= : τυποποιημένη κανονική μεταβλητή
σ
E Y = 0, var Y =1
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 9
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ
•
X N μ,σ2
X- μ x - μ x- μ
– FX x = P X x P
σ σ σ
• Παράδειγμα: X N 60,202
P X 80 ;
80 - 60
P X 80 1- FX 80 1-
20
1- 1 =1- 0,8413 = 0,1587
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 10
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 11
ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ
• MX s = E esX
– Αντιστοιχία 1-1 μεταξύ τυχαίας μεταβλητής X και
ροπογεννήτριας MX s
+μ s
X N μ,σ2 MX s =e 2
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΑΘΡΟΙΣΜΑ ΚΑΝΟΝΙΚΩΝ ΤΥΧΑΙΩΝ
ΜΕΤΑΒΛΗΤΩΝ
• Xi
N μi ,σi2 , i =1,2, ,n , ανεξάρτητες
n
• W= ci X i n
i=1
s ci Xi
• M W s = E e = E e
sW i=1 =
c σ s
2 2 2
c μ
i i
n +
= M X sci = e
i i
2
i
i=1
n n
• W N ci μi , ci σi , διότι M W s είναι
2 2
i=1 i=1
ροπογεννήτρια κανονικής τυχαίας μεταβλητής
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΚΕΝΤΡΙΚΟ ΟΡΙΑΚΟ ΘΕΩΡΗΜΑ
• Sn = X1 X2 Xn
E Zn = 0, var Zn =1
Sn - nμ
Zn
σ n
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΚΕΝΤΡΙΚΟ ΟΡΙΑΚΟ ΘΕΩΡΗΜΑ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΠΡΟΣΕΓΓΙΣΗ ΔΙΩΝΥΜΙΚΗΣ
• X = X1 X2 Xn
– Άθροισμα n ανεξάρτητων τυχαίων μεταβλητών
Bernoulli
1 1
• P X = k = P k- X k+ , k =1, ,n-1
2 2
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι
Συμπληρωματικές Σημειώσεις
Δημήτριος Παντελής
ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ
Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων
μεταβλητών χαρακτηρίζονται από κάποιες παραμέτρους. Παραδείγματος χάριν, η
μέση τιμή και η διασπορά ( , 2 ) χαρακτηρίζουν τη συνάρτηση πυκνότητας
πιθανότητας της κανονικής τυχαίας μεταβλητής, η μέση τιμή τη συνάρτηση
πιθανότητας της Poisson, και η πιθανότητα επιτυχίας p τη συνάρτηση πιθανότητας
της διωνυμικής. Όταν αυτές οι παράμετροι είναι άγνωστες, εκτιμώνται από
δειγματοληπτικές μετρήσεις, π.χ. η μέση τιμή του βάρους μιας συσκευασίας
εκτιμάται από το μέσο βάρος της συσκευασίας σε ένα πεπερασμένο δείγμα. Η
ανάλυση που ακολουθεί υποθέτει ότι η δειγματοληψία γίνεται με τυχαίο τρόπο,
δηλαδή οι μετρήσεις του δείγματος είναι ανεξάρτητες μεταξύ τους.
1. Σημειακή εκτίμηση
Έστω άγνωστη παράμετρος που χαρακτηρίζει μια τυχαία μεταβλητή X . Η
παράμετρος αυτή εκτιμάται από τυχαίο δείγμα που αποτελείται από μετρήσεις
X 1 , X 2 , , X n . Οι τιμές του δείγματος είναι ανεξάρτητες τυχαίες μεταβλητές με
συνάρτηση (πυκνότητας) πιθανότητας ίδια με της X . Από τις τιμές αυτές προκύπτει
μια εκτιμήτρια συνάρτηση ˆ η τιμή της οποίας δίνει μια εκτίμηση για την παράμετρο
. Ακολουθούν ορισμένα παραδείγματα εκτιμητριών.
1
από το αντίστοιχο ποσοστό στο δείγμα, το οποίο ισούται με pˆ An n , όπου An ο
Ιδιότητες εκτιμητριών
Η εκτίμηση βασίζεται σε μετρήσεις από ένα υποσύνολο του πληθυσμού (δείγμα), άρα
είναι φυσικό να αποκλίνει από την πραγματική τιμή της παραμέτρου με συνέπεια
την ύπαρξη σφάλματος εκτίμησης | ˆ | . Η μέση τιμή του τετραγώνου του
2
E( X 2 ) var( X ) [E( X )]2 2 .
n
2
Συνδυάζοντας τις παραπάνω σχέσεις παίρνουμε E( S 2 ) 2 , άρα η S 2 είναι
Ποσοστό σε δείγμα. Έστω p η πιθανότητα ένα μέλος του δείγματος να έχει μια
συγκεκριμένη ιδιότητα. Άρα ο αριθμός An των μελών του δείγματος με αυτή την
Κατανομές εκτιμητριών
Υπάρχουν περιπτώσεις εκτιμητριών για τις οποίες, εκτός από τη μέση τιμή και τη
διασπορά τους, είναι εφικτό να προσδιοριστεί και η συνάρτηση πυκνότητας
πιθανότητας.
X
διασπορά 2 n , δηλαδή ~ N (0,1) . Αν όμως η διασπορά είναι άγνωστη,
n
X
χρησιμοποιούμε την εκτιμήτριά της S 2 για την οποία ισχύει ~ tn 1 , όπου tn 1
S n
είναι η κατανομή Student (ή κατανομή t ) με n 1 βαθμούς ελευθερίας.
2) Αν το δείγμα είναι μεγάλο ( n 30 ), τότε λόγω του κεντρικού οριακού θεωρήματος
και ανεξαρτήτως της κατανομής του πληθυσμού η μέση τιμή του δείγματος είναι
προσεγγιστικά κανονική με μέση τιμή και διασπορά 2 n . Η προσέγγιση ισχύει
X
ακόμα και όταν η διασπορά 2 είναι άγνωστη, οπότε έχουμε ~ N (0,1) .
S n
3
Ποσοστό σε δείγμα. Για μεγάλα δείγματα το ποσοστό p̂ είναι προσεγγιστικά
p(1 p)
κανονική τυχαία μεταβλητή με μέση τιμή p και διασπορά .
n
2. Διαστήματα εμπιστοσύνης
Τα διαστήματα εμπιστοσύνης αποτελούν μια ευρύτερη μορφή εκτίμησης από τη
σημειακή. Αντί η άγνωστη παράμετρος να εκτιμηθεί από μια συγκεκριμένη τιμή,
υπολογίζεται ένα διάστημα που περιέχει την τιμή αυτής της παραμέτρου με μια
προκαθορισμένη πιθανότητα.
Ορισμός. Το διάστημα [a, b] είναι ένα 100(1 )% διάστημα εμπιστοσύνης για την
παράμετρο αν P( [a, b]) 1 .
S S
X t 2 , n 1 , X t ,n 1 , όπου t , είναι η τιμή για την οποία ισχύει
n 2 n
P t t , και μπορεί να βρεθεί από τον πίνακα στο τέλος των σημειώσεων.
4
Τέλος, για μεγάλα δείγματα το αντίστοιχο διάστημα εμπιστοσύνης είναι της μορφής
ήS ήS
X z 2 , X z 2 .
n n
Το εύρος του διαστήματος εμπιστοσύνης έχει άμεση σχέση με το σφάλμα
ήS
εκτίμησης X . Συγκεκριμένα ισχύει P X z 2 . Αν λοιπόν
n
θέλουμε το σφάλμα εκτίμησης της μέσης τιμής να είναι μεγαλύτερο από d με
πιθανότητα το πολύ , πρέπει το μισό του 100(1 )% διαστήματος εμπιστοσύνης
να είναι το πολύ d . Αυτό σημαίνει ότι το απαιτούμενο μέγεθος δείγματος είναι
2 2
z 2 2 z 2 2
ή S ανάλογα με το αν η διασπορά είναι γνωστή ή άγνωστη. Στη
d d
δεύτερη περίπτωση η διασπορά S 2 υπολογίζεται από κάποιο μικρό αρχικό δείγμα.
p (1 p) p(1 p)
διάστημα εμπιστοσύνης pˆ z 2 , pˆ z 2 , όπου όμως η
n n
παράμετρος p είναι η άγνωστη παράμετρος που θέλουμε να εκτιμήσουμε. Το
πρόβλημα παρακάμπτεται αντικαθιστώντας το p(1 p) με το pˆ (1 pˆ ) και τελικά
pˆ (1 pˆ ) pˆ (1 pˆ )
παίρνουμε διάστημα εμπιστοσύνης pˆ z 2 , pˆ z 2 .
n n
Όσον αφορά το σφάλμα εκτίμησης p̂ p , αν θέλουμε να είναι μεγαλύτερο από