Download as pdf or txt
Download as pdf or txt
You are on page 1of 78

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I

Παντελής Δημήτριος
Τμήμα Μηχανολόγων Μηχανικών

Πανεπιστήμιο Θεσσαλίας
ΕΝΝΟΙΑ ΠΙΘΑΝΟΤΗΤΑΣ

• Μαθηματική περιγραφή συστημάτων με αβεβαιότητα

• Παραδείγματα από την οργάνωση παραγωγής


– Διάρκεια παραγωγής προϊόντων
– Ζήτηση προϊόντων
– Βλάβες μηχανών
– Διαθεσιμότητα προσωπικού

• Εμπειρικός ορισμός πιθανότητας: σχετική συχνότητα


γεγονότος

• Υποκειμενικός ορισμός πιθανότητας: πεποίθηση σχετικά με


κάποιο γεγονός

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΔΕΙΓΜΑΤΙΚΟΣ ΧΩΡΟΣ

• Ω: σύνολο δυνατών αποτελεσμάτων ενός πειράματος


– Στοιχεία του Ω αμοιβαίως αποκλειόμενα
– To Ω καλύπτει όλα τα ενδεχόμενα

• Το Ω μπορεί να ορίζεται με διαφορετικούς τρόπους

• Παράδειγμα: ρίψη ζαριού

Ω={1,2,3,4,5,6}

Ω={περιττός, άρτιος}

Ω={1 ή 3, 1 ή 4, 2, 5, 6}, μη αποδεκτός δειγματικός χώρος


γιατί τα 2 πρώτα στοιχεία δεν είναι αμοιβαίως
αποκλειόμενα.

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΠΑΡΑΔΕΙΓΜΑ ΔΙΑΚΡΙΤΟΥ ΔΕΙΓΜΑΤΙΚΟΥ
ΧΩΡΟΥ

• Δύο ρίψεις τετράεδρου ζαριού


Χ: Αποτέλεσμα πρώτης ρίψης
Y: Αποτέλεσμα δεύτερης ρίψης

4
Y3
2
1
1 2 3 4
X
• 16 ενδεχόμενα
Ω={(1,1), (1,2), . . . ., (4,4)}

• Η περιγραφή με δέντρο ενδείκνυται όταν το πείραμα


γίνεται σε στάδια

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΠΑΡΑΔΕΙΓΜΑ ΣΥΝΕΧΟΥΣ ΔΕΙΓΜΑΤΙΚΟΥ
ΧΩΡΟΥ

• Βελάκι σε τετραγωνικό στόχο διαστάσεων 1×1

• (x,y): οι συντεταγμένες σημείου που καρφώνεται το βελάκι

• Υποθέτοντας ότι το βελάκι βρίσκει σίγουρα το στόχο, ο


δειγματικός χώρος αποτελείται από τα σημεία που
απαρτίζουν το στόχο
Ω={ (x, y): 0≤ x, y ≤1}

• Ω: άπειρος, μη αριθμήσιμος δειγματικός χώρος

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ

• Γεγονός: υποσύνολο δειγματικού χώρου


– Γεγονότα Α, B ξένα μεταξύ τους αν το ένα αποκλείει το
άλλο,     

• Σε κάθε γεγονός αντιστοιχεί μία πιθανότητα

• Αξιώματα πιθανοτήτων
1. P  A   0
2. P  Ω  =1
3. P  Α  Β =P  Α  +P  Β αν     

• Τα αξιώματα αρκούν για τον υπολογισμό οποιασδήποτε


πιθανότητας
– π.χ. Αν Α, B, Γ ξένα μεταξύ τους ανά δύο τότε
P         P  Α +P  Β +P  Γ 
εφαρμόζοντας δύο φορές το Αξίωμα 3
– Ανάλογο αποτέλεσμα και για την ένωση περισσότερων
γεγονότων

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ: ΠΑΡΑΔΕΙΓΜΑ

• Δύο ρίψεις τετράεδρου ζαριού

1
Y 2
3
4
1 2 3 4
X
• Νόμος πιθανότητας: ίδια πιθανότητα για κάθε αποτέλεσμα
1
16

• Πιθανότητα γεγονότος: Το άθροισμα πιθανοτήτων


αποτελεσμάτων που απαρτίζουν το γεγονός
P  (, )  (1,2) ή (2,4)  
1 1 2
 
16 16 16
P     άρτιος   8 
1
16
P    4 
1
16
P    7 
1
16
P  τουλάχιστον ένα 4  
7
16
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 7
ΔΙΑΚΡΙΤΟΣ ΟΜΟΙΟΜΟΡΦΟΣ ΝΟΜΟΣ
ΠΙΘΑΝΟΤΗΤΑΣ

• Όλα τα αποτελέσματα έχουν την ίδια πιθανότητα

αριθμός στοιχείων του Α


• P() 
αριθμός στοιχείων του Ω

– Πρόβλημα αρίθμησης

• Παραδείγματα: καλά ανακατεμένες τράπουλες,


φυσιολογικά νομίσματα και ζάρια

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 8
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ: ΠΑΡΑΔΕΙΓΜΑ
ΣΥΝΕΧΟΥΣ ΔΕΙΓΜΑΤΙΚΟΥ ΧΩΡΟΥ

• Βελάκι σε στόχο

• Μη μηδενική πιθανότητα σε κάθε σημείο: Μη αποδεκτός


νόμος πιθανότητας
– Οδηγεί σε άτοπο

• Νόμος πιθανότητας: ορίζει πιθανότητα για κάθε περιοχή


που ανήκει στο στόχο

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 9
ΝΟΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ: ΠΑΡΑΔΕΙΓΜΑ
ΣΥΝΕΧΟΥΣ ΔΕΙΓΜΑΤΙΚΟΥ ΧΩΡΟΥ

• Ομοιόμορφος νόμος πιθανότητας: Πιθανότητα=εμβαδόν

 1 1 1 1
P        
 3 2 3 3
1 1
– εμβαδόν τριγώνου με κορυφές (0,0), (0, ), ( ,0)
3 3

 
P (, )   (0,2),(0, 3)   0

– κάθε σημείο έχει μηδενικό εμβαδόν

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 10
ΙΔΙΟΤΗΤΕΣ ΝΟΜΩΝ ΠΙΘΑΝΟΤΗΤΑΣ

• Με εφαρμογή των Αξιωμάτων 2,3


     
1= P   = P   c = P     P c  P Ac = 1- P   

• Με εφαρμογή του Αξιώματος 3, εάν 1, 2 , 3 , είναι ανά


δύο ξένα μεταξύ τους τότε:

P  1  2  3   = P  A1  + P  A2  + P  A3  +
– δεν ισχύει για ένωση μη αριθμήσιμων γεγονότων

• Με εφαρμογή του Αξιώματος 3

  
P  A  B = P  A  Ac  B  = P  A  + P Ac  B
 
 


 
P  B = P   A  B  Ac  B  = P  A  B + P Ac  B
 
  


 P     = P   + P   - P     

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 11
ΠΑΡΑΔΕΙΓΜΑ ΥΠΟΛΟΓΙΣΜΟΥ
ΠΙΘΑΝΟΤΗΤΩΝ

• Ρίχνουμε νόμισμα 4 φορές

P  τουλάχιστον 1 φορά Γράμματα  = ;

Δειγματικός χώρος : 16 ισοπίθανα ενδεχόμενα


P  τουλάχιστον 1 Γ =1- P  κανένα Γ 

=1- P  KKKK  = 1- =
1 15
16 16
• Επιλέγουμε χαρτί από τράπουλα
Άσος ή ρήγας:
PA  K = P A  P K  
4 4 1
 
52 52 13
Άσος ή μαύρο:
PA  M = P A + P M - P A  M  =
4 26 2 7
 + - 
52 52 52 13

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 12
ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ

• Πληροφορία σχετικά με την έκβαση του πειράματος αλλάζει


το δειγματικό χώρο και τις πεποιθήσεις μας (πιθανότητες
γεγονότων)

• P   |  : πιθανότητα του A δεδομένου του B


– B: νέος δειγματικός χώρος

P    
• P   |  = αν P    0
P  
– «μερίδιο» του A στο νέο δειγματικό χώρο

• Ιδιότητες νόμων πιθανότητας ισχύουν και στο νέο


δειγματικό χώρο

P  1  2 |  = P  1 |  + P  2 |  - P  1  2 | 

 
P c |  = 1- P   |  

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 13
ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ
ΠΑΡΑΔΕΙΓΜΑ

• Δυο ρίψεις τετράεδρου ζαριού

• Πληροφορία: min  X,Y  = 2

• Νέος δειγματικός χώρος: 5 ενδεχόμενα (σκιασμένη περιοχή)

4
3
2
1
1 2 3 4

•  
P max  X,Y  = 2 | min  X,Y  = 2 =
1
5

•  
P max  X,Y  = 3| min  X,Y  = 2 =
2
5

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 14
ΠΟΛΛΑΠΛΑΣΙΑΣΤΙΚΟΣ ΚΑΝΟΝΑΣ

• Ορισμός δεσμευμένης πιθανότητας 


P      P     P   |  

• Γενίκευση: P  1  2  n  = P  1   P  2 | 1  

 P  3 | 1  2  P  n | 1  2   n-1 

• Παράδειγμα: 3 χαρτιά από τράπουλα


P (καμία κούπα) = ;

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 15
ΠΟΛΛΑΠΛΑΣΙΑΣΤΙΚΟΣ ΚΑΝΟΝΑΣ

Δέντρο: Δεσμευμένες πιθανότητες στους κλάδους

39  38  37
Απάντηση: 52 51 50

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 16
ΘΕΩΡΗΜΑ ΣΥΝΟΛΙΚΗΣ ΠΙΘΑΝΟΤΗΤΑΣ

• 1, 2 , , n ξένα μεταξύ τους

1  2   n = 

• P   | i  γνωστές

• P    P   | 1   P  1   P   | 2   P  2    P   | n   P  n 
– σταθμισμένος μέσος όρος των δεσμευμένων
πιθανοτήτων

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 17
ΘΕΩΡΗΜΑ ΣΥΝΟΛΙΚΗΣ ΠΙΘΑΝΟΤΗΤΑΣ

• Παράδειγμα: Αντίπαλοι 3 κατηγοριών στο σκάκι


1. Ανήκει το 50% , πιθανότητα νίκης 0,3
2. Ανήκει το 25%, πιθανότητα νίκης 0,4
3. Ανήκει το 25%, πιθανότητα νίκης 0,5

P  νίκη  0,3  0,5  0, 4  0, 25  0,5  0, 25  0,375

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 18
ΚΑΝΟΝΑΣ ΤΟΥ BAYES

P  Αi    P   | i   P  i  P  B | Ai   P  Ai 
• P  i |     
P  P  n


j=1
  
P B| Aj  P Aj

• Παράδειγμα: Σκάκι (συνέχεια)


Έστω ότι κερδίζουμε
P  αντίπαλος από 1η κατηγορία  = ;
 
P   |   1  P    1 0,3  0,5
P    1|      0,4
P 0,375

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 19
ΑΝΕΞΑΡΤΗΣΙΑ ΓΕΓΟΝΟΤΩΝ

• A,B ανεξάρτητα αν P  A | B = P  A 
– Πραγματοποίηση του B δεν προσφέρει πληροφορίες
για το A

• Από πολλαπλασιαστικό κανόνα


P  A B = P  B  P(A | B) 
P  A B = P  A   P  B αν A,B ανεξάρτητα

– Γεγονότα ξένα μεταξύ τους δεν είναι ανεξάρτητα


• Παράδειγμα: 2 ρίψεις τετράεδρου ζαριού με ισοπίθανα
ενδεχόμενα
A = {1 στην 1η ρίψη}
B = {άθροισμα 5}
P(A  B) = P  (1,4)  
1
16
1
P(A) =
4
P(B) = P  (1,4),(2,3),(3,2),(4,1)  =
4
16
P(A B) = P(A)  P(B)  A,B ανεξάρτητα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 20
ΔΕΣΜΕΥΜΕΝΗ ΑΝΕΞΑΡΤΗΣΙΑ

• Έστω A,B ανεξάρτητα

• Αν ξέρουμε ότι έχει συμβεί το  τα A,B είναι ξένα μεταξύ


τους, άρα παύουν να είναι ανεξάρτητα

• A,B ανεξάρτητα δεδομένου του Γ εάν


P ( A |   ) = P   |  

P(   | ) = P   |    P   |  

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 21
ΔΕΣΜΕΥΜΕΝΗ ΑΝΕΞΑΡΤΗΣΙΑ:
ΠΑΡΑΔΕΙΓΜΑ

• Νόμισμα Α: Κορώνα με πιθανότητα p1


Νόμισμα B: Κορώνα με πιθανότητα p 2

• Επιλέγουμε νόμισμα και το ρίχνουμε 2 φορές


– Αν ξέρουμε ποιο είναι, οι δυο ρίψεις είναι ανεξάρτητες
– Αν δεν ξέρουμε;
K1,K 2 : κορώνα στην 1η και 2η ρίψη αντίστοιχα

P(1)  P(1 | )  P     P( 2 | )  P   


1
 (p1+ p2 )
2
1
P( 2 )   (p1 + p2 )
2
1
P(1   2 )   (p12 + p22 )
2

Αν p1  p2, K1,K 2 δεν είναι ανεξάρτητα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 22
ΑΝΕΞΑΡΤΗΣΙΑ ΠΟΛΛΩΝ ΓΕΓΟΝΟΤΩΝ

• 1, 2 , , k ανεξάρτητα αν για κάθε υποσύνολο τους


i1 , i2 , , ik ισχύει


P Αi1  Αi2        
 Αik = P Αi1  P Αi2    P Αi k

π.χ. Α, B, Γ ανεξάρτητα αν
P      P     P  
P       P    P   
P       P    P   
P         P     P    P   

• Παράδειγμα: Ανεξαρτησία ανά ζεύγη δεν συνεπάγεται


ανεξαρτησία
– Δύο ρίψεις νομίσματος
– Α: Κορώνα στην 1η, B: Κορώνα στην 2η, Γ: Διαφορετικά
αποτελέσματα
– Α, B, Γ ανεξάρτητα ανά δυο
Όμως, P         0  P    P    P   

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 23
ΑΡΙΘΜΗΣΗ

• Για ισοπίθανα ενδεχόμενα στο δειγματικό χώρο Ω


αριθμός στοιχείων του Α
P  A 
αριθμός στοιχείων του Ω

• Αν όλα τα στοιχεία του Α έχουν την ίδια πιθανότητα p


P  A    αριθμός στοιχείων του A  p

• Ανάγκη για συστηματικές μεθόδους αρίθμησης

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 24
ΒΑΣΙΚΗ ΑΡΧΗ ΑΡΙΘΜΗΣΗΣ

• Πείραμα σε r στάδια

• n i πιθανά αποτελέσματα στο στάδιο i


– Τα αποτελέσματα αυτά μπορεί να εξαρτώνται από τα
αποτελέσματα προηγούμενων σταδίων, όμως ο
αριθμός τους είναι σταθερός, n i

• Αριθμός πιθανών αποτελεσμάτων πειράματος n1  n 2    n r

• Παράδειγμα: Πλήθος επταψήφιων αριθμών με πρώτο


ψηφίο διαφορετικό από 0 ή 1
n1 = 8 (επιλογές για το 1ο ψηφίο)
n 2 = = n7 =10 (επιλογές για τα υπόλοιπα ψηφία)

Απάντηση: n1  n2    n7 = 8  106

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 25
ΜΕΤΑΘΕΣΕΙΣ

• Επιλογή k αντικειμένων από n

• k-μεταθέσεις: Πλήθος διαφορετικών ακολουθιών k


αντικειμένων
n!
n  (n-1)    (n-k+1)=
(n-k)!
• Παράδειγμα: Το πλήθος των λέξεων με 4 διαφορετικά
γράμματα είναι
24  23  22  21

• Μεταθέσεις: Πλήθος τρόπων που μπορούν να διαταχθούν n


αντικείμενα (k=n)
n  (n -1)    2  1  n!

• Παράδειγμα: Με πόσους τρόπους μπορούν να δοθούν 5


φάρμακα σε 5 ασθενείς;
Απάντηση: 5! =120

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 26
ΣΥΝΔΥΑΣΜΟΙ

n
•   : Για σύνολο n στοιχείων, αριθμός υποσυνόλων με k
k
στοιχεία

n
• Αριθμός k-μεταθέσεων =    k!
k
 
 n  
– 1ο στάδιο: επιλογή k αντικειμένων    επιλογές 
 k  
– 2ο στάδιο: επιλογή μετάθεσης των k αντικειμένων
(k! επιλογές)

n n! n n!
• Άρα,    k!=    =
 
k (n- k)!  k  k!(n- k)!

• Παράδειγμα: Αριθμός διαφορετικών πεντάδων χαρτιών από


τράπουλα
 52  52!
    2598960
  5!47!
5

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 27
ΣΥΝΔΥΑΣΜΟΙ

• Παράδειγμα: Ρίχνουμε νόμισμα 10 φορές. Με πόσους


τρόπους μπορούμε να πάρουμε 3 φορές Γράμματα;

 10 
  : τρόποι με τους οποίους μπορούν να επιλεγούν 3
 3  θέσεις για Γ από σύνολο 10 θέσεων

– π.χ. (2, 3, 4): Γ τη 2η, 3η και 4η φορά

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 28
ΔΙΑΜΕΡΙΣΕΙΣ

 n 
•   : τρόποι διαχωρισμού n αντικειμένων σε r
 n1,n 2 , ,n r  ομάδες μεγέθους n ,n , ,n
1 2 r

 n  n!
•   
 n1 ,n 2 , ,n r  n1!n 2! n r!

• Παράδειγμα: Με πόσους τρόπους μπορούν να μοιραστούν


τα χαρτιά μίας τράπουλας σε 4 παίχτες; (13 ο καθένας)

 52  52!
Απάντηση:   
13,13,13,13  13!13!13!13!

• Πλήθος αναγραμματισμών της λέξης MISSISSIPPI


– αριθμός διαμερίσεων 11 θέσεων (γράμματα της λέξης)
σε 4 ομάδες μεγέθους 1 (γράμμα M), 4 (γράμμα I), 2
(γράμμα P) και 4 (γράμμα S)

 11  11!
  
 1,4,4,2  1!4!4!2!

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 29
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ ΜΕΣΩ
ΑΡΙΘΜΗΣΗΣ

• Ρίχνουμε ζάρι 5 φορές


Α={ 5 διαφορετικά αποτελέσματα}
P    ;
– Αριθμός όλων των ενδεχομένων 65

– Αριθμός ενδεχομένων που αντιστοιχούν στο Α= αριθμός


5-μεταθέσεων 6 αντικειμένων = 6  5  4  3  2

65 43 2
– P   
65
• Ρίχνουμε νόμισμα 10 φορές, P    = p
Α={ 3 φορές Γ }
P    ;

 10 
–   διαφορετικές ακολουθίες με 3 γράμματα

3
– Κάθε ακολουθία έχει πιθανότητα p3  1- p 
7

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 30
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ ΜΕΣΩ
ΑΡΙΘΜΗΣΗΣ

10  3
– P       p  1- p  (συνέχεια από το
7

3 προηγούμενο παράδειγμα)

• Μοίρασμα τράπουλας σε 4 παίχτες


Α={ ο κάθε παίχτης παίρνει έναν άσο}
P    ;
52!
– Αριθμός πιθανών διαμμερίσεων =
13!13!13!13!

– Αριθμός διαμερίσεων με 1 άσο ο καθένας =


= (αριθμός μεταθέσεων των 4 άσων)•(αριθμός
διαμερίσεων των 48 υπόλοιπων χαρτιών)=
= 4! 48!
12!12!12!12!

4!48!

– P   
12!4 
134  4!
52! 49  50  51  52
13!4

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 31
ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

• Σε κάθε αποτέλεσμα του πειράματος αντιστοιχεί μία


αριθμητική τιμή

• Μαθηματικός ορισμός: Τυχαία μεταβλητή X είναι


συνάρτηση με πεδίο ορισμού το δειγματικό χώρο Ω και
πεδίο τιμών το σύνολο των πραγματικών αριθμών
X:   R
– Για ω . Χ  ω είναι η τιμή που αντιστοιχει στο
αποτέλεσμα ω του πειράματος

• Παραδείγματα
– αριθμός Κ σε 3 ρίψεις νομίσματος (0, 1, 2, 3)
– άθροισμα δύο ρίψεων ζαριού (2, 3, , 12)
– χρόνος παραγωγής προϊόντων (τιμή σε κάποιο συνεχές
διάστημα)

• Συμβολισμός
X : τυχαία μεταβλητή
x: αριθμητική τιμή

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΔΙΑΚΡΙΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

• Πεπερασμένο ή αριθμήσιμο σύνολο τιμών

• Συνάρτηση μάζας πιθανότητας (pmf)


– πιθανότητα για κάθε τιμή της X

– σχήμα: πιθανότητα ως μάζα συγκεντρωμένη στην


αντίστοιχη τιμή
– p X  x  = P  X = x  = P ω  : X(ω)=x

– pX  x   0, pX  x  =1
X

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΔΙΑΚΡΙΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

• Παράδειγμα: X = αριθμός K σε δύο ρίψεις νομίσματος


  KK, K ,  K, 

pX  0   P  X  0   P    
1
4

pX  2  P  X  2   P    
1
4

pX 1  P  X  1  P     P    
1
2

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΠΑΡΑΔΕΙΓΜΑΤΑ ΔΙΑΚΡΙΤΩΝ ΤΥΧΑΙΩΝ
ΜΕΤΑΒΛΗΤΩΝ

• Πείραμα με δύο αποτελέσματα


“Επιτυχία” ( E: πιθανότητα p)
“Αποτυχία” ( Α: πιθανότητα 1-p)

• Τυχαία μεταβλητή Bernoulli


X : αριθμός επιτυχιών (0 ή 1)
– pX 1  p, pX  0  1- p

• Δυωνυμική τυχαία μεταβλητή


X : αριθμός επιτυχιών σε n ανεξάρτητες επαναλήψεις του
πειράματος
n k
– X p  k  = P  X = k  = n-k
  p (1- p) , k=0,1, ,n
k

• Γεωμετρική τυχαία μεταβλητή


X : αριθμός επαναλήψεων του πειράματος έως την πρώτη
επιτυχία
– X = k  k-1 αποτυχίες και μία επιτυχία
– pX  k  = P  X = k  = (1- p)k-1 p, k=1,2,3,

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΠΑΡΑΔΕΙΓΜΑΤΑ ΔΙΑΚΡΙΤΩΝ ΤΥΧΑΙΩΝ
ΜΕΤΑΒΛΗΤΩΝ

• Τυχαία μεταβλητή Poisson

λk
– pX  k  = P  X = k  = e  ,

k=0,1,2,
k!

– Προσεγγίζει ικανοποιητικά τη διωνυμική τυχαία


μεταβλητή για μεγάλο n, μικρό p και np=λ
– Παράδειγμα : 100 συσκευές, πιθανότητα βλάβης 0,01
για κάθε μία
P  5 παθαίνουν βλάβη  ;
X= αριθμός μηχανών που παθαίνουν βλάβη
Χ: διωνυμική με n=100, p=0,01
100 
P  X = 5     0,01  (1-0,01)  0,0029
5 95

 5 
Προσεγγιστικά, Χ: Poisson με λ=100•0,01=1
e-1  15
P  X = 5 =  0,00306
5!

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

• Y = g  X

• X : τυχαία μεταβλητή με γνωστή pmf pX  x 

• Ζητούμενο: pmf τηςY, pY  y 

•   
pY  y  = P  Y = y  = P g  X  = y  pX  x 
x:g(x)=y

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 7
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

• Παράδειγμα
pX  x   ,
1
x= - 4,-3,-2,-1,0,1,2,3,4
9
Y X

pY  0  = pX  0  =
1
9
Για k=1,2,3,4, pY  k  = pX  k  + pX  -k  =
2
9

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 8
ΜΕΣΗ ΤΙΜΗ

• Ορισμός: E  X    x pX  x 
X

• Ερμηνείες
– Μέσος όρος αποτελεσμάτων σε μεγάλο αριθμό
επαναλήψεων του πειράματος
– Κέντρο βάρους της συνάρτησης μάζας πιθανότητας

• Παράδειγμα
X : αποτέλεσμα ρίψης ζαριού
pX  x  = ,
1
x=1,2,3,4,5,6
6

E  X   (1  2  3  4  5  6) 
1
6

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 9
ΜΕΣΗ ΤΙΜΗ

• Λόγω συμμετρίας το κέντρο βάρους βρίσκεται στο μέσον


του διαστήματος [1,6]: 1  6  3,5
2

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 10
ΙΔΙΟΤΗΤΕΣ ΜΕΣΗΣ ΤΙΜΗΣ

• X τυχαία μεταβλητή με γνωστή pmf, Y = g  X 

• E  Y =  y pY (y)
y

– Εύρεση pY  y  δεν είναι απαραίτητη

– E  Y  = E  g  X   = g(x)  pX  x 
x

• Παράδειγμα
V: ταχύτητα (km/h), P(V = 5) = 0,6 , P(V = 30) = 0,4
Τ: χρόνος για απόσταση 2 km
2 2
E  T   E     0,6 
2 4
 0,4 
V 5 30 15

• Γενικά, Ε  g  X    g  E  X 
– Εξαίρεση: γραμμικές συναρτήσεις
Ε  αX+ β   αE  X   β

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 11
ΔΙΑΣΠΟΡΑ

 2
• var  X   E  X-E  X  
 
– Μέτρο δικύμανσης των τιμών της X

• Ιδιότητες
– var  X   0
– var  αX+ β   α2 var  X 
H σταθερά β μετατοπίζει τις τιμές της τυχαίας
μεταβλητής χωρίς να αλλάζει τη διακύμανσή τους

• Για ευκολότερο υπολογισμό

 
var  X   E 2 - E  X 
2

• Τυπική απόκλιση

   var(X)

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 12
ΔΙΑΣΠΟΡΑ

• Παράδειγμα
X : αποτέλεσμα ρίψης ζαριού
  
7
2

  
 2  12  22  32  42  52  62   1 91

6 6
2
91  7  35
var  X     
6  2  12

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 13
ΜΕΣΗ ΤΙΜΗ ΚΑΙ ΔΙΑΣΠΟΡΑ
BERNOULLI, POISSON

• Bernoulli
pX  0 =1- p, pX 1 = p

E  X   0  (1- p)+1  p = p

 
E X2  02  (1- p)+12  p = p

var  X  = p- p2 = p (1-p)

• Poisson
λk
pX  k  = e  , k = 0,1,2,

k!

λk

E X  k  e 
k!
=λ -λ

k=0

  
E X 2
 k e 
k=0
λk
2
k!
= λ  (λ+1)

var  X   λ  (λ+1) - λ2  λ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 14
ΑΠΟ ΚΟΙΝΟΥ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ

• Ταυτόχρονη μελέτη δύο ή περισσότερων τυχαίων


μεταβλητών
– Για δύο τυχαίες μεταβλητές X,Y
pX,Y  x, y  = P  X = x και Y = y 

–  pX,Y  x, y  = 1
x,y

– pX  x  = P  X = x  =  P  X = x και Y = y    pX,Y  x, y 
y y

– pY  y  =  pX,Y  x, y 
x

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 15
ΑΠΟ ΚΟΙΝΟΥ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ

• Παράδειγμα

Υ 0 1/20 1/20 1/20


4

1/20 2/20 3/20 1/20


3

1/20 2/20 3/20 1/20


2

1/20 1/20 1/20 0


1

1 2 3 4 Χ
pX  2 = pX,Y  2,1 + pX,Y  2,2  + pX,Y  2,3 + pX,Y  2,4  =
6
20

pY  4 = pX,Y 1,4  + pX,Y  2,4  + pX,Y 3,4  + pX,Y  4,4  =


3
20

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 16
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

• Z = g  X,Y 

– pZ  z  = P g  X,Y  = z =   pX,Y  x, y 
(x,y):g(x,y)=z

– E g  X,Y  = g  x,y   pX,Y  x, y 


x y

– Γενικά E g  X,Y   g  E  X  ,E  Y 

– Εξαίρεση: γραμμικές συναρτήσεις


E  αX+ βY+ γ   αE  X   βE  Y   γ

• Παράδειγμα: Z = X+ 2Y
Υ 0 1/20 1/20 1/20
4

1/20 2/20 3/20 1/20


3

1/20 2/20 3/20 1/20


2

1/20 1/20 1/20 0


1

1 2 3 4 Χ
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 17
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

(συνέχεια παραδείγματος)

E  Z = E  X  + 2E  Y 

pX 1 = , p X  2  = , p X  3 = , p X  4  =
3 6 8 3
20 20 20 20

Ε  X  =1 
3 6 8 3
 2  +3  +4   2,55
20 20 20 20

pY 1 = , p Y  2  = , p Y  3 = , p Y  4  =
3 7 7 3
20 20 20 20

Ε  Y  =1 
3 7 7 3
 2  +3  +4   2,5
20 20 20 20
E  Z  2,55  2  2,5  7,55

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 18
ΠΟΛΛΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

• Γενίκευση για περισσότερες από δύο τυχαίες μεταβλητές


– Για 3 τυχαίες μεταβλητές
pX,Y,Z  x,y,z   P  X = x και Y = y και Z = z 

pX,Y  x, y   pX,Y,Z  x, y,z 


z

pX  x  =  pX,Y,Z  x, y,z 
y z


E g  X,Y,Z =  g  x, y,z   pX,Y,Z  x, y,z 
x y z

• E  α1 X1  α2 X2   αn Xn   α1 E  X1   α2 E  X2    α n E  Xn 
– Μέση τιμή διατηρεί την γραμμικότητα της συνάρτησης

• Μέση τιμή διωνυμικής τυχαίας μεταβλητής


n
n
Ε X   k    pk (1- p)n-k
k
k=0

Πιο εύκολα, X = X1 +X2 + +Xn


– X1 +X2 + +Xn Bernoulli
E  X =E  X1  +E  X2  + +E  Xn   n  p

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 19
ΔΕΣΜΕΥΜΕΝΗ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ

• Δέσμευση από γεγονός Α

pX|A  x  = P  X = x | A  =

P X = x  A 
PA

• Δέσμευση από άλλη τυχαία μεταβλητή


P  X = x και Y = y  pX,Y  x, y 
pX|Y  x | y  = P  X = x | Y = y  = 
P  Y = y pY  y 

• Πολλαπλασιαστικός κανόνας
pX,Y  x, y   pY  y   pX|Y  x, y 

• Θεώρημα συνολικής πιθανότητας

pX  x  = pX,Y  x, y  = pX|Y  x, y   pY  y 
y y

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 20
ΔΕΣΜΕΥΜΕΝΗ ΣΥΝΑΡΤΗΣΗ ΜΑΖΑΣ
ΠΙΘΑΝΟΤΗΤΑΣ

• Δεσμευμένη μέση τιμή


E  X | A = x pX|A  x 
E  X | Y = y  =  x  pX|Y  x | y 
x
• Θεώρημα συνολικής μέσης τιμής
– Α1,Α2 , ,Αn : διαμέριση δειγματικού χώρου

E  X =  E  X | Ai   P  A i 
i
– E  X  =  E  X | Y = y   pY  y 
y

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 21
ΓΕΩΜΕΤΡΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ

• Μέση τιμή 
– E  X  =  x 1- p  p
x-1

x=1

– Με χρήση δεσμευμένων μέσων τιμών

E  X  =   X | X = 1  P  X = 1  E  X | X > 1  P  X > 1

 
 1  p+ 1 + E  X   1- p   E  X  =
1
p

• Διασπορά

     
E X 2 =  X 2 | X = 1  P  X = 1  E X 2 | X > 1  P  X > 1


2
  
 1  p E 1  X    1- p   E X 2  2 -
2 1
p p

var  X  =
2 1 1 1- p
- - = 2
p2 p p2 p

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 22
ΑΝΕΞΑΡΤΗΣΙΑ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

• Από κοινού συνάρτηση μάζας πιθανότητας ισούται με το


γινόμενο των επιμέρους συναρτήσεων μάζας πιθανότητας
– π.χ. X,Y,Z ανεξάρτητες αν
pX,Y,Z  x, y,z  = pX  x   pY  y   pZ  z  για κάθε x, y,z

• Παράδειγμα
Υ4 0 1/20 1/20 1/20

3 1/20 2/20 3/20 1/20

2 1/20 2/20 3/20 1/20

1/20 1/20 1/20 0


1

1 2 3 4 Χ
• Είναι οι X,Y ανεξάρτητες;
– Όχι: pX,Y  2,4 =  pX  2  pY  4  =
1 18
20 400
– Εναλλακτικά, pX|Y 1| 4 = 0  pX 1

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 23
ΑΝΕΞΑΡΤΗΤΕΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

• Αν X,Y ανεξάρτητες
– E  XY  = E  X   E  Y 

– E g  X  h  Y  = E g  X   E h  Y 

– var  X+ Y  = var  X  + var  Y 


• Παράδειγμα
X,Y ανεξάρτητες, Z = X- 4Y
var  Z = var  X  + var -4Y  = var  X  + -4  var  Y  = var X  +16var Y 
2

• Γενίκευση: Αν X1,X2 , ,Xn ανεξάρτητες


var  X1  X2   Xn   var  X1   var  X2    var  Xn 

• Διασπορά διωνυμικής τυχαίας μεταβλητής


X = X1 + X2   Xn
– X1,X2 , ,Xn ανεξάρτητες Bernoulli

var  X  var  X1   var  X2    var  Xn  = n p 1- p 

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 24
ΣΥΝΔΙΑΣΠΟΡΑ

• cov  X,Y  = E  X- E  X   Y- E  Y  


 
– Θετική: μεγάλες(μικρές) τιμές της Χ συνήθως
αντιστοιχούν σε μεγάλες (μικρές) τιμές της Y
– Αρνητική: μεγάλες(μικρές) τιμές της Χ συνήθως
αντιστοιχούν σε μικρές(μεγάλες) τιμές της Y
– Μηδενική: δεν υπάρχει τέτοιου είδους συσχέτιση,X,Y
ασυσχέτιστες

• cov  X,Y  = E  XY  - E  X  E  Y 
– Χ,Υ ανεξάρτητες  cov  X,Y = 0
(Το αντίθετο δεν ισχύει απαραίτητα)

Παράδειγμα: pX,Y 1,0 = pX,Y  0,1 = pX,Y  -1,0  = pX,Y  0,-1 


1

4
XY = 0 πάντα  E  XY  = 0
  cov(X,Y) = 0
E X = E Y = 0 

X,Y δεν είναι ανεξάρτητες διότι


Χ  0  Y = 0 (Χ δίνει πληροφορία για το Y )

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 25
ΣΥΝΔΙΑΣΠΟΡΑ

• Διασπορά αθροίσματος τυχαίων μεταβλητών

 n  n


var  Xi  =
   var  Xi  +  
cov Xi ,X j 
 i=1  i=1 i,j: i j

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 26
ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

• Αδιάστατη μορφή της συνδιασποράς


cov  X,Y 
ρ  X,Y  =
var  X  var  Y 

• -1  ρ  1
– ρ =1  Y = αX+ β (γραμμική σχέση)
– ρ=0: X,Y ασυσχέτιστες

• Παράδειγμα: ρίψη νομίσματος n φορές


X: αριθμός Κ, Y: αριθμός Γ
ρ  X,Y  = ;
X+ Y = n  Y = n- X (γραμμική σχέση)
Άρα ρ  X,Y  =-1 (αρνητική κλίση)

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 27
ΣΥΝΕΧΕΙΣ ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ

• Μη αριθμήσιμο σύνολο τιμών (διάστημα)


• Συνάρτηση πυκνότητας πιθανότητας (pdf)
– πιθανότητα για κάθε διάστημα

b
P  a  X  b  = f X  x  dx

 a
–  fX  x  dx = 1
-

– Για μικρό δ
P  x  X  x+ δ   fX  x   δ

– PX = a  = 0

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΜΕΣΗ ΤΙΜΗ ΚΑΙ ΔΙΑΣΠΟΡΑ


• E X =  x fX  x  dx , κέντρο βάρους
-

• E g  X   =  g  x   fX  x  dx
-

var  X  = E X   - E  X  =  x f X  x  dx- E  X 
2 2
• 2 2

-

• Συνεχής ομοιόμορφη τυχαία μεταβλητή


– fX  x  =
1
, axb
b- a

– E X =
a+ b
2
 b- a 
2
– var  X  =
12

• Εκθετική τυχαία μεταβλητή


– fX  x  = λe-λ x , x  0

– E  X =
1
λ

– var  X  =
1
λ2
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΑΘΡΟΙΣΤΙΚΗ ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ

• Κοινός ορισμός για διακριτές και συνεχείς τυχαίες


μεταβλητές
FX  x  = P  X  x 
• Παράδειγμα συνεχούς τυχαίας μεταβλητής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΑΘΡΟΙΣΤΙΚΗ ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ

• Παράδειγμα διακριτής τυχαίας μεταβλητής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΙΔΙΟΤΗΤΕΣ ΕΚΘΕΤΙΚΗΣ ΤΥΧΑΙΑΣ
ΜΕΤΑΒΛΗΤΗΣ

• Έλλειψη μνήμης
– Αν ο χρόνος μεταξύ διαδοχικών γεγονότων είναι
εκθετική τυχαία μεταβλητή, τα μελλοντικά γεγονότα
δεν εξαρτώνται από τα προηγούμενα
– FX  x  =1- e-λ x  P  X > x  = e-λ x

PX > t + x 
– PX > t + x | X > t  = = P X > x 
PX > t 

• Σχέση με τυχαία μεταβλητή Poisson


– X : χρόνος μεταξύ διαδοχικών γεγονότων
– N : αριθμός γεγονότων σε διάστημα Τ
1
– X εκθετικός με μέση τιμή 
λ
N Poisson με μέση τιμή λΤ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΣΥΝΑΡΤΗΣΕΙΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ

• Y = g  X
• X: τυχαία μεταβλητή με γνωστή pdf f X  x 
• Ζητούμενο: pdf της Y , f Y  y 
– g  X  1-1, h  y  αντίστροφη της g  X 

dh  y 

fY  y   fX h  y   dy

– Γενικά, αν h i  y  είναι οι ρίζες της εξίσωσης y = g  X 


dhi  y 
fY  y  =   fX hi  y   dy
i

• Παράδειγμα: X ομοιόμορφη στο [0,1] Y = X


– Αντίστροφη συνάρτηση: X = Y2
– Για 0  y  1,
fY  y  = fX   y 
2 dy2
dy
= 1 2 y = 2 y

• Γραμμικές συναρτήσεις, Y = aX+ b


 y- b  1
fY  y  = fX  
 a  a
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 7
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
2
1 x - μ 
-  
fX  x  =
1
• e 2 σ 
σ 2π

E  X  = μ, var  X  = σ2

• Συμβολισμός X N μ,σ2  

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 8
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ

•   
X N μ,σ2  aX+ b N aμ + b, a 2 σ2 
– Y = aX+ b
2
1  y-b-a μ 
1  y- b    
– fY  y  =
1 2 a σ 
fX  = e
a  a  a σ 2π

X- μ
• Y= : τυποποιημένη κανονική μεταβλητή
σ

E  Y  = 0, var  Y  =1

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 9
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ

•   z  : αθροιστική συνάρτηση κατανομής τυποποιημένης


κανονικής τυχαίας μεταβλητής
– Τιμές της   z  στον πίνακα της επόμενης σελίδας (11)

•  
X N μ,σ2
 X- μ x - μ   x- μ 
– FX  x  = P  X  x   P       
 σ σ   σ 

• Παράδειγμα: X N 60,202  
P  X  80  ;
 80 - 60 
P  X  80  1- FX 80   1-   
 20 
 1-  1 =1- 0,8413 = 0,1587

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 10
ΚΑΝΟΝΙΚΗ ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ
ΥΠΟΛΟΓΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 11
ΡΟΠΟΓΕΝΝΗΤΡΙΕΣ

• MX  s  = E esX 
 
– Αντιστοιχία 1-1 μεταξύ τυχαίας μεταβλητής X και
ροπογεννήτριας MX  s 

• Ροπογεννήτρια κανονικής τυχαίας μεταβλητής


σ 2 s2

 
+μ s
X N μ,σ2  MX  s  =e 2

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 2
ΑΘΡΟΙΣΜΑ ΚΑΝΟΝΙΚΩΝ ΤΥΧΑΙΩΝ
ΜΕΤΑΒΛΗΤΩΝ

• Xi  
N μi ,σi2 , i =1,2, ,n , ανεξάρτητες

n
• W=  ci X i  n


i=1
 s ci Xi 
• M W  s  = E e  = E e
sW i=1 =
   
 
 
 
c σ  s

2 2 2

 c μ 
i i
n   +
=  M X  sci  = e
i i
2
i
i=1

 n n 
• W N  ci μi , ci σi  , διότι M W  s  είναι
 2 2

 
 i=1 i=1 
ροπογεννήτρια κανονικής τυχαίας μεταβλητής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 3
ΚΕΝΤΡΙΚΟ ΟΡΙΑΚΟ ΘΕΩΡΗΜΑ

• X1,X2 , ,Xn ανεξάρτητες τυχαίες μεταβλητές με ίδια


κατανομή , E  Xi  = μ, var  Xi  = σ2

• Sn = X1  X2   Xn

 E  Zn  = 0, var  Zn  =1
Sn - nμ
Zn 
σ n

• Θεώρημα: Για κάθε z


lim P  Zn  z  =   z 
n

–   z  : αθροιστική συνάρτηση κατανομής


τυποποιημένης τυχαίας μεταβλητής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 4
ΚΕΝΤΡΙΚΟ ΟΡΙΑΚΟ ΘΕΩΡΗΜΑ

• Sn μπορεί επίσης να προσεγγιστεί από κανονική τυχαία


μεταβλητή
– Παράδειγμα: Κιβώτιο με βάρος ομοιόμορφα
κατανεμημένο μεταξύ 5 και 50 κιλών
μ = 27,5 σ2 =168,75

Συνολικό βάρος 100 κιβωτίων: κανονική τυχαία


μεταβλητή με μέση τιμή 100  μ και διασπορά 100  σ2

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 5
ΠΡΟΣΕΓΓΙΣΗ ΔΙΩΝΥΜΙΚΗΣ

• X = X1  X2   Xn
– Άθροισμα n ανεξάρτητων τυχαίων μεταβλητών
Bernoulli

 1 1
• P  X = k  = P  k-  X  k+  , k =1, ,n-1
 2 2

• Κεντρικό οριακό Θεώρημα:


 1 1
P  X = k   P  k-  Sn  k+  , k =1, ,n-1
 2 2
– Sn: κανονική τυχαία μεταβλητή με μέση τιμή n p και
διασπορά n p 1- p 

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I 6
ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι
Συμπληρωματικές Σημειώσεις
Δημήτριος Παντελής

ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ
Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων
μεταβλητών χαρακτηρίζονται από κάποιες παραμέτρους. Παραδείγματος χάριν, η
μέση τιμή και η διασπορά (  ,  2 ) χαρακτηρίζουν τη συνάρτηση πυκνότητας
πιθανότητας της κανονικής τυχαίας μεταβλητής, η μέση τιμή  τη συνάρτηση
πιθανότητας της Poisson, και η πιθανότητα επιτυχίας p τη συνάρτηση πιθανότητας
της διωνυμικής. Όταν αυτές οι παράμετροι είναι άγνωστες, εκτιμώνται από
δειγματοληπτικές μετρήσεις, π.χ. η μέση τιμή του βάρους μιας συσκευασίας
εκτιμάται από το μέσο βάρος της συσκευασίας σε ένα πεπερασμένο δείγμα. Η
ανάλυση που ακολουθεί υποθέτει ότι η δειγματοληψία γίνεται με τυχαίο τρόπο,
δηλαδή οι μετρήσεις του δείγματος είναι ανεξάρτητες μεταξύ τους.

1. Σημειακή εκτίμηση
Έστω  άγνωστη παράμετρος που χαρακτηρίζει μια τυχαία μεταβλητή X . Η
παράμετρος αυτή εκτιμάται από τυχαίο δείγμα που αποτελείται από μετρήσεις
X 1 , X 2 , , X n . Οι τιμές του δείγματος είναι ανεξάρτητες τυχαίες μεταβλητές με

συνάρτηση (πυκνότητας) πιθανότητας ίδια με της X . Από τις τιμές αυτές προκύπτει
μια εκτιμήτρια συνάρτηση ˆ η τιμή της οποίας δίνει μια εκτίμηση για την παράμετρο
 . Ακολουθούν ορισμένα παραδείγματα εκτιμητριών.

Μέση τιμή. Εκτιμάται από τη μέση τιμή του δείγματος X , όπου


X1  X 2    X n
X .
n
Διασπορά. Εκτιμάται από τη διασπορά του δείγματος S 2 , όπου
( X 1  X ) 2  ( X 2  X ) 2    ( X n  X ) 2 X 12  X 22    X n2  nX 2
S2   .
n 1 n 1
Ποσοστό. Έστω p το ποσοστό του πληθυσμού με μια συγκεκριμένη ιδιότητα (π.χ.
ποσοστό ελαττωματικών σε παραγωγική διαδικασία). Το ποσοστό αυτό εκτιμάται

1
από το αντίστοιχο ποσοστό στο δείγμα, το οποίο ισούται με pˆ  An n , όπου An ο

αριθμός των μελών του δείγματος με αυτή την ιδιότητα.

Ιδιότητες εκτιμητριών
Η εκτίμηση βασίζεται σε μετρήσεις από ένα υποσύνολο του πληθυσμού (δείγμα), άρα
είναι φυσικό να αποκλίνει από την πραγματική τιμή της παραμέτρου  με συνέπεια
την ύπαρξη σφάλματος εκτίμησης | ˆ   | . Η μέση τιμή του τετραγώνου του

σφάλματος εκτίμησης E[(ˆ   ) 2 ] ονομάζεται μέσο τετραγωνικό σφάλμα (mean


squared error, MSE) και χαρακτηρίζει την ποιότητα της εκτιμήτριας: όσο μικρότερο
το MSE, τόσο καλύτερη η εκτίμηση.
Μια άλλη επιθυμητή ιδιότητα είναι η εκτιμήτρια να δίνει κατά μέσο την
πραγματική τιμή της άγνωστης παραμέτρου, δηλαδή E(ˆ)   . Μια τέτοια
εκτιμήτρια ονομάζεται αμερόληπτη. Είναι φανερό από τον ορισμό του μέσου
τετραγωνικού σφάλματος ότι για αμερόληπτες εκτιμήτριες ισχύει MSE=var(ˆ) .
Ακολουθούν παραδείγματα αμερόληπτων εκτιμητριών.

Μέση τιμή δείγματος. Έστω  η μέση τιμή μιας τυχαίας μεταβλητής X .


E(X 1 )  E(X 2 )    E(X n )        n
E( X )    ,
n n n
άρα η X είναι αμερόληπτη εκτιμήτρια της  .

Έστω  2 η διασπορά της X . Επειδή οι τιμές του δείγματος είναι ανεξάρτητες


τυχαίες μεταβλητές έχουμε
var(X 1 )  var (X 2 )    var (X n )  2   2     2 n 2  2
MSE  var( X )    2  .
n2 n2 n n
Διασπορά δείγματος. Η μέση τιμή της διασποράς του δείγματος ισούται με
E(X 12 )  E(X 22 )    E(X n2 )  nE( X 2 )
E( S 2 )  ,
n 1
όπου
E( X i2 )  var( X i )  [E( X i )]2   2   2 , i  1, 2, , n ,

2
E( X 2 )  var( X )  [E( X )]2   2 .
n

2
Συνδυάζοντας τις παραπάνω σχέσεις παίρνουμε E( S 2 )   2 , άρα η S 2 είναι

αμερόληπτη εκτιμήτρια της  2 .

Ποσοστό σε δείγμα. Έστω p η πιθανότητα ένα μέλος του δείγματος να έχει μια
συγκεκριμένη ιδιότητα. Άρα ο αριθμός An των μελών του δείγματος με αυτή την

ιδιότητα είναι διωνυμική τυχαία μεταβλητή με E( An )  np και var( An )  np (1  p) .


Επομένως
E(An ) np
E( pˆ )    p,
n n
άρα το p̂ είναι αμερόληπτη εκτιμήτρια του p . Επίσης
var (An ) np (1  p) p (1  p)
MSE  var( pˆ )    .
n2 n2 n

Κατανομές εκτιμητριών
Υπάρχουν περιπτώσεις εκτιμητριών για τις οποίες, εκτός από τη μέση τιμή και τη
διασπορά τους, είναι εφικτό να προσδιοριστεί και η συνάρτηση πυκνότητας
πιθανότητας.

Μέση τιμή δείγματος. 1) Αν η τυχαία μεταβλητή X είναι κανονική με μέση τιμή 

και διασπορά  2 , η μέση τιμή του δείγματος, ως γραμμικός συνδυασμός κανονικών


τυχαίων μεταβλητών, είναι επίσης κανονική τυχαία μεταβλητή με μέση τιμή  και

X 
διασπορά  2 n , δηλαδή ~ N (0,1) . Αν όμως η διασπορά είναι άγνωστη,
 n
X 
χρησιμοποιούμε την εκτιμήτριά της S 2 για την οποία ισχύει ~ tn 1 , όπου tn 1
S n
είναι η κατανομή Student (ή κατανομή t ) με n  1 βαθμούς ελευθερίας.
2) Αν το δείγμα είναι μεγάλο ( n  30 ), τότε λόγω του κεντρικού οριακού θεωρήματος
και ανεξαρτήτως της κατανομής του πληθυσμού η μέση τιμή του δείγματος είναι
προσεγγιστικά κανονική με μέση τιμή  και διασπορά  2 n . Η προσέγγιση ισχύει

X 
ακόμα και όταν η διασπορά  2 είναι άγνωστη, οπότε έχουμε ~ N (0,1) .
S n

3
Ποσοστό σε δείγμα. Για μεγάλα δείγματα το ποσοστό p̂ είναι προσεγγιστικά
p(1  p)
κανονική τυχαία μεταβλητή με μέση τιμή p και διασπορά .
n

2. Διαστήματα εμπιστοσύνης
Τα διαστήματα εμπιστοσύνης αποτελούν μια ευρύτερη μορφή εκτίμησης από τη
σημειακή. Αντί η άγνωστη παράμετρος να εκτιμηθεί από μια συγκεκριμένη τιμή,
υπολογίζεται ένα διάστημα που περιέχει την τιμή αυτής της παραμέτρου με μια
προκαθορισμένη πιθανότητα.
Ορισμός. Το διάστημα [a, b] είναι ένα 100(1   )% διάστημα εμπιστοσύνης για την
παράμετρο  αν P(  [a, b])  1   .

Διάστημα εμπιστοσύνης μέσης τιμής


Έστω ότι η τυχαία μεταβλητή X είναι κανονική με γνωστή διασπορά  2 , άρα
X  
~ N (0,1) . Έστω επίσης z 2 η τιμή για την οποία ισχύει P Y  z 2   ,
 n 2

όπου Y η τυποποιημένη κανονική τυχαία μεταβλητή. Για δεδομένο  η τιμή αυτή


βρίσκεται από τον πίνακα της κανονικής κατανομής. Επομένως
 X  
P   z 2   z 2   1   
  n 
   
P  X  z 2    X  z 2   1
 n n
Συγκρίνοντας την τελευταία σχέση με τον ορισμό του διαστήματος εμπιστοσύνης
   
συμπεραίνουμε ότι το διάστημα  X  z 2 , X  z 2  είναι ένα 100(1   )%
 n n
διάστημα εμπιστοσύνης για τη μέση τιμή  .
Με παρόμοιο τρόπο μπορεί να δειχθεί ότι για κανονικό πληθυσμό με άγνωστη
διασπορά ένα 100(1   )% διάστημα εμπιστοσύνης για τη μέση τιμή είναι το

 S S 
 X  t 2 , n 1 , X  t ,n 1  , όπου t , είναι η τιμή για την οποία ισχύει
 n 2 n

P  t  t ,    και μπορεί να βρεθεί από τον πίνακα στο τέλος των σημειώσεων.

4
Τέλος, για μεγάλα δείγματα το αντίστοιχο διάστημα εμπιστοσύνης είναι της μορφής
  ήS  ήS
 X  z 2 , X  z 2 .
 n n 
Το εύρος του διαστήματος εμπιστοσύνης έχει άμεση σχέση με το σφάλμα
  ήS
εκτίμησης X   . Συγκεκριμένα ισχύει P  X    z 2    . Αν λοιπόν
 n 
θέλουμε το σφάλμα εκτίμησης της μέσης τιμής να είναι μεγαλύτερο από d με
πιθανότητα το πολύ  , πρέπει το μισό του 100(1   )% διαστήματος εμπιστοσύνης
να είναι το πολύ d . Αυτό σημαίνει ότι το απαιτούμενο μέγεθος δείγματος είναι
2 2
 z 2  2  z 2  2
   ή   S ανάλογα με το αν η διασπορά είναι γνωστή ή άγνωστη. Στη
 d   d 
δεύτερη περίπτωση η διασπορά S 2 υπολογίζεται από κάποιο μικρό αρχικό δείγμα.

Διάστημα εμπιστοσύνης ποσοστού


Θεωρούμε την περίπτωση μεγάλων δειγμάτων για την οποία ισχύει
pˆ  p
~ N (0,1) . Παρόμοια με την περίπτωση της μέσης τιμής προκύπτει
p (1  p) n

 p (1  p) p(1  p) 
διάστημα εμπιστοσύνης  pˆ  z 2 , pˆ  z 2  , όπου όμως η
 n n 
παράμετρος p είναι η άγνωστη παράμετρος που θέλουμε να εκτιμήσουμε. Το
πρόβλημα παρακάμπτεται αντικαθιστώντας το p(1  p) με το pˆ (1  pˆ ) και τελικά

 pˆ (1  pˆ ) pˆ (1  pˆ ) 
παίρνουμε διάστημα εμπιστοσύνης  pˆ  z 2 , pˆ  z 2 .
 n n 
Όσον αφορά το σφάλμα εκτίμησης p̂  p , αν θέλουμε να είναι μεγαλύτερο από

d με πιθανότητα το πολύ  , πρέπει το μισό του 100(1   )% διαστήματος


εμπιστοσύνης να είναι το πολύ d . Αυτό σημαίνει μέγεθος δείγματος τουλάχιστον ίσο
2
 z 2 
με   pˆ (1  pˆ ) , όπου το ποσοστό p̂ υπολογίζεται από κάποιο μικρό αρχικό
 d 
δείγμα. Εναλλακτικά, επειδή pˆ (1  pˆ )  1 4 , μπορούμε ως απαιτούμενο μέγεθος
2
1  z 2 
δείγματος να πάρουμε το   .
4 d 

You might also like