Download as pdf or txt
Download as pdf or txt
You are on page 1of 31

ΚΕΦΑΛΑΙΟ 3

ΕΚΤΙΜΗΤΙΚΗ
(δεύτερο πακέτο διαφανειών)
Μέγεθος δείγματος

Για κάποιο δεδομένο πλάτος 𝑤, δεν είναι άμεσος ο προσδιορισμός


του ελαχίστου απαιτούμενου μεγέθους δείγματος

𝑠 2
𝑛 = 2 · 𝑡𝛼,𝑛−1 ·
2 𝑤
Διαστήματα εμπιστοσύνης για τη διακύμανση και την
τυπική απόκλιση του μέσου κανονικού πληθυσμού
Πρόταση 2.13 σελ 396 (Δ.Ε. διακύμανσης κανονικού πληθυσμού) Έστω τα τυχαία δεδομένα
𝑥1 , 𝑥2 , . . . , 𝑥𝑛 που προέρχονται από κανονικό πληθυσμό 𝛮(𝜇, 𝜎 2 ) με άγνωστο μέσο. Τότε, το 100(1 −
𝛼)% −διάστημα εμπιστοσύνης για την πληθυσμιακή διακύμανση βρίσκεται

𝑛 − 1 · 𝑠2 𝑛 − 1 · 𝑠2
2 , 2 ,
𝜒𝑛−1,𝑎/2 𝜒𝑛−1,1−𝑎/2

σ𝑛 lj 2
𝑖=1(𝑥𝑖 −𝑥) 𝛼
όπου 𝑠 = και 2
𝜒𝑛−1,𝑎/2 και 2
𝜒𝑛−1,1−𝑎/2 είναι το 100 · 1 − 2 −στό ποσοστιαίο σημείο και το
𝑛−1
𝛼
100 · 2 −στό ποσοστιαίο σημείο της κατανομής 𝑋𝑛−1
2
με (𝑛 − 1) βαθμούς ελευθερίας.
Παράδειγμα 2.15 σελ 398 Μετρήθηκαν τα μηνιαία εισοδήματα σε χιλιάδες
ευρώ 14 υπαλλήλων τράπεζας και βρέθηκαν 1.4. Να εκτιμηθεί διάστημα
εμπιστοσύνης 99% για την διασπορά του πληθυσμού, αν υποτεθεί ότι
το εισόδημα ακολουθεί την κανονική κατανομή. (Επίπεδο εμπιστοσύνης
𝑎 = 0.10)
Απάντηση
2 2
Ισχύει 𝜒13, 0.95 = 5.89 και 𝜒13, 0.5 = 22.36. Συνεπώς,

𝑛 − 1 · 𝑠 2 13 · 1.42 13 · 1.42
2 = 2 = = 1.14,
𝜒𝑛−1,𝑎/2 𝜒13, 0.5 22.36
𝑛 − 1 · 𝑠 2 13 · 1.42 13 · 1.42
2 = 2 = = 4.32.
𝜒𝑛−1,1−𝑎/2 𝜒13, 0.95 5.89
Καταλήγουμε στο διάστημα εμπιστοσύνης 1.14 ≤ 𝜎 2 ≤ 4.32.
Διαστήματα εμπιστοσύνης για ποσοστό

^
Πρόταση 2.17 σελ 399 (Δ.Ε. ποσοστού) Έστω 𝑝 το ποσοστό των δειγματικών μονάδων που
εμφανίζουν κάποια εξεταζόμενη ιδιότητα σε ένα δείγμα μεγέθους 𝑛. Τότε, το 100(1 −
𝛼)% −διάστημα εμπιστοσύνης για το αντίστοιχο ποσοστό 𝑝 στον πληθυσμό βρίσκεται

^ ^ ^ ^
^ 𝑝 1−𝑝 ^ 𝑝(1 − 𝑝)
𝑝 − 𝑧𝑎 · , 𝑝 + 𝑧𝑎/2 · ,
2 𝑛 𝑛
𝛼
όπου 𝑧𝑎 είναι το 100 · 1 − −στό ποσοστιαίο της τυποποιημένης κανονικής κατανομής.
2 2
Μέγεθος δείγματος

𝑧𝛼/2 2
𝑛 = 2· .𝑝 1 − 𝑝 .
𝑤
Παράδειγμα 2.16 σελ 400 Σε ένα δείγμα 40 πολιτών εξετάστηκε ποιοι
καπνίζουν και ποιοι όχι. Αν η αναλογία των καπνιζόντων στο σύνολο
του δείγματος είναι 0.25:

i. Να υπολογιστεί 90%-διάστημα εμπιστοσύνης για το ποσοστό των


καπνιστών στον πληθυσμό.

ii. Αν σε ένα τυχαίο δείγμα 30 ατόμων από τον ίδιο πληθυσμό


εντοπίστηκαν 12 καπνιστές, να υπολογιστεί 90%-διάστημα
εμπιστοσύνης για το ποσοστό των καπνιστών στον πληθυσμό.
Απάντηση
i. Για 𝛼 = 0.1, έχουμε την κρίσιμη τιμή 𝑧0.95 = 1.65. Εφαρμόζοντας την
Πρόταση 2.17, έχουμε
^ ^ ^ ^
^ 𝑝 1−𝑝 ^ 𝑝(1 − 𝑝)
𝑝 − 𝑧𝑎 · , 𝑝 + 𝑧𝑎/2 ·
2 𝑛 𝑛

0.25 1 − 0.25 0.25(1 − 0.25)


= 0.25 − 1.65 · , 0.25 + 1.65 ·
40 40
= 0.137, 0.363 .
^ 12
i. Στην περίπτωση αυτή, το ποσοστό στο δείγμα βρίσκεται 𝑝 = =
30
0.4. Παρόμοια με πριν, έχουμε
^ ^ ^ ^
^ 𝑝 1−𝑝 ^ 𝑝(1 − 𝑝)
𝑝 − 𝑧𝑎 · , 𝑝 + 𝑧𝑎/2 ·
2 𝑛 𝑛

0.4 1 − 0.4 0.4(1 − 0.4)


= 0.4 − 1.65 · , 0.4 + 1.65 ·
40 40

= 0.056, 0.2431 .
Διαστήματα εμπιστοσύνης για σύγκριση δύο πληθυσμών

𝜎𝛸2 𝜎𝑌2 𝜎𝛸2 𝜎𝑌2


𝑥 − 𝑦 − 𝑧𝛼 · + , 𝑥 − 𝑦 + 𝑧𝛼/2 · + ,
2 𝑛 𝑚 𝑛 𝑚
Δ.Ε. για διαφορές μέσων τιμών σε δύο ανεξάρτητους πληθυσμούς,
με άγνωστες και ίσες διασπορές
Ισχύουν τα:

1 1
𝑆𝐸𝑥−𝑦 = 𝑠𝑝 +
𝑛 𝑚

με
2 2
(𝑛 − 1) ⋅ 𝑠𝑋 + (𝑚 − 1) ⋅ 𝑠𝑌
𝑠𝑝2 =
𝑚+𝑛−2
και

1 1 1 1
𝑥 − 𝑦 − 𝑡𝑛+𝑚−2,1−𝛼Τ2 · 𝑠𝑝 ⋅ + , 𝑥 − 𝑦 + 𝑡𝑛+𝑚−2,1−𝛼Τ2 · 𝑠𝑝 ⋅ + ,
𝑛 𝑚 𝑛 𝑚
Δ.Ε. για διαφορές μέσων τιμών σε δύο ανεξάρτητους πληθυσμούς, με
άγνωστες και άνισες διασπορές
Όταν οι διασπορές των πληθυσμών είναι άγνωστες αλλά άνισες η ποσότητα που αποδίδει το τυπικό σφάλμα είναι
ηοι δειγματικές διακυμάνσεις, ακολουθεί την κατανομή t με βαθμούς ελευθερίας ν

2 2
𝑠𝛸2 𝑠𝛶
+
𝑛 𝑚
𝝂=
𝑠𝛸2 𝑠𝛶2
𝑛 + 𝑚
𝑛−1 𝑚−1
Κατά τα γνωστά, καταλήγουμε στο 100(1 − 𝛼)% −διάστημα εμπιστοσύνης για τη διαφορά των μέσων

𝑠𝑋2 𝑠𝑌2 𝑠𝑋2 𝑠𝑌2


𝑥 − 𝑦 − 𝑡𝜈,1−𝛼Τ2 · + , 𝑥 − 𝑦 + 𝑡𝜈,1−𝛼Τ2 · + .
𝑛 𝑚 𝑛 𝑚
Άλλα διαστήματα εμπιστοσύνης

Διαστήματα εμπιστοσύνης για διαφορές μέσων τιμών σε δύο εξαρτημένα δείγματα

Διαστήματα εμπιστοσύνης για το λόγο διασπορών σε δύο πληθυσμούς

Διαστήματα εμπιστοσύνης για διαφορές ποσοστών σε δύο ανεξάρτητους πληθυσμούς


ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ
68) Σελ 407 Η διασπορά των μισθών μιας εταιρίας δίνεται 𝜎 2 = 900.
1. Nα υπολογιστεί 99%-Δ.Ε. για τη μέση τιμή, αν σε ένα δείγμα 𝑛 = 81
ατόμων βρέθηκε 𝑥 = 900.
2. Nα υπολογιστεί 99%-Δ.Ε. για τη μέση τιμή, αν η διασπορά του πληθυσμού
είναι άγνωστη και οι μετρήσεις που πραγματοποιήθηκαν έδωσαν τα
αποτελέσματα: 1060, 1000, 890, 780, 920, 940, 900, 800, 810.
3. Αν τα χαρακτηριστικά του δείγματος ως προς τη μέση τιμή και τη
διασπορά είναι όπως στο δεύτερο ερώτημα, αλλά έχουν εξαχθεί από 9πλάσιο
δείγμα, να βρεθεί 95%-Δ.Ε. για τη μέση τιμή.
4. Με τα δεδομένα του δεύτερου ερωτήματος , να βρεθεί 95%-Δ.Ε. για τη
διασπορά.
5. Αν 𝑝 το ποσοστό των γυναικών που εργάζονται στην εταιρία και σε ένα
δείγμα 54 ατόμων οι 14 ήταν γυναίκες, να βρεθεί 95%-Δ.Ε. για το ποσοστό 𝑝.
Λύση

1. Από τον τύπο του Δ.Ε. για το μέσο με γνωστή πληθυσμιακή διακύμανση,
έχουμε
𝜎 𝜎 900 900
𝑥 − 𝑧𝛼 · , 𝑥 + 𝑧𝛼 · = 900 − 2.58 · , 900 + 2.58 ·
2 𝑛 2 𝑛 81 81
= 891.4, 908.6 .
Λύση (συνέχεια)
2. Στην περίπτωση αυτή, μελετήθηκε δείγμα 𝑛 = 9 υπαλλήλων με δειγματικό μέσο
σ9𝑖=1 𝑥𝑖
𝑥= = 900
9
και διακύμανση
9 2
σ 𝑖=1(𝑥𝑖 − 900)
𝑠2 = = 8775.
9−1
Θα χρησιμοποιήσουμε τον τύπο του Δ.Ε. για τον μέσο για μικρό δείγμα και άγνωστη
διασπορά πληθυσμού
𝑠 𝑠
𝑥 − 𝑡𝛼,𝑛−1 · , 𝑥 + 𝑡𝛼,𝑛−1 ·
2 𝑛 2 𝑛
της Πρότασης 2.10. Συνεπώς, για την κρίσιμη τιμή 𝑡0.025,8 = 2.306 ανατρέχουμε στους
σχετικούς πίνακες της κατανομής Student με 8 βαθμούς ελευθερίας. Με αντικατάσταση,
προκύπτει:
𝑠 𝑠 93.67 93.67
𝑥 − 𝑡𝛼,𝑛−1 · , 𝑥 + 𝑡𝛼,𝑛−1 · = 900 − 𝑡0.025,8 · , 900 + 𝑡0.025,8 ·
2 𝑛 2 𝑛 9 9
= (796.65, 1003.35)
Λύση (συνέχεια)

3. Στην περίπτωση αυτή, η διακύμανση του πληθυσμού παραμένει άγνωστη,


αλλά το δείγμα μπορεί να θεωρηθεί επαρκώς μεγάλο, οπότε μπορούμε αντί της
κατανομής Student να χρησιμοποιήσουμε την αντίστοιχη κρίσιμη τιμή 𝑧0.025 =
1.96 από την κανονική κατανομή, δηλαδή έχουμε το Δ.Ε.
𝑠 𝑠 93.67 93.67
𝑥 − 𝑧𝛼 · , 𝑥 + 𝑧𝛼 · = 900 − 𝑧0.025 · , 900 + 𝑧0.025 ·
2 𝑛 2 𝑛 9 9
= 879.6, 920.4 .
Παρατηρούμε ότι το πολύ μεγαλύτερο δείγμα και η χρησιμοποίηση της
κανονικής κατανομής οδηγούν σε άρση της αβεβαιότητας.
Λύση (συνέχεια)

4.Θα χρησιμοποιήσουμε το σχετικό Δ.Ε.


𝑛 − 1 · 𝑠2 𝑛 − 1 · 𝑠2
2 , 2
𝜒𝑛−1,𝑎/2 𝜒𝑛−1,1−𝑎/2
2 2
Οι αντίστοιχες κρίσιμες τιμές 𝜒𝑛−1,1−𝑎/2 = 𝜒8,0.975 = 2.18 και
2 2
𝜒𝑛−1,𝑎/2 = 𝜒8,0.025 = 17.5 βρίσκονται από τους σχετικούς πίνακες
της κατανομής 𝜒 2 (𝑛). Συνεπώς,

𝑛 − 1 · 𝑠2 𝑛 − 1 · 𝑠2 8 · 8775 8 · 8775
2 , 2 = ,
𝜒𝑛−1,𝑎/2 𝜒𝑛−1,1−𝑎/2 17.5 2.18
= 4011.43, 32201.83 .
Λύση (συνέχεια)

5. Για τη σημειακή εκτίμηση του ποσοστού γυναικών, έχουμε


14
^
𝑝= = 0.26.
54
Έτσι, το σχετικό διάστημα εμπιστοσύνης υπολογίζεται ως εξής:
^ ^ ^ ^
^ 𝑝 1−𝑝 ^ 𝑝(1 − 𝑝)
𝑝 − 𝑧𝑎 · , 𝑝 + 𝑧𝑎/2 · =
2 𝑛 𝑛

0.26 · 0.74 0.26 · 0.74


0.26 − 1.96 · , 0.26 + 1.96 · = 0.143, 0.377 .
54 54
70) Σελ 409 Θέλουμε να εκτιμήσουμε το ποσοστό των αντρών στο σύνολο
των διοικητικών στελεχών επιχειρήσεων. Για το σκοπό αυτό, επιλέχθηκε
δείγμα τάξης 350 στελεχών.
1. Αν το πλήθος των αντρών στο δείγμα ανέρχεται σε 304, δώστε 99%-Δ.Ε.
για το ζητούμενο ποσοστό.
2. Να υπολογιστεί το απαιτούμενο μέγεθος δείγματος, ώστε το εύρος του
διαστήματος επιπέδου 99% να είναι μικρότερο του 15% της δειγματικής
εκτίμησης.
Λύση
1. Για τη σημειακή εκτίμηση του ποσοστού ανδρών στελεχών, έχουμε
^ 304
𝑝= = 0.868.
350
Έτσι, το σχετικό διάστημα εμπιστοσύνης υπολογίζεται από τον τύπο:
^ ^ ^ ^
^ 𝑝 1−𝑝 ^ 𝑝(1 − 𝑝)
𝑝 − 𝑧𝑎 · , 𝑝 + 𝑧𝑎/2 · .
2 𝑛 𝑛
Με αντικατάσταση, έχουμε

0.868 · 0.132 0.868 · 0.132


0.868 − 2.58 · , 0.868 + 2.58 · = 0.820, 0.943 .
350 350
2. Το 15% της δειγματικής εκτίμησης βρίσκεται
0.15 · 0.868 = 0.13.

^ ^
𝑝(1−𝑝)
Συνεπώς, το πλάτος 2 · 𝑧𝑎/2 · του Δ.Ε. δε θα πρέπει να υπερβαίνει το ποσοστό αυτό. Έτσι,
𝑛
έχουμε την ανισότητα
^ ^
𝑝(1 − 𝑝)
2 · 𝑧𝑎/2 · ≤ 0.13,
𝑛
από την οποία προσδιορίζουμε το απαραίτητο μέγεθος δείγματος ως εξής:
^ ^
4 · 𝑝 · (1 − 𝑝) · 𝑧𝑎2
2
𝑛≤
0. 132
^ ^
Επίσης, αφού 𝑝 · (1 − 𝑝) ≤ 0.25, παίρνουμε
𝑧𝑎 2 2
2 2.58
𝑛≤ = = 393.86 ≃ 394.
0.13 0.13
72) Σελ 411 Στην προσπάθεια να εκτιμηθεί ποια πόλη επλήγει περισσότερο από
την οικονομική κρίση μεταξύ δύο πόλεων, μελετήθηκε ο αριθμός των
επιχειρήσεων που έκλεισε στις δύο πόλεις τον τελευταίο χρόνο. Στην πόλη Α, σε
δείγμα 623 επιχειρήσεων, έκλεισαν συνολικά 243. Στην πόλη Β, από τις 155
επιχειρήσεις που εξετάστηκαν, έκλεισαν οι 22. Συγκρίνετε το ποσοστό των
επιχειρήσεων που έκλεισαν στις δύο πόλεις, χρησιμοποιώντας διάστημα
εμπιστοσύνης 95% και ερμηνεύστε το αποτέλεσμα.
Λύση
Τα ποσοστά των επιχειρήσεων που πτώχευσαν στις δύο πόλεις είναι
^ 243 ^ 22
𝑝1 = = 0.39, 𝑝2 = = 0.14
623 155
Για την διαφορά των δύο ποσοστών το διάστημα εμπιστοσύνης είναι:

^ ^ 𝑝ҭ1 ⋅ (1 − 𝑝ҭ1 ) 𝑝ҭ 2 ⋅ (1 − 𝑝ҭ 2 ) ^ ^ 𝑝ҭ1 ⋅ (1 − 𝑝ҭ1 ) 𝑝ҭ 2 ⋅ (1 − 𝑝ҭ 2 )


𝑝1 − 𝑝2 − 𝑧𝛼/2 ⋅ + , 𝑝1 − 𝑝2 + 𝑧𝛼/2 ⋅ +
𝑛1 𝑛2 𝑛1 𝑛2

Με αντικατάσταση, έχουμε

^ ^ 𝑝ҭ 1 ⋅ 1−𝑝ҭ 1 𝑝ҭ 2 ⋅ 1−𝑝ҭ 2 0.39⋅0.61 0.14⋅0.86


𝑝1 − 𝑝2 ± 𝑧𝛼/2 ⋅ + = (0.39 − 0.14) ± 1.96 + , ώστε τα άκρα του
𝑛1 𝑛2 623 155
Δ.Ε. προσδιορίζονται
0.183, 0.317 .
74) Σελ 412 Μελετήθηκε η ετήσια μεταβολή των τιμών για 32 προϊόντα και
παρατηρήθηκαν τα ακόλουθα στατιστικά (σε λεπτά του ευρώ):
𝑥 = 1.18 και s = 1.41.
Να υπολογιστούν 95%-Δ.Ε. για τη μέση τιμή και τη διασπορά των
τιμών.
Λύση
To 95%-Δ.Ε. για τη μέση τιμή βρίσκεται
𝑠 𝑠
𝑥 − 𝑧𝛼 · , 𝑥 + 𝑧𝛼 ·
2 𝑛 2 𝑛
1.41 1.41
= 1.18 − 1.96 · , 1.18 + 1.96 ·
32 32
= (0.69, 1.669)
Αντίστοιχα, το 95%-Δ.Ε. για τη διασπορά των τιμών βρίσκεται

𝑛 − 1 · 𝑠2 𝑛 − 1 · 𝑠2 31 · 1.9881 31 · 1.9881
2 , 2 = 2 , 2
𝜒𝑛−1,𝑎/2 𝜒𝑛−1,1−𝑎/2 𝜒31,0.975 𝜒31,0.025
= 0.86, 1.9 .
77) Σελ 415 Σε κάποιον αγορανομικό έλεγχο, όπου εξετάζονται οι τιμές
στις οποίες διατίθενται προς πώληση οι συσκευασίες γάλακτος,
επιθυμούμε να εκτιμήσουμε τη μέση τιμή διάθεσης. Από μια
προκαταρκτική μελέτη, γνωρίζουμε ότι η τυπική απόκλιση της τιμής
είναι 1,44 λεπτά του ευρώ.
1. Να βρεθεί το επίπεδο εμπιστοσύνης για κάποιο διάστημα που κυμαίνεται
± 2 λεπτά του ευρώ γύρω από τη μέση τιμή για τυχαίο δείγμα τάξεως
100.
2. Να υπολογιστεί η τάξη του δείγματος που απαιτείται, ώστε το 99%-Δ.Ε.
να κυμαίνεται ± 2 λεπτά του ευρώ γύρω από τη μέση τιμή.
3. Να εξεταστεί η επίπτωση που θα είχε στα αποτελέσματα η άγνοια της
ακριβούς τιμής της διασποράς 𝜎 2 = 8.442 του πληθυσμού και η εκτίμησή
της από την ίδια τιμή 𝑠 2 = 8.442 .
Λύση
1. Αναφερόμαστε στον τύπο του Δ.Ε. για το μέσο με γνωστή πληθυσμιακή διακύμανση:
𝜎 𝜎
𝑥− · 𝑧𝛼 ,𝑥 + 𝑧 ·
𝛼 .
2 𝑛 2 𝑛
Προφανώς, για να κυμαίνεται το Δ.Ε. κυμαίνεται ± 2 λεπτά του ευρώ γύρω από τη μέση τιμή, θα
πρέπει να ισχύει η ισότητα
𝜎
𝑧𝛼 · = 2.
2 𝑛
Θα χρησιμοποιήσουμε την εξίσωση αυτή, προκειμένου να προσδιορίσουμε τη επίπεδο
σημαντικότητας 𝛼 μέσω της κρίσιμης τιμής 𝑧𝛼 . Επιλύουμε την εξίσωση αυτή ως προς 𝑧𝛼 και έχουμε
2 2

100 20
𝑧𝛼 = 2 · = = 2.37.
2 8.44 8.44

Από τους πίνακες της κανονικής κατανομής, βρίσκουμε


ότι η κρίσιμη αυτή τιμή επιτυγχάνεται σε επίπεδο σημαντικότητας
𝛼 = 0.0178, όπως φαίνεται και από το ακόλουθο σχήμα.
Λύση (συνέχεια)

2. Στην περίπτωση του 99%-Δ.Ε., η κρίσιμη τιμή θα είναι 𝑧𝛼 = 𝑧0.005 =


2
2.58. Ανάλογα με την προηγούμενη περίπτωση, θα έχουμε και πάλι
την εξίσωση
𝜎
𝑧𝛼 · = 2,
2 𝑛
Αλλά αυτή τη φορά με άγνωστο το μέγεθος του δείγματος
2 2
𝑛 = 𝑧𝛼 · 𝜎 = 8.44 · 2.58 ≃ 475
2
Λύση (συνέχεια)

3. Στην περίπτωση που θεωρούσαμε πως η διασπορά 𝜎 2 = 8.442


του πληθυσμού δεν ήταν γνωστή, αλλά αποτελούσε επίσης
εκτίμηση, θα μας εξανάγκαζε στη χρησιμοποίηση της κατανομής
Student αντί της κανονικής. Όμως, λόγω του μεγάλου μεγέθους του
δείγματος, δεν υπάρχει καμία ουσιαστική διαφορά (και οι δύο
κατανομές συμπίπτουν σχεδόν).
ΤΕΛΟΣ
ΜΕΡΟΥΣ Β
ΚΕΦΑΛΑΙΟ 2
ΕΚΤΙΜΗΤΙΚΗ
(δεύτερο πακέτο διαφανειών)

31

You might also like