Download as pdf or txt
Download as pdf or txt
You are on page 1of 5

Bài tập chương 9: Xử lý số liệu

Phần 9.1
9.2. Khi bị quân Đức giam cầm trong Thế chiến II, nhà toán học người Anh Jobn
Kerrich đã tung một đồng xu 10, 000 lần và thu được 5067 cái đầu. Gọi p là xác suất
của một cái đầu trên một ngón tay. Chúng tôi muốn kiểm tra xem dữ liệu có phù hợp
với giả thuyết không điều đó đồng tiền là công bằng
a. Đặt giả thuyết. Tại sao phương án phải có hai phía?
Giả thuyết ở đây là H0: p = ½, H1: p ≠ ½
Ở đây ta dùng giả thuyết 2 phía là do đồng tiền chỉ có thể có 2 kết quả sấp và ngửa
b. Tính giá trị P. Bạn có thể từ chối Ho ở mức 0,05 không?
Có: 𝑝̂ = 5067/10000
𝑝̂−𝑝0
z= (1−𝑃0 )
; thay số 𝑝̂ = 5067/10000; p0 = 1/2; n = 10000, ta được z = 1,34
√𝑝0
𝑛

P- value = 2 (1- ø(z)) = 2 (1 – ø (1,34)) = 2 (1-0,9099) = 0,1802


c. Tìm 95% CI cho tỷ lệ số đầu của đồng xu của Kerrich
Ta có: α = 0,05 nên zα = z0,025 = 1,96
Khoảng tin cậy ở đây là: thay số 𝑝̂ = 0,5067; 𝑞̂ = 1- 0,5067 = 0,4933; n = 10000
𝑝̂𝑞̂ 𝑝̂𝑞̂
[ ̂𝑝 − 𝑧𝛼∕2 √ ; ̂𝑝 + 𝑧𝛼∕2 √ ] = [0,4969; 0,5164]
𝑛 𝑛

9.4. Phần bị lỗi trong quy trình sản xuất số lượng lớn là được ước tính bằng cách sử
dụng CI 95% với sai số chênh lệch 0,2%.
a. Nếu dự đoán tiên nghiệm ở phân số bị lỗi là 1%, thì nên lấy mẫu bao nhiêu phần?
So sánh con số này với kích thước mẫu mà bạn sẽ cần nếu không có thông tin tiên
nghiệm nào về phân số thực bị lỗi được giả định
Dự đoán tiên nghiệm ở tỷ phần bị lỗi p* = 1% = 0,01 thì số mẫu cần lấy là:
𝒛𝜶∕𝟐 𝟐
𝒏=( ) ⋅ 𝒑∗ ⋅ 𝒒*, thay số z0,025 = 1,96; E = 0,2% = 0,2.10-2, p* = 0,01; q* = 0,99
𝑬

Ta được n = 9507,96 hay 9508 mẫu


Nếu không có tủ phần lỗi p* thì công thức sẽ được viết
𝒛𝜶∕𝟐 𝟐 𝒛𝜶∕𝟐 𝟐 𝟏
𝒏=( ) ⋅ 𝒑∗ ⋅ 𝒒* = ( ) ⋅
𝑬 𝑬 𝟒

b. Vấn đề đáng chú ý khi ước tính một phần rất nhỏ bị lỗi là không thể thu được các
chất khử bọt trong mẫu, khiến không thể tính được CI. Bạn sẽ sử dụng phương pháp
1
lấy mẫu nào để đảm bảo rằng sẽ có đủ số lượng khuyết tật trong mẫu để cung cấp thông
tin đáng tin cậy về phần sai hỏng thực sự?
Sử dụng phương pháp lấy mẫu ước tính giá trị có nghĩa
9.6. Một xét nghiệm máu nhằm xác định những bệnh nhân có “nguy cơ cao” mắc
bệnh tim đã cho kết quả dương tính trên 80 trong tổng số 100 bệnh nhân tim đã biết,
nhưng cũng trên 16 bệnh nhân trên 200 bệnh nhân bình thường được biết
a. Tìm CI 90% đưa ra kết quả kiểm tra, được xác định là xác suất trong số các bênh
nhân mắc bệnh tim được xác định chính xác
Với câu a: n = 100; x = 80; ̂𝑝 = 0,8
Do đó khoảng tin cậy ở đây là:; thay số: 𝑝̂ = 0,8; 𝑞̂ = 0,2; n = 100; z0,05 = 1,645
𝑝̂𝑞̂ 𝑝̂𝑞̂
[ ̂𝑝 − 𝑧𝛼∕2 √ ; ̂𝑝 + 𝑧𝛼∕2 √ ] = [0,7342; 0,8658]
𝑛 𝑛

b. Tìm CI 90% để biết tính chính xác của thử nghiệm, được xác định là xác suất một
bệnh nhân bình thường được xác định chính xác
Với câu b: n = 200; x = 184; ̂𝑝 = 0,92
Do đó khoảng tin cậy ở đây là:; thay số: 𝑝̂ = 0,92; 𝑞̂ = 0,08; n = 200; z0,05 = 1,645
𝑝̂𝑞̂ 𝑝̂𝑞̂
[ ̂𝑝 − 𝑧𝛼∕2 √ ; ̂𝑝 + 𝑧𝛼∕2 √ ] = [0,89; 0,95]
𝑛 𝑛

Phần 9.2
9.10. Để đánh giá sự thay đổi trong quan điểm về quan điểm của công chúng đối với
giáo dục song ngữ, một cuộc thăm dò qua điện thoại đã được thực hiện vào tháng 9
năm 1993 và một lần nữa vào tháng 9 năm 1995. Kết quả dựa trên cuộc khảo sát của
1000 người lớn Mỹ liên hệ trong mỗi cuộc thăm dò là 40% so với năm 1993 Cuộc thăm
dò ý kiến và 48% từ cuộc thăm dò năm 1995 ủng hộ việc dạy tất cả trẻ em bằng tiếng
Anh hơn các lựa chọn thay thế song ngữ. Có sự thay đổi đáng kể trong quan điểm
không? Trả lời bằng cách thực hiện một phép thử hai mặt để biết ý nghĩa của sự khác
biệt giữa hai tỷ lệ tại  = .05. Tại sao một giải pháp thay thế hai phía lại thích hợp ở
đây?
Bài giải: Giả thuyết 2 chiều ở đây là H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2
Khoảng tin cậy là:
𝑝̂1 𝑞̂1 𝑝̂2 𝑞̂2 𝑝̂1 𝑞̂1 𝑝̂2 𝑞̂2
[ 𝑝̂1 − 𝑝̂2 − 𝑧𝛼∕2 √ + ; 𝑝̂1 − 𝑝̂ 2 + 𝑧𝛼∕2 √ + ]
𝑛1 𝑛2 𝑛1 𝑛2

Thay số: 𝑝̂1 = 0,4, 𝑞̂1 = 0,6; 𝑝̂ 2 = 0,48; 𝑞̂2 = 0,52; z0,025 = 1,96; ta tính được khoảng tin
cậy là [-0,123; -0,036]
2
𝑝̂1 −𝑝̂2
Giá trị z = ̂ 𝑞
𝑝 ̂ ̂ 𝑞
𝑝 ̂
= - 3,615; ta thấy: |z| > z0,025 = 1,96 nên ta từ chối H0
√ 1 1+ 2 2
𝑛1 𝑛2

9.12. Tập dữ liệu sau đây từ một nghiên cứu của nhà hóa học nổi tiếng và người đoạt
giải Nobel Linus Pauling (1901-1994) cho biết tỷ lệ bị cảm của 279 vận động viên
trượt tuyết người Pháp được chọn ngẫu nhiên vào nhóm Vitamin C và giả dược

Có sự khác biệt đáng kể về tỷ lệ mắc bệnh cảm lạnh giữa nhóm Vitamin C và nhóm
giả dược ở mức  = 0,05 không? Bạn kết luận gì về hiệu quả của Vitamin C trong việc
ngăn ngừa bệnh cảm lạnh?
Bài giải: Giả thuyết 2 chiều ở đây là H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2 ; z0,025 = 1,96
𝑝̂1 +𝑝̂2
Ta tính được: 𝑝̂1 = 17/139 = 0,1223; 𝑝̂ 2 = 31/140 = 0,2214; 𝑃̂ = = 1,23.10-3
𝑛1 +𝑛2

𝑞̂ = 1- 𝑃̂ = 0,99877
𝑝̂1 −𝑝̂2
Có: z = 1 1
; thay số: 𝑝̂1 = = 0,1223; 𝑝̂ 2 = = 0,2214; 𝑃̂ = 1,23.10-3; 𝑞̂ = 0,99877
√𝑝̂𝑞̂(𝑛 +𝑛 )
1 2

Z = - 23,61; ta thấy |z| >> z0,025 = 1,96 do đó ta từ chối H0;


Nhạn xét được Vitamin C có hiệu quả điều trị thấp hơn so với Placebo trong việc chữa
cảm lạnh
9.14. Một nghiên cứu đã đánh giá sự bài tiết thromboglobulin trong nước tiểu ở 12
bệnh nhân bình thường và 12 bệnh nhân đái tháo đường '' Cung kết quả tóm tắt thu
được bằng cách mã hóa các giá trị từ 20 trở xuống là “thấp” và các giá trị trên 20 là
“cao”, như được trình bày trong bảng sau

3
a. Thiết lập các giả thuyết để xác định xem có sự khác biệt trong việc bài tiết
thrombogiobulin qua nước tiểu giữa bệnh nhân bình thường và bệnh nhân tiểu đường
Thử nghiệm thống kê nào thích hợp để kiểm tra các giả thuyết?
Các giả thuyết có thể có ở đây là: p1: Normal. P2: diabetic
H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2
H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 > 𝑃̂2
H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 < 𝑃̂2
Ở đây giả thuyết được kiểm tra là: H0: 𝑃̂1 = 𝑃̂2 ; H1: 𝑃̂1 ≠ 𝑃̂2 ; giả thuyết 1 chiều thấp
hơn
b. Tính giá trị P của phép thử. Kết luận của bạn là gì khi sử dụng  = .05?
Dựa vào bảng 9.3 trong giáo trình

Ta có các giá trị: n1 = 12; n2 = 12; n = n1 + n2 = 24; m = 14 và x =20


𝑛 𝑛
( 1 )( 2 )
𝑖 𝑚−𝑖
PL = P (X ≤ x| X + Y = m) = P (X ≤ 20| X + Y = 14) = ∑ 𝑛) ; giá trị
(𝑚
𝑖≤𝑥
giới hạn dưới của i là m – n2 = 14 – 12 = 2 ta tính được
(12)( 12 )
PL = P (X ≤ 20| X + Y = 14) = ∑20
𝑖= 2
𝑖 14−𝑖
= 0,9986
(24)
14

Suy ra P – value = 1 – 0,9986 = 0,0014


với 2 phía thì P- value = 2.0,0014 = 0,0028
9.16. Trong một lớp tiến hành diễn thuyết, hai bài phát biểu thuyết phục, một bài ủng
hộ và một bài khác lại chống đối, được thực hiện bởi hai học sinh về việc phương án
khách mời cho các bữa tiệc huynh đệ / nữ sinh. Ý kiến của 52 sinh viên khác trong
lớp đã được thu thập về vấn đề này trước và sau bài phát biểu với những phản hồi sau
đây

4
Bài giải: Áp dụng bảng 9.5

1 𝑚
P – value = P (B ≥ b| B+ C = m) ( )𝑚 ∑𝑚
𝑖=𝑏 ( );
2 𝑖
thay số: b =8; c = 26; m = 34; i = b = 8
Phần 9.3.
9.18. Số lần sinh đầu tiên cho 700 phụ nữ được thống kê theo tháng từ Bệnh viện Đại
học của Basel, Thụy Sĩ.

Nêu giả thuyết tbe để kiểm tra cung tbat bizths lan truyền đồng đều trong năm. Thực
hiện kiểm định các giả thuyết tại  = .05
1
Bài giải: Ta có : p0 = p1 = p2 = … = p12 =
12
1 1
Giả thuyết ở đây: H0: p = ; H1 : p ≠
12 12
1 175
Giá trị ei = n.pio = 700. =
12 3
𝑛𝑖 − 𝑒𝑖
Kiểm định: χ2 = ∑12
𝑖=1 𝑒 = 19,725
𝑖

Có bậc tự do ở dây là 12 – 1=11 nên χ11;0,05 = 19,675, nhận thấy χ2 > χ11;0,05 nên ta từ
chối H0
Còn bài 9.20

You might also like