Professional Documents
Culture Documents
Báo Cáo XSTK
Báo Cáo XSTK
HCM
-----oOo-----
Câu 1:
I. Đề bài
Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40 –
50 tuổi và nhóm từ 50 – 60 tuổi trong số các công nhân lành nghề ở
Thụy Điển năm 1930.
Nhóm Thu nhập
tuổi 0-1 1-2 2-3 3-4 4-6 ≥6
40 – 50 71 430 1072 1609 1178 158
50 – 60 54 324 894 1202 903 112
Có sự khác nhau về tỷ lệ thu nhập giữa hai nhóm tuổi này trong số các
công nhân lành nghề hay không? Mức ý nghĩa α = 5%
II. Dạng bài:
- So sánh tỉ số
III. Phương pháp giải:
- Giả thuyết: H0: P1 = P1,0, P2 = P2,0, …, Pk,0 “Các cặp Pi và Pi,0
giống nhau”.
H1: “Ít nhất có một cặp Pi và Pi,0 khác nhau”.
- Giá trị thống kê
𝑘
2
(𝑂𝑖 − 𝐸𝑖 )2
χ = ∑[ ]
𝐸𝑖
𝑖=0
2
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Hình 1
3
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
4
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Nhóm tuổi 50-60 có thu nhập 1-2: chọn C7 và nhập vào biểu thức
=H3*C4/H4
Nhóm tuổi 50-60 có thu nhập 2-3: chọn D7 và nhập vào biểu thức
=H3*D4/H4
Nhóm tuổi 50-60 có thu nhập 3-4: chọn E7 và nhập vào biểu thức
=H3*E4/H4
Nhóm tuổi 50-60 có thu nhập 4-6: chọn F7 và nhập vào biểu thức
=H3*F4/H4
Nhóm tuổi 50-60 có thu nhập >=6: chọn G7 và nhập vào biểu thức
=H3*G4/H4
Hình 2
5
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Câu 2:
I. Đề bài
Trước một chiến dịch quảng cáo, tỷ lệ phòng có khách ở trong một
khách sạn được theo dõi ngẫu nhiên trong 15 ngày và thu được kết quả
là 86 92 83 88 79 81 90 76 80 91 85 89 77 91 và 83 phần trăm. Sau khi
kết thúc chiến dịch quảng cáo, người ta theo dõi tỷ lệ này trong 15 ngày
và thu được kết quả là 88 94 97 99 89 93 92 98 89 90 97 91 87 80 và 96
phần trăm. Giả sử tỷ lệ phòng có khách là phân phối chuẩn. Hãy ước
lượng với độ tin cậy 95% tỷ lệ phòng khách có trước và sau chiến dịch
quảng cáo. Với mức ý nghĩa 5% hãy cho ý kiến là chiến dịch quảng cáo
có thành công hay không ?
II. Dạng bài
- Ước lượng trung bình
- So sánh trung bình với từng cặp dữ liệu
III. Phương pháp giải
- Ước lượng trung bình
∑ 𝑁
𝑋𝑖
Giá trị trung bình 𝑋̅ = 𝑖=1 . Giới hạn tin cậy 𝑡𝛼 𝑆𝑥̅
𝑁
6
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
∑𝑁 ̅ 2
𝑖=1(𝐷𝑖 −𝐷)
𝑆𝐷 = √
(𝑁−1)
̅
𝐷
t=
𝑆𝐷 /√𝑁
+ Biện luận
Nếu t < 𝑡𝛼 hay 𝑡𝛼/2 (𝛾 = 𝑁 − 1) => Chấp nhận giả thuyết H0
8
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Giới hạn tin cậy 𝑡𝛼 𝑆𝑥̅ : Chọn B18 nhập biểu thức = 2.306*B4 (2.306: giá
trị của t với α = 0.05; B4: tọa độ 𝑆𝑥̅ ) rồi dùng con trỏ chuột kéo nút đến
D18
Dữ
liệu ra
9
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
10
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Dữ liệu ra
11
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Câu 3:
I. Đề bài
Tuổi X và huyết áp Y của bệnh nhân trẻ em (dưới 14 tuổi), chọn ngẫu
nhiên được cho trong bảng sau đây:
X 14 1 9 7 9 12 1 3 14 1 9 7 9 12 1 3
Y 100 83 112 152 104 90 92 85 100 73 132 122 134 98 82 65
Tính tỉ số tương quan, hệ số tương quan và hệ số xác định của Y đối
với X. Với mức ý nghĩa α = 5%, có kết luận gì về mối quan hệ tương
quan giữa X và Y (Có phi tuyến không ? Có tuyến tính không ?)? Tìm
đường hồi quy tuyến tính của Y đối với X. Tính sai số tiêu chuẩn của
đường hồi quy
II. Dạng bài
- Bài toán kiểm định tương quan và hồi quy.
III. Phương pháp giải:
- Phân tích tương quan:
Sự phân tích tương quan (correlation) khảo sát khuynh hướng và mức
độ của sự liên quan, trong sự phân tích hồi quy (regrestion) xác định
sự liên quan định lượng giữa hai biến số ngẫu nhiên Y và X. Hệ số
tương quan có thể được ước tính bởi biểu thức:
∑𝑛 ̅ ̅
𝑖=1(𝑋𝑖 −𝑋)(𝑌𝑖 −𝑌)
𝑝̂ = 𝑅 =
√∑𝑛 ̅ 2 𝑛 ̅̅̅2
𝑖=1(𝑋𝑖 −𝑋) ∑𝑖=1(𝑌𝑖 −𝑌)
12
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
∑ 𝑋𝑖 𝑌𝑖 −∑ 𝑋𝑖 𝑌𝑖 /𝑁
𝐵0 = 𝑌̅ − 𝐵𝑋̅ 𝐵=
𝑋𝑖 −𝑋̅
1
S=√ ∑(𝑌𝑖 − 𝑌𝑖 ′)2 (Sự phân tán dữ liệu càng ít thì giá trị của S càng
𝑁−2
gần zero)
Trắc nghiệm t
13
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
-Kết luận:
Nếu F< 𝐹𝛼 (1, 𝑁 − 2) => Chấp nhận giả thuyết H0
IV. Công cụ giải:
+ Phân tích tương quan : sử dụng chương trình Correlation để tìm hệ
số tương
quan
+ Hồi quy đơn tuyến tính : sử dụng chương trình Regression
V. Kết quả và tính toán
1. Phân tích tương quan tuyến tính
Nhập dữ liệu vào bảng tính
14
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Dữ liệu ra
15
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Biện luận:
Từ bảng, ta có hệ số tương quan r = 0.4468
Hệ số xác định 𝑟 2 = 0.1996
Giả thiết : X và Y không tương quan tuyến tính
Tính toán:
𝑟 √𝑛−2
n =16; T= = 1.689
√1−𝑟 2
Phân phối Student mức α = 0,05 với bậc tự do n-2 = 14, dùng hàm TINV
trong excel để tính ta được c = 2,144787 (=TINV(0.05,14))
|𝑇| < c nên chưa có cơ sở để bác bỏ H0 -> chấp nhận H0
Kết luận: X Y không có tương quan tuyến tính
2. Phân tích tương quan phi tuyến
Giả thiết H1: X và Y không có tương quan phi tuyến
Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại
16
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
17
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
n = 16; k=6
Tổng bình phương giữa các nhóm SSF = 6943.75
Tổng bình phương nhân tố SST = 8515.75
2
𝜂𝑌/𝑋 = SSF/SST = 0.8154 => Tỷ số tương quan 𝜂𝑌/𝑋 = 0.903
2
(𝜂𝑌/𝑋 −𝑟 2 )(𝑛−𝑘)
Giá trị F = 2 )(𝑘−2) = 8.339
(1−𝜂𝑌/𝑋
18
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Kết luận:
Vậy X và Y có tương quan phi tuyến.
3. Phân tích hồi quy (sử dụng Regression)
Nhập dữ liệu:
19
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Dữ liệu ra:
20
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Biện luận:
Hệ số góc = 2.33529
Hệ số tự do = 85.77794
Vậy Y = 85.77794 + 2.33529.X
Giả thuyết H: Hệ số hồi quy không có ý nghĩa thống kê
Giá trị P của hệ số tự do (P-value) = 5.44E-07 < α = 0,05 => bác bỏ giả
thiết H
->Hệ số tự do có ý nghĩa thống kê
Giá trị P của hệ số góc (P-value) = 0.06844 > α = 0,05 => chấp nhận giả
thiết H
->Hệ số góc không có ý nghĩa thống kê
21
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Giả thuyết H1 : Phương trình đường hồi quy không thích hợp
Giá trị F (Significance F) = 0.06844 > α = 0,05 => chấp nhận giả thiết
H1
->Phương trình đường hồi quy không thích hợp
VI. Kết quả:
- Tỷ số tương quan: 𝜂𝑌/𝑋 = 0.903
- Hệ số tương quan: r = 0.4468
- Hệ số xác định: 𝑟 2 = 0.1996
- X và Y không có tương quan tuyến tính với mức ý nghĩa 5%
- Phương trình đường hồi quy tuyến tính Y = 85.77794 + 2.33529.X
là không thích hợp.
Câu 4:
I. Đề bài
Hãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận nội
thành trên cơ sở số liệu về doanh thu trung bình như sau:
Ngành nghề kinh Khu vực kinh doanh
doanh Q1 Q2 Q3 Q4
Điện lạnh 5.7 3.1 4.4 5.0
Vật liệu xây dựng 5.0 15.0 9.5 17.5
Dịch vụ tin học 3.8 1.8 1.3 4.8
Mức ý nghĩa 10%.
II. Dạng bài
Phân tích phương sai hai yếu tố (không lặp)
III. Phương pháp giải
22
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Mô hình
Yếu tố A Yếu tố B Tổng Trung
1 2 … C cộng bình
1 𝑌11 𝑌12 … 𝑌1𝑐 𝑌1. 𝑌̅1
2 𝑌21 𝑌22 … 𝑌2𝑐 𝑌2. 𝑌̅2
… … … … … … …
r 𝑌𝑟1 𝑌𝑟2 … 𝑌𝑟𝑐 𝑌11 𝑌̅3
Tổng cộng 𝑇.1 𝑇.2 … 𝑇.𝑐 𝑇..
Trung bình 𝑌̅.1 𝑌̅.2 … 𝑌̅.𝑐 𝑌̅..
Bảng ANOVA
Bậc tự Bình phương Giá trị thống
Nguồn sai số Tổng số bình phương
do trung bình kê
Yếu tố A 𝑇𝑖2 𝑇..2 𝑆𝑆𝐵 𝑀𝑆𝐵
r-1 SSB = ∑𝑟𝑖=1 − MSB = 𝐹𝑅 =
(Hàng) 𝑟 𝑟𝑐 𝑟−1 𝑀𝑆𝐸
Yếu tố B 𝑇 2
𝑇..2 𝑆𝑆𝐹 𝑀𝑆𝐹
(Cột)
c-1 SSB = ∑𝑟𝑗=1 𝑗 − MSF =
𝑐−1
𝐹𝑐 =
𝑟 𝑟𝑐 𝑀𝑆𝐸
𝑆𝑆𝑏
Sai số (r-1)(c-1) SSE = SST-(SSF+SSB) MSB =
𝑟−1
𝑇..2
Tổng cộng rc-1 SST = ∑𝑟𝑖=1 ∑𝑟𝑗=1 𝑌𝑖𝑗2 −
𝑟
- Giả thuyết:
H0: µ1 = µ2 = … µk “Các giá trị trung bình bằng nhau”
H1: µ1 ≠ µ2 “Ít nhất có hai giá trị trung bình khác nhau”
𝑀𝑆𝐵 𝑀𝑆𝐹
- Giá trị thống kê: 𝐹𝑅 = và 𝐹𝑐 =
𝑀𝑆𝐸 𝑀𝑆𝐸
- Biện luận:
- Nếu 𝐹𝑅 < 𝐹𝛼 [𝑏 − 1, (𝑘 − 1)(𝑏 − 1)] => Chấp nhận H0 (yếu tố A)
- Nếu 𝐹𝐶 < 𝐹𝛼 [𝑏 − 1, (𝑘 − 1)(𝑏 − 1)] => Chấp nhận H0 (yếu tố B)
IV. Công cụ giải
Sử dụng MS-EXCEL
23
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
24
Đào Lê Phương Nam - 1612090
Bài tập lớn XÁC SUẤT THỐNG KÊ Nhóm 6-Đề 6
Biện luận :
Giả thiết H0 : Các giá trị doanh thu trung bình bằng nhau
Frows (Ngành nghề kinh doanh) = 7.41952 > F0.1 (2,6) = 3.46330 nên bác
bỏ giả thuyết H0 (Ngành nghề kinh doanh)
Fcol (Khu vực kinh doanh) = 0.97333 < F0.1 (3,6) = 3.28876 nên chấp
nhận giả thuyết H0 (Khu vực kinh doanh)
Kết luận :
Vậy chỉ có ngành nghề kinh doanh ảnh hưởng đến doanh thu trung bình
25
Đào Lê Phương Nam - 1612090