10 de Tong Hop XSTK 2014-2015

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 21

Yêu cầu chung:

1. Mỗi nhóm SV nộp lại 1 file word qua địa chỉ email
ngkieudung@hcmut.edu.vn, trước buổi báo cáo 3 ngày , và nộp 1 bản in
vào ngày báo cáo. Sau buổi báo cáo, cuốn đề tài chỉ để lưu trữ nên các
nhóm không cần in màu, có thể in 2 mặt, không cần đóng bìa mica. Ở trang
bìa, SV cần lưu ý ghi đầy đủ danh sách SV, in đậm tên nhóm trưởng (hoặc
có đánh dấu), sắp xếp tên các thành viên theo thứ tự abc, đánh số thứ tự
trong danh sách các thành viên.

2. SV thực hiện các bài tập trong Excel, sau đó mô tả các bước thực hiện (viết
gọn), có copy hình ảnh các kết quả minh họa vào word.
3. Bài 1 không phải trình bày cơ sở lý thuyết. Các bài khác phải trình bày cơ
sở lý thuyết của bài (viết gọn).
Lưu ý đối với mỗi bài kiểm định, dựa vào kết quả sau khi thực hiện trên
Excel, SV cần trình bày lại theo đầy đủ các bước: Đặt các giả thiết kiểm
định; các miền bác bỏ tương ứng; các tiêu chuẩn kiểm định ( hoặc giá trị P);
và kết luận.
4. Điểm nội dung đề tài + nộp đúng hạn + trả lời đúng các câu hỏi liên quan
đến đề tài: 7 điểm.
5. Điểm thực hành : nhận dạng bài toán + thực hành bài cụ thể (tương tự các
bài trong 10 đề tài) + trả lời câu hỏi trực tiếp: 3 điểm.

Hình thức kiểm tra thực hành: Mỗi nhóm sẽ có từ 2-4 SV được gọi ngẫu
nhiên để kiểm tra thực hành. Mỗi SV sẽ bốc thăm 1 câu hỏi chứa một trong
các yêu cầu sau:
- Nhập trực tiếp vào Excel 1 mẫu định lượng bất kỳ và dùng chức năng
Data Analysic/ Descriptive Statistics để tìm các đặc trưng mẫu và giải
thích các số liệu thu được, vẽ đồ thị.
- Nhận dạng bài toán để chọn test phù hợp: t-test; z-test; F-test.
- Nhận dạng bài toán để chọn phân tích phương sai 1 yếu tố; 2 yếu tố;
- Kiểm định tính độc lập ( so sánh các tỷ lệ).

6. Thời hạn báo cáo: 1-2 tuần cuối cùng . Các nhóm sẽ đăng ký hoặc bốc thăm
thứ tự báo cáo vào tuần học cuối.
7. Điểm cộng cho các nhóm lấy ví dụ về tập dữ liệu có nội dung liên quan gần
đến chuyên ngành học.
ĐỀ TÀI 1

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 91% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Theo dõi doanh số bán hàng của một cửa hàng trong 12 ngày của tháng 4 và 12 ngày của
tháng 10, người ta thu được kết quả sau:
Ngày trong 1 2 3 4 5 6 7 8 9 10 11 12
tháng
Tháng 4 7,6 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5
Tháng 10 6,3 8,8 9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7
Với mức ý nghĩa 3%, có thể cho rằng doanh số bán trung bình hàng ngày trong tháng 10
có giảm sút so với tháng 4 hay không? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành:
Ngày khảo sát Các quận nội thành
Quận 1 Quận 2 Quận 3 Quận 4 Quận 5
Thứ hai 254 236 267 223 245
Thứ ba 245 212 256 213 234
Thứ tư 236 223 245 230 232
Thứ năm 235 197 243 213 224
Thứ 6 250 210 232 215 233
Thứ 7 247 196 223 207 242
Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu
tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 5 %.
Bài 4:
Ba loại vật liệu được thử sức bền dưới ảnh hưởng của việc thay đổi nhiệt độ vô cùng lớn,
chúng ta có số liệu:
Kết cục Vật liệu 1 Vật liệu 2 Vật liệu 3
Vỡ vụn 25 45 41
Bị phá hủy một phần 40 35 33
Còn toàn vẹn 35 20 26
Hãy kiểm định xem có mối liên hệ phụ thuộc giữa loại vật liệu với tác động thay đổi
nhiệt độ không? Sử dụng mức ý nghĩa 2%.
Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 2

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 92% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Ở một nhà máy sản suất thuốc lá, người ta kiểm tra hàm lượng nicotine trong 2 hiệu
thuốc lá sợi khác nhau và có được các kết quả như sau ( đơn vị: mg).
Hiệu A: 24; 26; 25; 27; 28; 25; 21 ; 22,5; 25; 27
Hiệu B: 27; 24; 25; 23; 26; 24.5; 26; 25.5; 27
Với mức ý nghĩa 4%, có thể coi như hàm lượng nicotine trong 2 hiệu thuốc lá trên là
như nhau hay không? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Với mức ý nghĩa 1%, hãy phân tích doanh thu của một số ngành nghề ở 4 quận nội
thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:
Ngành nghề Quận
Kinh doanh Q1 Q2 Q3 Q4
Điện lạnh 2,5 ; 2,7; 3,1 ; 3,5; 2,2 ; 2,0; 11,2 ; 12,0;
2,0 ; 3,0 2,7 ; 3,2 9,5 ; 2,1 19,8 ; 15,8
Vật liệu xây 0,6 ; 10,4; 1,2 ; 1,0; 3,3 ; 2,3; 4,2 ; 1,0;
dựng 11,2 ; 8,3 9,8 ; 1,8 6,7 ; 1,9 3,8 ; 2,5
Dịch vụ tin 4,2 ; 5,0; 3,2 ; 2,0; 0,4 ; 3,0; 3,1 ; 1,0;
học 6,2 ; 3,3 7,8 ; 2,5 9,8 ; 2,8 3,6 ; 3,9
Cơ khí 0,6 ; 10,4; 1,2 ; 1,0; 3,3 ; 2,3; 4,2 ; 1,0;
11,3 ; 8,2 9,8 ; 1,7 6,7 ; 1,8 3,8 ; 2,4

Bài 4:
Quan sát 400 người về màu tóc và màu mắt, người ta được bảng số liệu sau:

Hoàn cảnh GĐ Vàng Nâu Đen


Tình trạng
Đen 12 65 121
Nâu 38 59 105
Với mức ý nghĩa 0,05, có thể cho rằng màu tóc và màu mắt không có liên quan gì với
nhau hay không?
Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 3

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 93% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Một giám đốc doanh nghiệp quyết định gửi 8 nhân viên của mình đi dự một lớp tập huấn
về “Dịch vụ khách hàng”. Dưới đây là phản hồi của bộ phận chăm sóc khách hàng về các
nhân viên được cử đi tập huấn.
Tên nhân Số lần phàn nàn của khách hàng
viên
3 tháng trước tập huấn 3 tháng sau tập huấn
A 3 2
B 5 4
C 12 10
D 8 6
E 6 6
F 5 3
G 7 3
H 9 4
Hãy nhận xét hiệu quả của quyết định trên với mức ý nghĩa 5%. Tìm thêm giá trị P trong
kiểm định.
Bài 3:
Sau đây là số liệu về một loại báo ngày bán được ở 5 quận nội thành, số liệu lấy ở một
đại lý bán lẻ:
Ngày khảo sát Các quận nội thành
Quận 1 Quận 2 Quận 3 Quận 4 Quận 5
Thứ hai 254 236 267 223 245
Thứ ba 245 212 256 213 234
Thứ tư 236 223 245 230 232
Thứ năm 235 197 243 213 224
Thứ 6 250 210 232 215 233
Thứ 7 247 196 223 207 242
Lượng báo thực sự bán ra ở 5 quận có khác nhau không? Lượng báo bán ra có chịu yếu
tố tác động là ngày trong tuần hay không? Kết luận với mức ý nghĩa 10%.

Bài 4:
Khảo sát ngẫu nhiên 300 sinh viên đã tốt nghiệp cùng một chuyên ngành từ 3 trường A,
B và C sau một năm ra trường, người ta có kết quả:

Trường Đã đi làm Học tiếp Chưa có việc làm


A 60 12 28
B 55 10 35
C 65 6 29
Với mức ý nghĩa 3%, hãy cho biết có thể coi tình trạng việc làm của sinh viên 3 trường
trên là như nhau không?

Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 4

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 94% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Hàm lượng (%) của chất C trong cùng một loại sản phẩm của 2 công ty được công bố
xấp xỉ nhau. Đo kiểm tra hàm lượng chất C có trong một số sản phẩm được chọn ngẫu
nhiên trên thị trường, người ta thu được số liệu sau:
Sản phẩm của
công ty A 37 38 35 40 42 34 37 39
Sản phẩm của
công ty B 42 35 40 38 36 43 38 41
Hãy so sánh mức độ đồng đều của hàm lượng chất C trong các sản phẩm của 2 công ty
với mức ý nghĩa 3%. Giả thiết hàm lượng này phân bố theo quy luật chuẩn.

Bài 3:
Nồng độ chì trong không khí đo được ở một số giao lộ trong thành phố được thể hiện
trong kết quả sau:
Địa điểm Nồng độ chì ( mg/m3)
I 0,42 0,53 0,62 0,71 0,83 0,61 0,51 0,32
II 0,70 0,32 0,64 0,44 0,53
III 0,39 0,37 0,43 0,45 0.41 0,52 0.42
IV 0,35 0,45 0,54 0,56 0,6 0,62
Có thể coi nồng độ chì trong không khí ở các giao lộ là giống nhau hay không, với mức ý
nghĩa 5%? Tìm hệ số xác định R2 của bài toán.
Bài 4:
Một nông trường nuôi 3 giống bò sữa A,B,C. Lượng sữa của các con bò này được thể
hiện trong bảng theo dõi sau:
Lượng sữa
Loại bò
Ít Trung bình Nhiều
A 92 37 46
B 53 15 19
C 75 19 12
Với mức ý nghĩa  = 0,05, hãy nhận định xem có phải 3 giống bò này thuần như nhau về
phương diện sản lượng sữa hay không?
Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 5

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 95% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Theo dõi doanh số bán hàng của một 2 cửa hàng, người ta thu được kết quả sau:
Cửa hàng 10,2 9,3 4,4 3,2 5,6 6,3 7,4 8,4 3,9 7,2 6,5 6,2 7,4 7,5
1
Cửa hàng 8,8 9,0 5,1 4,2 4,1 5,8 6,3 6,7 5,6 6,7 6,7 7,6
2
Với mức ý nghĩa 3%, có thể cho rằng doanh số bán hàng của 2 cửa hàng có sự phân tán
như nhau hay không? Giả thiết doanh số bán hàng mỗi ngày của các cửa hàng tuân theo
quy luật chuẩn.
Bài 3:
Đo mức độ bụi trong không khí tại các khu vực trong thành phố tại cùng một thời điểm,
người ta được số liệu sau, ( đơn vị mg/m3):

Số thứ tự Các khu vực


quan sát
KV1 KV2 KV3 KV4
1 0,54 0,48 0,56 0,47
2 0,60 0,49 0,62 0,52
3 0,72 0,55 0,60 0,56
4 0,67 0,62 0,71 0,53
5 0,83 0,57 0,73
6 0,63 0,59
Mức độ nhiễm bụi của các khu vực trên có được coi là như nhau hay không? Hãy kết
luận bằng giá trị P. Tìm hệ số xác định R2 của bài toán.
Bài 4:

Bảng số liệu sau cho biết số người chết về bệnh ung thư ở 3 nước Mỹ, Nhật, Anh trong
thời gian khảo sát. Người chết được phân loại theo cơ quan bị ung thư.
Bộ phận bị ung Nước
thư Mỹ Nhật Anh
Ruột 11 5 5
Ngực 15 3 7
Dạ dày 3 22 3
Bộ phận khác 41 30 15
Với mức ý nghĩa  = 1%, hãy so sánh phân bố tỉ lệ chết về ung thư của 3 nước nói
trên.
Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 6

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Người ta dùng 2 loại nguyên liệu A và B để sản xuất thử đế của 10 đôi giày trẻ em, sau
đó cho các em đi thử trong vòng 6 tháng với cường độ sử dụng tương tự như nhau. Sau
thử nghiệm, trọng lượng đế giày còn lại được cho trong bảng sau:
Thứ tự Loại vật liệu Giày trái Giày phải
1 A 180 183
2 A 162 154
3 A 203 189
4 A 194 181
5 A 205 200
6 B 189 185
7 B 168 171
8 B 185 179
9 B 176 175
10 B 169 173
Với mức ý nghĩa 0,07 có thể cho rằng dùng loại nguyên liệu A làm đế giày tốt hơn dùng
loại nguyên liệu B hay không? Tìm thêm giá trị P trong kiểm định.

Bài 3:

Doanh số bán hàng ( triệu đồng) của 4 cửa hàng trong 6 tuần đầu của mùa hè được cho
trong bảng số liệu:
Tuần Cửa hàng 1 Cửa hàng 2 Cửa hàng 3 Cửa hàng 4
1 1430 980 1780 2300
2 2200 1400 2890 2682
3 1140 1200 1500 2000
4 880 1300 1470 1900
5 1670 1350 2380 1540
6 990 650 1930 1900
Hãy sử dụng mức ý nghĩa 5% để so sánh doanh thu của các cửa hàng có như nhau không
và có sự liên quan giữa yếu tố doanh thu và yếu tố thời gian hay không.
Bài 4:

Trong một thí nghiệm khoa học, người ta đo độ dày của lớp mạ kền khi dùng 3 loại bể
mạ khác nhau. Sau một thời gian mạ, người ta đo được độ dày của lớp mạ nhận được ở
các bể như sau:
Độ dày lớp mạ kền Số lần đo ở bể mạ
(m) A B C
4-8 32 51 68
8 - 12 123 108 80
12 - 16 10 26 26
16 - 20 41 24 28
20 - 24 19 20 28
Hãy kiểm định giả thiết độ dày lớp mạ kền sau khoảng thời gian nói trên không phụ
thuộc loại bể mạ được dùng, với mức ý nghĩa  = 0,05.
Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 7

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 97% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Trong một hội thảo định hướng nghề nghiệp, một trung tâm đào tạo chọn ngẫu nhiên 36
học sinh để tham khảo ý kiến về mức độ yêu thích các ngành nghề của trung tâm trước
và sau khi học sinh tham dự hội thảo. Mức độ yêu thích được đo bằng thang đo khoảng
cách 10 điểm, trong đó 1 là hoàn toàn không thích và 10 là rất thích. Các phiếu trả lời
được thu về như sau:
Trước 3 4 5 7 8 5 6 4 3 9 3 6
Sau 5 5 6 5 8 8 5 6 7 9 4 5
Trước 1 2 4 7 6 4 5 5 4 3 7 6
Sau 4 6 7 8 7 5 3 7 8 9 7 8
Trước 5 6 7 8 2 3 6 4 3 4 3 1
Sau 7 8 5 7 6 5 7 7 5 5 7 2
Hãy dùng một kiểm định phù hợp để xem việc tham dự hội thảo có làm tăng sự yêu thích
của học sinh đối với các ngành nghề mà trung tâm đào tạo hay không, với mức ý nghĩa
2%? Tìm thêm giá trị P trong kiểm định.
Bài 3:
Với mức ý nghĩa  = 2%, hãy phân tích sự biến động của thu nhập hàng tháng trên cơ
sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau
sau đây, (đơn vị USD/ 1 người):
Loại ngành Nơi làm việc
nghề V1 V2 V3 V4
1 212 200 230 220
2 222 205 222 225
3 241 250 245 235
4 240 228 230 240

Bài 4:
Nghiên cứu sự ảnh hưởng của gia đình đối với tình trạng phạm tội của trẻ em tuổi vị
thành niên qua 148 em nhỏ, người ta thu được số liệu:
Hoàn cảnh GĐ Bố hoặc mẹ Bố mẹ đã ly hôn Còn cả bố mẹ
Tình trạng đã chết
Không phạm tội 20 25 13
Phạm tội 29 43 18
Với mức ý nghĩa 0,05, có thể coi hoàn cảnh gia đình của trẻ em độc lập với tình trạng
phạm tội của trẻ hay không?

Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 8

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 98% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Điểm đánh giá của người dùng thử về 2 loại sản phẩm đậu phộng trước và sau cải tiến
được thu thập trên thang điểm 10 như sau:
Trước cải tiến 7 8 6 8 7 7 7 6 8 6
Sau cải tiến 8 9 5 9 5 6 8 7 8 7
Trước cải tiến 6 9 6 4 6 7 8 5 4 3
Sau cải tiến 8 8 8 7 6 7 7 6 7 6
Hãy cho biết hiệu quả của việc cải tiến sản phẩm với mức ý nghĩa 6%. Tìm thêm giá trị P
trong kiểm định.

Bài 3:

Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái mùa (khô và mưa:
trong mỗi mùa lấy mẫu ba lần - đầu. giữa và cuối) và từ ba miền (nam. trung và bắc)
được tóm tắt như sau:
Mùa Miền
Thời điểm Nam Trung Bắc
Đầu mùa 2.4 2.1 3.2
Mùa khô Giữa mùa 2.3 2.2 3.2
Cuối mùa 2.5 2.3 3.4
Đầu mùa 2.4 2.2 3.3
Mùa mưa Giữa mùa 2.5 2.1 3.5
Cuối mùa 2.7 2.3 3.4
Hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền? Nếu có thì hai yếu
tố mùa và miền có sự tương tác với nhau hay không? Sử dụng mức ý nghĩa 2%.
Bài 4:

Bệnh đau mắt hột được chia làm 4 thời kỳ T1, T2, T3 và T4. Một kết quả kiểm tra các bệnh
nhân đau mắt hột được cho trong bảng sau:
Địa Mức độ đau mắt hột
phương T1 T2 T3 T4
A 47 189 807 1768
B 53 746 1387 946
C 16 228 438 115
Hãy nhận xét xem tình hình đau mắt hột ( cơ cấu phân bố 4 mức độ) ở 3 địa phương trên
có giống nhau hay không, sử dụng mức ý nghĩa 1%.

Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 9

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Hai máy cùng gia công một loại chi tiết. Để kiểm tra xem 2 máy này có củng độ chính
xác như nhau hay không, người ta lấy ngẫu nhiên từ mỗi máy 7 chi tiết, đem đo và thu
được kết quả sau (đơn vị mm):
Máy A 137 138 135 140 138 137 139
Máy B 142 135 140 138 136 138 141
Có thể cho rằng 2 máy có độ chính xác như nhau hay không, với mức ý nghĩa 2%? Giả
thiết rằng kích thước chi tiết có phân phối chuẩn.

Bài 3:
Theo giới thiệu của nhà phân phối, mức tiêu thụ nhiên liệu trung bình của 4 loại xe ô tô
là như nhau. Sau một thời gian chạy xe, người ta đo lại trên các quãng đường như nhau
thì được kết quả sau:
Loại xe Mức tiêu thụ nhiên liệu
I 20 21,2 18,7 19,5 20,1 22 21 21,7
II 21,2 21,2 20,4 19.6 22 21,1 20
III 21,5 21,2 21 21,5 22 20,7
IV 19,9 22 21 23 21,2 20,6 21,3
Có thể coi mức tiêu thụ nhiên liệu của 4 loại xe này còn giống nhau hay không, với mức
ý nghĩa 4%? Tìm hệ số xác định R2 của bài toán.
Bài 4:
Một cuộc điều tra xã hội học được tiến hành ở 5 thành phố A,B,C,D,E. Người ta yêu cầu
những người được hỏi diễn tả mức độ thỏa mãn của mình đối với thành phố mà họ đang
sống. Kết quả được cho như sau:

Thành phố Mức độ thỏa mãn


Rất thỏa Tương đối Không
mãn
A 220 121 63
B 130 207 75
C 84 54 24
D 156 95 43
E 122 164 73
Với mức ý nghĩa  = 3%, Hãy kiểm định xem mức độ thỏa mãn có phân bố giống nhau ở 5
thành phố trên hay không?

Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.
ĐỀ TÀI 10

Bài 1: Tìm một dữ liệu định lượng (A) và một dữ liệu định tính (B) thích hợp, sử dụng
các dữ liệu đó cho các yêu cầu sau:
1)Thực hiện phương pháp phân tổ dữ liệu (A).
2)Vẽ đồ thị phân phối tần số và đa giác tần số (A).
3) Tính các đặc trưng mẫu và ước lượng giá trị trung bình của dấu hiệu quan sát
với độ tin cậy 96% (A).
4)Trình bày dữ liệu định tính (B) dạng phân loại bằng các đồ thị.
Bài 2:
Một máy sơn tự động được thiết kế để phun sơn 1 xe ô tô với mức trung bình là 4 kg sơn.
Dữ liệu dưới đây thể hiện lượng sơn thực tế đã sử dụng để sơn cùng một loại xe trong 2
ngày liên tiếp:
Ngày 1: 3,8 4,2 3,6 4,1 3,9 4,3 4,1 3,8 3,95
Ngày 2: 4,5 3,8 4,1 3,9 4,5 3,8 4 đơn vị: kg.
Hãy kiểm định xem máy phun sơn có sử dụng lượng sơn trung bình khác nhau giữa 2
ngày hay không, với mức ý nghĩa 1%. Tìm thêm giá trị P trong kiểm định.
Bài 3:
Một nhà nghiên cứu muốn khảo sát thời gian phản ứng của nam giới và nữ giới đối với
các loại tín hiệu khác nhau. Các đối tượng ( 15 nam, 15 nữ) tham gia thí nghiệm được
yêu cầu nhấn nút ngay khi nhận biết có tín hiệu. Đây là bảng số liệu ghi lại thời gian
(giây) từ khi tín hiệu được phát đi cho đến khi đối tượng khảo sát có tín hiệu trả lời.

Âm thanh Ánh sáng Xung


10,0 6,0 9,1
7,2 3,7 5,8
Nam 6,8 5,1 6,0
6,0 4,0 4,0
5,0 3,2 5,1
10,5 6,6 7,3
8,8 4,9 6,1
Nữ 9,2 2,5 5,2
8,1 4,2 2,5
13,4 1,8 3,9
Với mức ý nghĩa  = 5%, có thể xem như có tương tác giữa giới tính và tín hiệu hay
không?
Bài 4:
Một nghiên cứu được tiến hành ở thành phố công nghiệp X để xác định tỉ lệ những người
đi làm bằng xe máy, xe đạp, xe buýt. Việc điều tra được tiến hành trên 2 nhóm và có kết
quả như sau:

Xe máy Buýt Xe đạp


Nữ 25 100 125
Nam 75 120 205
Với mức ý nghĩa  = 5%, hãy nhận định xem có sự khác nhau về cơ cấu sử dụng các
phương tiện giao thông đi làm trong 2 nhóm người lao động nam và nữ hay không.
Bài 5:
a) Tìm một dữ liệu ngẫu nhiên 2 chiều (X, Y) có kích thước n >10 để sử dụng mô hình
hồi quy tuyến tính đơn. Thực hiện các yêu cầu:
1) Tìm hệ số tương quan giữa X,Y.
2) Quan hệ giữa X,Y có được coi như quan hệ tuyến tính hay không? Nếu có, hãy
ước lượng đường hồi quy tuyến tính Y theo X.
3) Tìm hệ số xác định R2.
4) Tìm sai số chuẩn của ước lượng.
b) Xem Ví dụ 4.2 trong Chương 4, phần Phụ lục trong sách XSTK của trường. (Đề bài
bắt đầu từ: Người ta đã dùng 3 mức nhiệt độ…). Thực hiện lại các yêu cầu của bài.

You might also like