Download as pdf or txt
Download as pdf or txt
You are on page 1of 2

BÀI TẬP CHƯƠNG 2

THONG KÊ TRONG KHOA HỌC VÀ SƯ SỐNG

Bai tâp 1:
Một nhà hàng tiến hành khảo sát mức độ hài lòng của thực khách về chất lượng
của các món ăn theo 5 bậc như sau:
 O (Outstanding): tuyệt diệu
 V (Very good): rất ngon
 G (Good): ngon
 A (Average): trung bình
 P (Poor): tệ, dở.

Dưới đây là kết quả thu thập được từ một mẫu gồm 50 người:
G O V G A O V O V G
O V A V O P V O G A
O O O G O V V A G O
V P V O O G O O V O
G A O V O O G V A G

a) Lập bảng thông kê tân sô và tinh ty lệ phân trăm của các mức độ hài lòng.
b) Ve biêu đồ cột và biêu đồ tròn minh hoa cho câu a. Nêu một sô nhận xet về
thông tin nhận được.
Bai tâp 2:

Cho dữ liệu dưới đây về bảng lương (triệu đô) trong một năm của 32 đội bóng
thuộc Liên đoàn bóng đá Quôc gia Mỹ:
99 105 106 102 102 93 109 106
77 91 103 118 97 100 107 103
94 109 100 98 84 92 98 110
94 104 98 123 102 99 100 107
a) Ve biêu đồ thân và lá (stem and leaf) mô tả phân bô bảng lương trên. Viết
một vài dòng nhận xet về thông tin nhận được.

b) Ve biêu histogram mô tả phân bô bảng lương trên. Viết một vài dòng nhận
xet về thông tin nhận được. So sánh với câu a.

c) Tinh các đăc trưng sô gồm trung bình, trung vi, phương sai, độ lệch chuân,
min, Q1, Q2, Q3, max của bảng lương các đội bóng.

1
d) Ve biêu đồ hộp đê phân tich khám phá dữ liệu. Nhận xet.

Bai tâp 3:
Sinh viên đoc dữ liệu fish.csv về sô lượng cá sinh ra hăng năm ở vung biên
Bering Sea vào R và thực hiện theo các yêu câu bên dưới.
a) Ve biêu đồ histogram và đường mật độ mô tả phân bô sô lượng cá sinh ra hăng
năm. Nêu một sô nhận xet về thông tin nhận được.
b) Ve biêu đồ chuôi thời gian đê khám phá xu hướng sô lượng cá sinh ra hăng
năm. Nêu một sô nhận xet về thông tin nhận được.
c) Tinh các đăc trưng sô đo lường trung tâm và độ phân tán của dữ liệu trên gồm:
trung bình, trung vi, phương sai và độ lệch chuân.
d) Tìm các giá tri tứ phân vi đê tóm lược dữ liệu gồm: min, Q1, Q2, Q3, và max.
e) Ve biêu đồ hộp đê phân tich khám phá dữ liệu. Viết một vài dòng nhận xet về
thông tin nhận được.
Câu 4) Cho một mẫu sô liệu ngẫu nhiên về đường kinh thân cây (cm) của 40 cây
thông lá dài (Longleaf pine trees) như sau:
10.5 13.3 26.0 18.3 52.2 9.2 26.1 17.6 40.5 31.8
47.2 11.4 2.7 69.3 44.4 16.9 35.7 5.4 44.2 2.2
4.3 7.8 38.1 2.2 11.4 51.5 4.9 39.7 32.6 51.8
43.6 2.3 44.6 31.5 40.3 22.3 43.3 37.5 29.1 27.9
a) Nhập dữ liệu vào R, đăt tên đôi tượng là pine.

b) Tóm tắt dữ liệu trên với 6 giá tri: min, Q1, median, mean, Q3 và max.

c) Tinh trung bình, trung vi, phương sai và độ lệch chuân.

d) Ve histogram có gắn đường mật độ thê hiện phân bô dữ liệu. Nhận xet về
thông tin nhận được.

e) Dựa vào tiêu chuân 1.5*IQR kiêm tra dữ liệu có giá tri outliers (giá tri
ngoại lai) hay không? Nếu có xuất ra outliers.

Câu 5) Cho sô liệu SpamType.csv về ty lệ phân trăm của một sô loại thư rác
phổ biến trên Internet (email spam).
a) Nhập dữ liệu vào R, đăt tên đôi tượng là spam.

b) Sắp xếp dữ liệu giảm dân theo ty lệ phân trăm.

c) Ve biêu đồ thanh cột, trong đó các cột được sắp theo thứ tự giảm dân.

d) Dựa vào biêu đồ viết một vài dòng nhận xet.


2

You might also like