Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

CHƯƠNG 1: TỔNG QUAN VÀ THỐNG KÊ MÔ TẢ

I. Tổng thể và mẫu:


 Ta gọi tất cả những đối tượng cần nghiên cứu là tổng thể hay tập hợp
thống kê
 Một tổng thể U có thể gồm nhiều đặc trưng X. Ta có thể xem X là biến
ngẫu nhiên chỉ đặc trưng cần nghiên cứu được chọn từ tổng thể U.
 Tập hợp các phần tử lấy từ U để nghiên cứu X là mẫu và số phần tử của
mẫu gọi là cỡ mẫu (ký hiệu: n)
 Tập dữ liệu gồm n quan sát trên một biến X, những quan sát riêng lẻ sẽ
được ký hiệu là x1, x2, …, xn.
II. Biểu đồ
1. Biểu đồ gốc và lá: Xét một tập hợp các giá trị x1, x2, …, xn mà mỗi xi
bao gồm ít nhất 2 chữ số.
Hướng dẫn tạo biểu đồ gốc và lá
 Chọn 1 hoặc nhiều chữ số đầu làm gốc và các chữ số sau làm lá
 Liệt kê các giá trị gốc có thể có trong một cột dọc
 Ghi lá cho mỗi quan sát bên cạnh giá trị gốc tương ứng
 Chỉ ra các đơn vị cho cành và lá

Ví dụ: Khảo sát chiều cao (đơn vị: m) của 45 sinh viên trường đại học
sư phạm kỹ thuật Tp. HCM ta có bảng số liệu:

1.55 1.73 1.65 1.71 1.55 1.51 1.68 1.56 1.63


1.55 1.57 1.63 1.59 1.54 1.80 1.45 1.60 1.55
1.60 1.65 1.70 1.68 1.70 1.65 1.56 1.54 1.52
1.64 1.67 1.50 1.80 1.48 1.65 1.70 1.82 1.79
1.70 1.40 1.67 1.70 1.67 1.58 1.60 1.62 1.52

Biểu đồ gốc và lá của mẫu về chiều cao của 45 sinh viên có dạng:

Người soạn: Phạm Hoàng Dương


Tần số Gốc Lá
1 1.4 0
2 1.4 58
6 1.5 012244
9 1.5 555566789
7 1.6 0002334 Độ rộng của gốc: 0.10
9 1.6 555577788 Mỗi lá: 1 trường hợp
7 1.7 0000013 Đơn vị: m
1 1.7 9
3 1.8 002

2. Biểu đồ chấm: Mỗi xi được biểu diễn trên trục số tại điểm có tọa độ xi
Ví dụ: Cho bảng số liệu sau, hãy vẽ biểu đồ chấm.

10.8 6.9 8.0 8.8 7.3 3.6 4.1 6.0 4.4 8.3
8.1 8.0 5.9 5.9 7.6 8.9 8.5 8.1 4.2 5.7
4.0 6.7 5.8 9.9 5.6 5.8 9.3 6.2 2.5 4.5
12.8 3.5 10.0 9.1 5.0 8.1 5.3 3.9 4.0 8.0
7.4 7.5 8.4 8.3 2.6 5.1 6.0 7.0 6.5 10.3

3. Biểu đồ tần suất: Giả sử trong dãy số liệu x1, x2, …, xn có k giá trị
phân biệt x1, x2, …, xk
 Giả sử ni (hay f) là số giá trị xi trong dãy số liệu, ta goi ni là tần
số của giá trị xi
𝑛𝑖
 Còn 𝑓𝑖 = là tần suất hay tần số tương đối của xi
𝑛

Người soạn: Phạm Hoàng Dương


 Mỗi cặp (xi ; ni) được biểu diễn bởi 1 hình chữ nhật với cạnh thuộc
trục hoành có chiều dài bằng nhau và xi là trung điểm, cạnh song
song với trục tung có chiều dài bằng fi.

Ví dụ: Cho dãy số liệu sau, hãy vẽ biểu đồ tần suất.

15 13 12 11 12 13 13 19 17 18 17 17
 Bảng phân bố tần số, tần suất:

xi 11 12 13 15 17 18 19
ni 1 2 3 1 3 1 1
fi (%) 8.3 16.7 25 8.3 25 8.3 8.3

 Biểu đồ tần suất:

 Trường hợp số liệu lấy từ đặc trưng liên tục với n lớn, ta chia miền giá trị
của số liệu ra làm k khoảng [a0 – a1), [a1 – a2), …, [ak-1 – ak] và gọi ni là số giá
trị trong dãy số liệu thuộc khoảng thứ I rồi lập bảng sau:
x a0 – a1 a1 – a2 … ak-1 – ak ∑
ni n1 n2 … nk n
fi n1/n n2/n … nk/n

Người soạn: Phạm Hoàng Dương


Ví dụ: Đo chiều cao (cm) của một số học sinh ngẫu nhiên ta được :
Chiều cao 150-152 152-154 154-156 156-158 158-160 ∑
Số học
35 51 69 47 32 234
sinh ni
Tần suất 35/234 51/234 69/234 47/234 32/234
fi 0.15 0.22 0.29 0.2 0.14

Biểu đồ tần suất:

 Lưu ý: nếu độ dài các khoảng x khác nhau thì ta phải sử dụng biểu đồ mật
độ.
Ví dụ: Đo chiều cao (cm) của một số học sinh ngẫu nhiên ta được :

Chiều cao 150-153 153-155 155-158 158-162 ∑


Số học
43 39 45 51 178
sinh ni
Tần suất 43/178 39/178 45/178 51/178
fi 0.24 0.22 0.25 0.29
0.24/3 0.22/2 0.25/3 0.29/4
Mật độ pi
=0.08 =0.11 0.08 0.07

 Biểu đồ mật độ:

Người soạn: Phạm Hoàng Dương


Biểu đồ mật độ được thể hiện bởi các hình chữ nhật có cạnh nằm trên trục
hoành là độ dài của khoảng, cạnh song song với trục tung là pi (%) với diện
tích hình chữ nhật là fi.
III. Các đặc trưng của mẫu
1. Trung bình mẫu
- Ký hiệu : 𝑥̅

x1  x2  ...  xn 1 n 1 k n

-
x   xi   ni xi   f i xi
n n i 1 n i 1 i 1

2. Phương sai mẫu


- Ký hiệu: s2

1 n 1 n n k
- s 
2

n  1 i 1
(x i x ) 
2

n  1 i 1
ni ( x i  x ) 
2

n  1 i 1
fi ( x i  x )2

3. Độ lệch chuẩn mẫu


- Ký hiệu: s
- s = √𝑠 2

Người soạn: Phạm Hoàng Dương


4. Trung vị mẫu (median)
- Là giá trị chính giữa các quan sát được sắp xếp từ nhỏ nhất đến lón nhất.
Khi quan sát được biểu thị bằng x1, x2, …, xn chúng ta sẽ sử dụng biểu tượng
𝑥̅ đại diện cho trung vị mẫu.
- Để tìm trung vị mẫu ta cần sắp xếp các quan sát theo thứ tự từ nhỏ đến
lớn (với bất kì giá trị nào lặp lại trong mẫu).
n 1
 Nếu n là số lẻ thì 𝑥̅ là giá trị chính giữa thứ
2
n
 Nếu n là số chắn thì 𝑥̅ là trung bình của hai giá trị chính giữa và
2
n
1
2

Ví dụ: Cho dãy số: 5 6 7 9 11 20 21.

Trung vị mẫu là: x4  9

Ví dụ: Cho dãy số: 15 14 14 12 19 17 16 16

Dãy số sắp theo thứ tự nhỏ đến lớn: 12 14 14 15 16 16 17 19

x4  x5 15  16
Trung vị mẫu là:   15,5
2 2

5. Tứ phân vị (không quan trọng)


- Nếu trung vị mẫu là số chính giữa dãy số, chia dãy số thành 2 phần bằng
nhau; thì mỗi phần ta lại tiếp tục tìm số chính giữa.

- Ví dụ: Cho dãy số: 1 3 5 8 12 19 20 21 23 26 29 32 33

Từ dãy số trên med = 20, chia dãy số thành 2 phần bằng nhau.

Người soạn: Phạm Hoàng Dương


+ Dãy số bên trái: số chính giữa của dãy là 6,5 được gọi tứ phân vị nhỏ (kí
hiệu Q1)
+ Dãy số bên phải: số chính giữa của dãy là 27,5 được gọi tứ phân vị lớn
(kí hiệu Q3)
Từ dãy số trên, ta tìm được 5 giá trị: min = 1, Q1 = 6.5, Med = 20, Q3 =
27.5, max = 33.

TÌM CÁC ĐẶC TRƯNG CỦA MẪU BẰNG MÁY TÍNH CẦM TAY
Casio 570VN plus / Vinacal 570 ES
Casio 580 VNX
plus 2
SHIFT MODE  4 1 SHIFT MENU  3 1
MODE 3 1 MENU 6 1
Cột X nhập xi , cột FREQ nhập ni Cột X nhập xi , cột n nhập ni
AC AC
Lấy kết quả : Lấy kết quả:
Trung bình mẫu: ̅
𝒙: SHIFT 1 4 2 = OPTN 2
Độ lệch chuẩn mẫu: s: SHIFT 1 4 4 = Trung bình mẫu: 𝒙̅:
Phương sai mẫu: s2 Phương sai mẫu: s2x
Cỡ mẫu: n : SHIFT 1 4 1 = Độ lệch chuẩn mẫu: sx
Trung vị mẫu : SHIFT 1 6 4 = (trên Cỡ mẫu: n
máy Vinacal) Trung vị mẫu: Med

Chú ý: Trung vị mẫu không thể tìm trực tiếp trên máy Casio 570 ES plus / 570 VN
plus

Người soạn: Phạm Hoàng Dương


BÀI TẬP
Bài 1: Cho bộ số liệu:
29.5 49.3 30.6 28.2 28 26.3 33.9 29.4 23.5 31.6

Tính cỡ mẫu, phương sai mẫu, độ lệch chuẩn mẫu, số trung vị?

Bài 2: Cân ngẫu nhiên một số sản phẩm của công ty A và thu được bảng số liệu:
Khối
lượng 97-98 98-99 99-100 100-101 101-102 102-103 103-104
(g) (xi)
Số sản
phẩm 24 34 36 42 31 27 20
(ni)

Tính trung bình mẫu, phương sai mẫu, độ lệch chuẩn mẫu, tần suất gói đóng ra có
trọng lượng từ 98g đến 103g ?
(Hướng dẫn: Nếu hàng xi được cho dưới dạng khoảng thì ta nhập vào ô trên máy
tính giá trị trung bình của khoảng đó)

TÀI LIỆU CHỈ MANG TÍNH


CHẤT THAM KHẢO!

Người soạn: Phạm Hoàng Dương

You might also like