Professional Documents
Culture Documents
Slide Chuong 3B
Slide Chuong 3B
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Chương 3, Phần B Thống kê mô tả: Các đại
lượng số
Các đại lượng đo lường hình dáng phân phối, vị trí
tương đối, và phát hiện các giá trị bất thường
Phân tích dữ liệu thăm dò
Các đại lượng đo lường mối liên hệ giữa hai biến
Trung bình có trọng số và làm việc với dữ liệu đả
được phân nhóm
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Các đại lượng đo lường hình dáng phân phối, vị trí tương
đối, phát hiện các giá trị bất thường
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hình dáng phân phối: Hệ số bất đối xứng (Skewness)
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hình dáng phân phối: Hệ số bất đối xứng
(Skewness)
Đối xứng (không lệch)
Skewness = 0.
Trung bình và trung vị bằng nhau
0,3
Skewness = 0
5
0,3
0
0,2
5
0,2
0
0,1
5
0,1
00,0
50
T
ầ
n
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
s
Hình dáng phân phối: Hệ số bất đối xứng
(Skewness)
Lệch trái vừa phải
Skewness là số âm.
Trung bình thương nhỏ hơn trung vị.
0,3
Skewness = − 0,31
5
0,3
0
0,2
5
0,2
0
0,1
5
0,1
00,0
50
T
ầ
n
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
s
Hình dáng phân phối: Hệ số bất đối xứng
(Skewness)
Lệch phải vửa phải
Skewness là số dương
Trung bình thường lớn hơn trung vị.
0,3
Skewness = 0,31
5
0,3
0
0,2
5
0,2
0
0,1
5
0,1
00,0
50
T
ầ
n
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
s
Hình dáng phân phối: Hệ số bất đối xứng
(Skewness)
Lệch phải nhiều
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hình dáng phân phối: Hệ số bất đối xứng
(Skewness)
Ví dụ: Apartment Rents
xi − x
zi =
s
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Giá trị chuẩn hóa z
Giá trị z của một quan sát đo lường vị trí tương đối
của quan sát trong một tập dữ liệu..
Một giá trị dữ liệu nhỏ hơn trung bình mẫu sẽ có
giá trị z nhỏ hơn 0.
Một giá trị dữ liệu lớn hơn trung bình mẫu sẽ có
giá trị z lớn hơn 0.
Một giá trị dữ liệu bằng với trung bình mẫu sẽ có
giá trị z bằng 0.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Giá trị chuẩn hóa z
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Quy tắc Chebyshev
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Quy tắc Chebyshev
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Quy tắc Chebyshev
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Quy tắc Thực nghiệm
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Quy tắc Thực nghiệm
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Quy tắc Thực nghiệm
99,72
%
95,44
%
68,26
%
x
μ
μ– μ– μ+ μ+
3σ μ– 1σ 1σ μ+ 3σ
2σ 2σ
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phát hiện các giá trị bất thường
Giá trị bất thường là giá trị nhỏ bất thường hoặc lớn
bất thường trong tập dữ liệu.
Một giá trị dữ liệu có giá trị z nhỏ hơn -3 hoặc lớn
+3 có thể được xem là giá trị bất thường.
Nó có thể là:
Được ghi chép không chính xác
Một giá trị dữ liệu không nằm trong tập dữ liệu.
Một giá trị dữ liệu bất thường đã được ghi lại
một cách chính xác và thuộc trong tập dữ liệu.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phát hiện giá trị bất thường
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích dữ liệu thăm dò
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bộ tóm tắt 5 số
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bộ tóm tắt 5 số
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ hộp
Biểu đô hộp cũng là một cách để phất hiện giá trị bất
thường
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ hộp
40 42 45 47 50 52 55 57 60 62
0 5 0 5 0 5 0 5 0 5
Q1 = Q3 =
445 Q2 = 525
© 2011 Cengage Learning. All Rights475Reserved. May not be scanned, copied Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ hộp
Tiếp
tục
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ hộp
Không có giá trị bất thường (giá trị nhỏ hơn 325
hoặc lớn hơn 645) trong dữ liệu giá thuê căn hộ.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ hộp
40 42 45 47 50 52 55 57 60 62
0 5 0 5 0 5 0 5 0 5
Giá trị nhỏ nhất Giá trị lớn nhất
trong trong
giớLearning.
© 2011 Cengage i hạn=All425 gicopied
Rights Reserved. May not be scanned, ới hạn = Slide
615
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ hộp
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hiệp phương sai
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hiệp phương sai
∑ ( xi − x )( yi − y ) Mẫ
sxy =
n −1 u
∑ ( xi − µ x )( yi − µ y ) Tổng
σ xy =
N thể
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hệ số tương quan
Chỉ cho biết là hai biến có tương quan chặt chẽ hay
không, chứ không có nghĩa một biến là nguyên nhân
của biến còn lại.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hệ số tương quan
Mẫ Tổng
u thể
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hệ số tương quan
Giá trị gần -1 cho biết tương quan tuyến tính nghịch
chặc chẽ
Giá trị gần +1 cho biết tương quan tuyến tính thuận
chặc chẽ.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Hiệp phương sai va hệ số tương quan
x y ( xi − x ) ( y i − y ) ( xi − x )( yi − y )
277 6 10,6 - -
,6 9 5 1, 10,6
259 7 - 0 5
,5 1 7,45 1, -
269 7 0 7,45
,1 0 2,15
Trung 267,
267 70,
7 0 Tota 0-
Độbình
lệch 0
8,219
,0 00
0,894 0,05 l 35,40
chuẩn 2
255 47 - 0 0
,6 1 11,3 1,
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
or duplicated, or posted to a publicly accessible website, in whole or in part.
- Slide
Hiệp phương sai và hệ số tương quan
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Trung bình có trọng số vàLàm việc với dữ liệu đã được
phân nhóm
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Trung bình trọng số
Khi giá trị trung bình được tính bằng cách mỗi giá
trị dữ liệu được gán trọng số phản ánh mức độ quan
trọng của nó, gọi là trung bình trọng số.
Trong việc tính điểm trung bình (GPA), trọng số là
số tín chỉ của mỗi môn học.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Trung bình trọng số
∑ wx i i
x=
∑w i
Với:
xi = giá trị của quan sát i
wi = trọng số của quan sát i
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Dữ liệu đã được phân nhóm
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Trung bình cho dữ liệu phân nhóm
Dữ liệu mẫu
∑ fM i i
x=
n
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Trung bình cho dữ liệu phân nhóm
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phương sai của dữ liệu phân nhóm
Dữ liệu mẫu
2 ∑ f i ( Mi − x ) 2
s =
n −1
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phương sai của dữ liệu phân nhóm
Độ lệch mẫu
s = 3.017,89 = 54,94
Giá trị xấp xỉ này chênh lệch chỉ 0,20USD so
với độ lệch chuẩn thật sự 54,74USD.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.
Kết thúc Chương 3, Phần B
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied
Slide
or duplicated, or posted to a publicly accessible website, in whole or in part.