Download as pdf or txt
Download as pdf or txt
You are on page 1of 23

Chapter 2 2-1

Chương 2

Mô tả số liệu bằng hình

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-1

Mục tiêu chương


Sau khi hoàn thành chương này, bạn có thể:
 Xác định các loại dữ liệu và các thước đo lường
 Tạo và giải thích các biểu đồ để mô tả các biến phân loại:
 phân phối tần số, biểu đồ cột, biểu đồ bánh (Pie chart), biểu đồ
Pareto
 Tạo biểu đồ để mô tả dữ liệu chuỗi thời gian
 Tạo và giải thích các biểu đồ để mô tả các biến số:
 phân phối tần số, histogram, ogive, biểu đồ thân và là (stem-and-
leaf graph)
 Xây dựng và giải thích các biểu đồ để mô tả mối quan hệ giữa các
biến:
 Biểu đồ phân tán (Scatter plot), bảng chéo (cross table)

 Mô tả những cách thích hợp và không phù hợp để hiển thị dữ liệu
bằng đồ họa
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-2

Phân loại biến số


 Một biến số là một đặc tính cụ thể của một cá
nhân hoặc đối tượng.
 Biến số về tuổi, cân nặng, điểm số, .v.v ... của sinh
viên Khoa Kinh tế
 Biến số doanh số, lợi nhuận, tuổi, v.v ... của các
công ty trên Sở giao dịch chứng khoán TP.HCM, …
 Phân loại theo loại và lượng thông tin
 Biến phân loại
 Biến số lượng
 Phân loại theo cấp độ đo lường:
 Biến định lượng và định tính.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-3

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-2

Phân loại biến số


 Các biến phân loại cung cấp thông tin về các
nhóm hoặc danh mục.
 Xếp loại của sinh viên,
 Giới tính, tình trạng hôn nhân của cá nhân,
 Các lựa chọn như: “rất không đồng ý” đến “rất đồng
ý”, …
 Biến số liệu bao gồm biến rời rạc và biến liên
tục
 Các biến rời rạc thường phát sinh từ một quá trình
đếm số, chẳng hạn như: số lượng sinh viên đăng ký
học phần, số lượt đi siêu thị của một khách hàng,
v.v.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-4

Phân loại biến số

 Các biến liên tục có thể nhận bất kỳ giá trị nào trong
một khoảng giá trị cho trước và thường phát sinh từ
quá trình đo lường,
 Ví dụ: cân nặng, chiều cao của một cá nhân; doanh số,
lợi nhuận của một hãng; thời gian (giờ) dành cho việc
học của một sinh viên.
 Các biến định tính bao gồm các mức đo lường
danh nghĩa và thứ tự
 Không có ý nghĩa về mặt đo lường đối với “chênh lệch”
giữa các con số, như: số áo của một cầu thủ bóng đá,
 Thường phát sinh từ câu trả lời cho các câu hỏi phân

loại
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-5

Biến định tính


 Biến danh nghĩa: Các giá trị mô tả các nhóm
phân loại hoặc các nhóm phản hồi.
 VD: 0 = nữ; 1 = nam
 VD: 0 = không; 1 = có
 VD: 1 = độc thân; 2 = có vợ/chồng; 3 = ly hôn; 4 = …
 Các biến thứ tự chỉ thứ tự xếp hạng của các mục,
các giá trị mô tả các phản hồi
 VD: đánh giá chất lượng sản phẩm: 1 = kém; 2 = trung
bình; 3 = tốt
 VD: hài lòng với sản phảm: 1= rất không hài lòng; 2 =
vừa phải; 3 = không ý kiến; 4 = …
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-6

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-3

Biến định lượng

 Bao gồm: thước đo khoảng và tỷ lệ,


 Dữ liệu thu được từ biến số,
 Khoảng chênh lệch giữa các thước đo có ý nghĩa.
 Thang đo khoảng cho biết thứ hạng và khoảng
cách từ số 0 tùy ý được đo bằng các khoảng
đơn vị
 Dữ liệu được cung cấp liên quan đến điểm gốc tùy
ý
 VD: nhiệt độ 400C không phải nóng gấp đôi nhiệt độ
20 độ;

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-7

Biến định lượng

 Biến tỷ lệ biểu thị cả thứ hạng và khoảng cách


từ số 0 tự nhiên, với tỷ lệ của hai số đo có ý
nghĩa.
 VD: Bình nặng 80 kg, gấp đôi cân nặng của An là 40
kg.

 “giá trị bị thiếu”: Đáp viên không trả lời một số


câu hỏi nhạy cảm.
 Các giá trị bị thiếu cần được mã hóa đặc biệt trong
số liệu.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-8

Các loại số liệu

Data

Categorical Numerical

Ví dụ:
 Tình trạng hôn nhân
 Bạn có đăng ký HP Discrete Continuous
không?
 Màu tóc Ví dụ: Ví dụ:
(Defined categories or  Số con  Cân nặng
groups)  Số sản phẩm sản  Chiều cao
xuất (Measured characteristics)
(Counted items)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-9

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-4

Các thước đo lường


Có chênh lệch giữa
các thước đo, có số Số liệu tỷ lệ
0 thực sự
Số liệu định lượng

Có chênh lệch giữa


các thước đo nhưng Số liệu khoảng
không có số 0 thực
sự

Phân nhóm theo thứ tự


(xếp hạng, xếp thứ tự, Số liệu thứ tự
hay xếp loại)
Số liệu định tính

Phân nhóm (không có


thứ tự hay hướng) Số liệu danh nghĩa
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-10

Trình bày đồ họa của dữ liệu

 Dữ liệu ở dạng thô thường không dễ sử dụng


để ra quyết định
 Một số loại hình phổ biến
 Bảng

 Đồ thị

 Loại biểu đồ sẽ sử dụng tùy thuộc vào biến


được mô tả

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-11

Trình bày đồ họa của dữ liệu


(continued)
 Kỹ thuật được xem xét trong chương này:

Biến Biến
phân loại số lượng

• Phân phối tần số • Biểu đồ đường (Line


• Bar chart chart)
• Pie chart • Phân phối tần số
• Pareto diagram • Histogram và ogive
• Stem-and-leaf display
• Scatter plot

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-12

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-5

Bảng và Đồ thị đối với


Biến phân loại
Số liệu
phân loại

Trình bày bảng Trình bày đồ thị

Bảng phân
phối tần số Bar Pie Pareto
Chart Chart Diagram

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-13

Bảng phân phối tần số

 Cấu trúc của bảng phân phối tần số:


 Dòng đầu tiên là tiêu đề,
 Cột bên trái (được gọi là tầng lớp hoặc
nhóm) liệt kê tất cả các nhóm có thể,
 Cột bên phải là danh sách các tần số hoặc số
lượng quan sát cho mỗi nhóm,
 Tùy chọn: cột bên phải là phân phối tần số
tương đối thu được bằng cách chia mỗi tần
số cho tổng số quan sát, sau đó, nhân với
100%.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-14

Bảng phân phối tần số


Tóm tắt dữ liệu theo danh mục
VD: Phân loại học sinh theo xếp loại
Xếp loại Số SV Tỷ trọng
(%)
Xuất xắc 10 5.0
Giỏi 25 12.5
Khá 50 25.0
Trung bình 75 37.5
Yếu 40 20.0
(biến số chỉ Tần số
các nhóm Tổng cộng 200 100.0 tương đối
phân loại)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-15

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-6

Biểu đồ cột và biểu đồ bánh

 Biểu đồ cột và biểu đồ bánh thường được


dùng đối với biến phân loại (định tính).

 Chiều cao của mỗi cột hoặc kích thước


của mỗi miếng bánh cho thấy tần số hoặc
tỷ lệ phần trăm cho mỗi loại.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-16

VD về biểu đồ cột
Xếp loại Số SV

Xuất xắc 10
Giỏi 25
80 75
Khá 50
70

Trung bình 75
No of students

60
50
Yếu 40 50
40
40

30 25

20
10
10

0
High Distinction Good Fair Fail
distinction

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-17

VD về biểu đồ bánh

Xếp loại Số SV Tỷ lệ (%)


Xuất sắc 10 5,0 % of students by grade
Giỏi 25 12,5 High
Khá 50 25,0 Fail
distinction
5%
Trung bình 75 37,5 20% Distinction
Yếu 40 20,0 12%

Good
25%

(Percentages
are rounded to Fair
the nearest 38%
percent)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-18

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-7

Biểu đồ Pareto

 Được sử dụng để miêu tả dữ liệu phân loại


 Biểu đồ cột, trong đó các nhóm được hiển thị
theo thứ tự tần số giảm dần
 Một đường với các tần số tích lũy được hiển thị
trong cùng một biểu đồ
 Được sử dụng để phân tách nhóm “quan trọng”
khỏi nhóm “kém quan trọng”

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-19

VD về biểu đồ Pareto
VD: 400 sản phẩm bị lỗi được kiểm tra để tìm
nguyên nhân của lỗi

Các nguyên nhân lỗi sản xuất Số sản phẩm lỗi


Mối hàn xấu 34
Sắp xếp kém 223
Thiếu thành phần 25
Lỗi sơn 78
Ngắt điện 19
Hộp chứa bị nứt 21
Tổng cộng 400

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-20

VD về biểu đồ Pareto
(continued)

Bước 1: Sắp xếp thứ tự theo nguyên nhân lỗi, thứ tự giảm dần
Bước 2: Xác định % của mỗi nhóm
Các nguyên nhân lỗi
sản xuất Số sản phẩm lỗi % trong tổng số
Sắp xếp kém 223 55,75
Lỗi sơn 78 19,50
Mối hàn xấu 34 8,50
Thiếu thành phần 25 6,25
Hộp chứa bị nứt 21 5,25
Ngắt điện 19 4,75
Total 400 100,00

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-21

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-8

VD về biểu đồ Pareto
(continued)
Bước 3: trình bày kết quả bằng đồ thị
Pareto Diagram: Cause of Manufacturing Defect
60% 100%
% lỗi của mỗi loại (biểu đồ cột)

90%

50%
80%

% tích lũy (biểu đồ


70%
40%

60%

đường)
30% 50%

40%

20%
30%

20%
10%

10%

0% 0%
Poor Alignment Paint Flaw Bad Weld Missing Part Cracked case Electrical Short

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-22

Bảng chéo (crosstab hay


contingency table)

 Được dùng để mô tả mối quan hệ giữa hai biến


phân loại hoặc biến thứ tự.

 Bảng liệt kê số lượng quan sát cho mọi kết hợp


giá trị của hai biến.

 Một bảng chéo với r dòng và c cột là bảng chéo


rxc

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-23

Bảng chéo

Grade of students by gender


Bảng 2.1 Xếp loại SV theo giới tính 80

70
Number of students

60
Tổng 35
Xếp loại Nam Nữ 50
cộng
40
27
XS 5 5 10 30 Female, 16

20 40
Giỏi 11 14 25 14
Male, 24
10 23
Khá 23 27 50 5
5
11
0
TB 40 35 75 High Distinction Good Fair Fail
distinction
Yếu 24 16 40

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-24

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-9

Bảng chéo

Xếp loại SV theo giới tính


Bảng 2.1 Xếp loại SV theo giới tính
120

Tổng
Số SV

Xếp loại Nam Nữ 100


cộng Fail, 24 Fail, 16

XS 5 5 10 80

Giỏi 11 14 25 60 Fair, 40
Fair, 35

Khá 23 27 50
TB 40 35 75 40
Yếu 24 16 40 Good, 23
Good, 27

20

Distinction, 11 Distinction, 14
High High
0 distinction, 5 distinction, 5
Male Female

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-25

Bảng chéo

Bảng 2.1 Xếp loại SV theo giới tính 45


Fair, 40
40
Fair, 35
Tổng 35
Xếp loại Nam Nữ
cộng 30
Good, 27
25 Good, 23 Fail, 24
XS 5 5 10
20
Fail, 16
Giỏi 11 14 25 15 Distinction, 14
Distinction, 11
Khá 23 27 50 10 High distinction, High distinction,
TB 40 35 75 5 5
5
Yếu 24 16 40
0
Male Female

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-26

Đồ thị số liệu chuỗi thời gian

 Chuỗi thời gian là một tập hợp các giá trị của
một biến số định lượng được sắp xếp theo thời
gian.
 Trình tự của các quan sát đại diện cho trình tự chuỗi
thời gian.
 Một biểu đồ đường (time-series plot) được
dùng để biểu diễn giá trị của biến theo thời gian
 Thời gian được đo lường trên trục hoành
 Biến quan tâm được đo lường trên trục tung

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-27

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-10

VD về biểu đồ đường của chuỗi

Magazine Subscriptions by Year

350

300
Thousands of subscribers

250

200

150

100

50

0
1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-28

VD về biểu đồ đường của chuỗi


GDP (2010
Year billion US$)
1984 22.47 GDP của Việt Nam qua các năm (tỷ US$
1985 23.32 theo giá năm 2010)
1986 23.97
180.00
1987 24.83
1988 26.11 160.00
1989 28.03
1990 29.46 140.00
1991 31.21
1992 33.91 120.00
1993 36.65
... ... 100.00
... ...
2005 85.35 80.00
2006 91.31
2007 97.82 60.00
2008 103.36
40.00
2009 108.93
2010 115.93
20.00
2011 123.17
2012 129.63
0.00
2013 136.66
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
Year

2014 144.83
2015 154.51
2016 164.10

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-29

Đồ thị biểu diễn các biến số


định lượng
Biến định lượng

Phân phối tần số và Biểu đồ


phân phối tích lũy Stem-and-Leaf

Histogram Ogive

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-30

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-11

Phân phối tần số

Phân phối tần số là gì?


 Phân phối tần số là một danh sách hoặc bảng

 chứa các nhóm tập hợp (các nhóm phân loại hay
khoảng giá trị mà số liệu nằm trong đó) ...
 và các tần số tương ứng

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-31

Tại sao dùng phân phối tần số?

 Phân phối tần số là một cách để tóm tắt


dữ liệu
 Phân phối tập hợp lại các số liệu thô thành
hình thức hữu dụng hơn ...
 và cho phép giải thích nhanh chóng dữ
liệu bằng hình

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-32

Khoảng giá trị của nhóm


và ranh giới nhóm

 Dùng tối thiểu 5 nhưng không quá 15-20


khoảng
 Các khoảng không được chồng lên nhau
 Làm tròn chiều rộng khoảng để có được điểm
cuối của khoảng mong muốn
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-33

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-12

VD về phân phối tần số

Một nhà sản xuất vật liệu cách nhiệt chọn ngẫu
nhiên 20 ngày mùa đông và ghi lại nhiệt độ cao
hàng ngày

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-34

VD về phân phối tần số


(continued)

 Sắp xếp dữ liệu thô theo thứ tự tăng dần:


12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

 Tính khoảng dao động: 58 - 12 = 46


 Chọn số nhóm: 5 (thông thường từ 5 đến 15)
 Tính chiều rộng các khoảng: 10 (46/5, sau đó làm tròn số
lên)

 Xác định ranh giới khoảng: 10 đến dưới 20, 20 đến dưới 30, .
. . , 60 đến dưới 70

 Đếm số quan sát và gán cho mỗi nhóm

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-35

VD về phân phối tần số


(continued)
Số liệu được sắp xếp theo thứ tự:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Khoảng Tần số Tần suất Tỷ lệ (%)

10 đến dưới 20 3 0,15 15


20 đến dưới 30 6 0,30 30
30 đến dưới 40 5 0,25 25
40 đến dưới 50 4 0,20 20
50 đến dưới 60 2 0,10 10
Tổng cộng 20 1,00 100
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-36

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-13

Histogram

 Biểu đồ về phân phối tần số của số liệu được


gọi là histogram
 Các điểm cuối của khoảng được hiển thị trên
trục hoành
 Trục tung là tần số, tần số tương đối (tần
suất) hoặc tỷ lệ phần trăm
 Các cột với chiều cao tương ứng được dùng
để biểu diễn số quan sát của mỗi nhóm.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-37

VD Histogram

Các khoảng Tần số


Histogram: Nhiệt độ hàng ngày
10 đến dưới 20 3
20 đến dưới 30 6 7 6
30 đến dưới 40 5
40 đến dưới 50 4
6 5
50 đến dưới 60 2 5
Tần số

4
4 3
3 2
2
1 0 0
(Không có 0
khoảng cách 0 0 10 10 2020 30 30 40 40 5050 60 60 70
giữa các cột) Nhiệt độ
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-38

Vẽ Histograms trong Excel

1
Select
Tools/Data Analysis

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-39

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-14

Histograms in Excel
(continued)

2
Choose Histogram

(
Input data range and bin
range (bin range is a cell
range containing the upper
3 interval endpoints for each class
grouping)

Select Chart Output


and click “OK”
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-40

Các câu hỏi trong phân nhóm dữ


liệu thành các khoảng

 1. Mỗi khoảng rộng bao nhiêu?


(nên dùng bao nhiêu nhóm?)

 2. Điểm cuối của các khoảng được xác định


như thế nào? “truih”
 Thường được trả lời bằng quá trình “thử và
sai”, tùy thuộc vào đánh giá của người dùng
 Mục tiêu là tạo ra một bản phân phối không
quá “lởm chởm" (jagged) cũng không quá “khối
lớn” (jagged)
 Mục tiêu là hiển thị một cách thích hợp mẫu
biến đổi trong dữ liệu
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-41

Có bao nhiêu nhóm?

 Quá nhiều (các khoảng nhóm hẹp) 3.5


3
 có thể tạo ra một phân phối rất lởm 2.5
F req uency

chởm với những khoảng trống từ các 2


1.5
lớp trống 1
0.5
 Có thể biểu diễn kém về việc tần số 0
4
8

M ore
12
16
20
24
28
32
36
40
44
48
52
56
60

khác nhau giữa các lớp như thế nào


Temperature

12

 Quá ít (Khoảng cách giữa các nhóm 10

8
Frequency

rộng) 6

 có thể nén sự biến động quá mức và 2

tạo ra một phân phối khối 0


0 30 60 More

 có thể che khuất mô hình biến động Temperature


(X axis labels are upper class endpoints)
quan trọng.
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-42

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-15

Phân phối tần số tích lũy


Số liệu được xếp theo thứ tự:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Tần suất Tần số tích % tích lũy


Nhóm Tần số
(%) lũy

10 đến dưới 20 3 15 3 15
20 đến dưới 30 6 30 9 45
30 đến dưới 40 5 25 14 70
40 đến dưới 50 4 20 18 90
50 đến dưới 60 2 10 20 100
Tổng cộng 20 100

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-43

Biểu đồ Ogive
Đồ thị tần số tích lũy
Upper
interval Cumulative
Interval endpoint Percentage
Less than 10 10 0
10 but less than 20 20 15
20 but less than 30 30 45 Ogive: Daily High Temperature
30 but less than 40 40 70
40 but less than 50 50 90 100
C u m u lative Percentage

50 but less than 60 60 100


80
60

40
20

0
10 20 30 40 50 60
Interval endpoints
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-44

Hình dạng phân phối


 Hình dạng của phân phối được gọi là đối
xứng nếu số quan sát được cân bằng, hoặc
phân bố đều, xung quanh giá trị trung tâm.
Symmetric Distribution

10
9
8
7
Frequency

6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-45

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-16

Hình dạng phân phối


(continued)
 Hình dạng của phân bố được cho là bị lệch
nếu các quan sát không được phân bố đối
xứng xung quanh tâm.
Positively Skewed Distribution

Phân phối lệch dương (lệch sang 12

phải) có đuôi kéo dài sang phải theo


10

8
Frequency

hướng của các giá trị dương. 6

0
1 2 3 4 5 6 7 8 9

Phân phối lệch âm (lệch sang trái) có


Negatively Skewed Distribution
đuôi kéo dài sang trái theo hướng 12
của các giá trị âm. 10

8
Frequency

0
1 2 3 4 5 6 7 8 9

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-46

Phân phối lệch phải

 Phân phối thu nhập Phân phối thu nhập của hộ


gia đình
của các hộ gia đình 50

thường bị lệch-phải 45

40

 Một tỷ lệ lớn dân số 35

có thu nhập tương 30


Frequency

25
đối khiêm tốn 20

 Tỷ lệ rất nhỏ có thu 15

nhập cao 10

0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
22000
24000
26000
28000
30000
32000
34000
36000
38000
40000
More

Bin

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-47

Phân phối lệch trái

 Phân phối điểm Distribution of test score


kiểm tra thường bị 20

lệch sang trái


18

16

 Một tỷ lệ tổng thể 14

tương đối lớn có số 12


Frequency

10
điểm khiêm tốn 8

 Tỷ lệ nhỏ có điểm 6

thấp 4

Bin

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-48

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-17

Đồ thị Stem-and-Leaf

 Một cách đơn giản để xem chi tiết phân phối


trong tập dữ liệu

PHƯƠNG PHÁP: Phân tách chuỗi dữ liệu


được sắp xếp thành các chữ số hàng đầu
(thân - stem) và các chữ số ở cuối (lá - leaf)
 Các lá được hiển thị riêng lẻ theo thứ tự tăng dần
sau mỗi thân cây.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-49

Ví dụ
Dữ liệu được sắp xếp:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

 Ở đây, dùng chữ số hàng chục để biểu diễn


đơn vị của thân: Stem Leaf
 21 được trình bày 2 1
 38 được trình bày 3 8

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-50

Ví dụng
(continued)
Dữ liệu được sắp xếp:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

 Đồ thị stem-and-leaf hoàn chỉnh:


Stem Leaves
2 1 4 4 6 7 7
3 0 2 8
4 1

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-51

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-18

Dùng đơn vị của thân khác


 Sử dụng đơn vị hàng trăm cho thân:
 Làm tròn số hàng chục để tạo ra là

Stem Leaf
 613 trở thành 6 1
 776 trở thành 7 8
 ...
 1224 trở thành 12 2

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-52

Using other stem units


(continued)

 Sử dụng đơn vị hàng trăm cho thân:


 Đồ thị stem-and-leaf hoàn chỉnh:

Số liệu:
Stem Leaves
613, 632, 658, 717, 6 136
722, 750, 776, 827, 7 2258
841, 859, 863, 891, 8 346699
894, 906, 928, 933,
9 13368
955, 982, 1034,
1047,1056, 1140, 10 356
1169, 1224 11 47
12 2
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-53

Mối quan hệ giữa các biến

 Đồ thị minh họa cho đến nay chỉ liên quan đến
một biến duy nhất
 Khi hai biến cùng tồn tại, các kỹ thuật khác sẽ
được sử dụng:

Biến phân loại Biến số lượng


(Định tính) (Định lượng)

Bảng chéo Biểu đồ phân tán


(Scatter plots)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-54

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-19

Biểu đồ phân tán

 Biểu đồ phân tán được sử dụng cho


các cặp quan sát có được từ hai biến
số lượng
 Một biến (biến phụ thuộc), ở mức độ nào đó,
phụ thuộc vào biến kia (biến độc lập)
 Biểu đồ phân tán:
 một biến được đo lường trên trục tung

và biến còn lại được đo lường trên trục


hoành

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-55

VD về Biểu đồ phân tán

Volume Cost per Cost per Day vs. Production Volume


per day day
23 125 250
26 140 200
C o s t p er D ay

29 146
150
33 160
38 167 100
42 170 50
50 188
0
55 195
0 10 20 30 40 50 60 70
60 200
Volume per Day

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-56

Scatter Diagrams in Excel

1
Select the chart wizard

2
Select XY(Scatter) option,
then click “Next”

3
When prompted, enter the
data range, desired
legend, and desired
destination to complete
the scatter diagram
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-57

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-20

Biểu đồ thu nhập và chi tiêu của 200 hộ


gia đình

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-58

Bảng chéo

 Bảng chéo liệt kê số lượng quan sát cho mọi


kết hợp giá trị của hai biến phân loại hoặc thứ
tự

 Nếu có r nhóm cho biến thứ nhất (dòng) và c


nhóm cho biến thứ hai (cột), bảng chéo được
gọi là bảng r x c ô.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-59

VD về Bảng chéo

 Bảng chéo 4 x 3 cho những lựa chọn đầu tư của nhà


đầu tư (tính bằng $1000)
Các nhóm Nhà đầu tư A Nhà đầu tư B Nhà đầu tư C Tổng
đầu tư cộng
Cổ phiếu 46,5 55 27,5 129
Trái phiếu 32,0 44 19,0 95
CD 15,5 20 13,5 49
Tiết kiệm 16,0 28 7,0 51
Tổng cộng 110,0 147 67,0 324

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-60

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-21

Vẽ đồ thị dữ liệu phân loại đa


chiều
(continued)

 Biểu đồ cột giáp lượng


C omparin g In vesto rs

S avings

CD

B onds

S toc k s

0 10 20 30 40 50 60

Inves tor A Investor B Inves tor C

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-61

VD về biểu đồ cột giáp lưng


 Sales by quarter for three sales territories:
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
East 20.4 27.4 59 20.4
W est 30.6 38.6 34.6 31.6
North 45.9 46.9 45 43.9

60

50

40
East
30 West
North
20

10

0
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-62

Các lỗi trong trình bày dữ liệu

Mục tiêu trình bày dữ liệu hiệu quả :


 Trình bày dữ liệu để hiển thị thông tin cần thiết
 Truyền đạt những ý tưởng phức tạp một cách
rõ ràng và chính xác
 Tránh sự biến dạng có thể truyền tải thông điệp
sai

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-63

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-22

Các lỗi trong trình bày dữ liệu


(continued)

 Độ rộng các khoảng trong biểu đồ


histogram không bằng nhau
 Nén hoặc làm biến dạng trục dọc
 Cung cấp không có điểm 0 trên
trục tung
 Không cung cấp cơ sở tương đối
trong việc so sánh dữ liệu giữa
các nhóm

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-64

Tóm tắt chương


 Ôn lại các loại dữ liệu và các mức độ đo lường
 Dữ liệu thô thường không dễ sử dụng để ra quyết định –
Cần tổ chức lại:
 Bảng  Biểu đồ

 Những kỹ thuật được dùng:


 Frequency distribution  Line chart
 Bar chart  Frequency distribution
 Pie chart  Histogram and ogive
 Stem-and-leaf display
 Pareto diagram
 Scatter plot
 Cross tables and
side-by-side bar charts
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-65

Các từ khóa
 Categorical variable: biến số phân nhóm
 Numerical variable: biến số số lượng
 Qualitative variable: biến định tính
 Quantitative variable: biến định lượng
 Discrete variable: biến rời rạc
 Continuous variable: biến liên tục
 Nominal variable: biến định danh
 Ordinal variable: biến thứ tự
 Interval scale of measurement: đo lường phân
khoảng
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-66

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.
Chapter 2 2-23

Các từ khóa
 Ratio scale of measurement: thang đo tỷ lệ
 Frequency distribution: phân phối tần số
 Relative frequency: tần số tương đối (%)
 Bar chart: biểu đồ cột
 Pie chart: biểu đồ bánh
 Pareto diagram: đồ thị Pareto, biểu diễn tần
suất tích lũy của các nhóm phân loại
 Histogram: biểu đồ phân phối tần số
 Ogive: biểu đồ tần số tích lũy

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-67

Các từ khóa
 Stem and leaf chart: biểu đồ thân và lá
 Cross table (crosstab): bảng chéo, bảng 2 chiều
 Skewness: độ lệch
 Symmetric distribution: phân phối đối xứng
 Asymmetric distribution: phân phối lệch
 Scatter plot: biểu đồ phân tán

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-68

Statistics for Business and Economics, 6/e © 2007 Pearson Education, Inc.

You might also like