Professional Documents
Culture Documents
Chuong 2 Trinh Bay Bang Va Do Thi
Chuong 2 Trinh Bay Bang Va Do Thi
THÔNG KÊ MÔ TẢ:
TRÌNH BÀY BẰNG BẢNG VÀ ĐỒ THỊ
2.1 Tóm tắt dữ liệu định tính hay còn gọi là dữ
liệu phân loại (Summarizing Qualitative Data)
Coke Sprite Diet vfersh Coke Pepsi Pepsi Pepsi Coke Pepsi
classic Coke classic classic
Diet Coke Coke Sprite Diet Coke Diet Coke Coke Coke
Coke classic classic Coke classic Coke Classi classic Classi
c c
Sprite Diet Coke Coke Coke Pepsi Coke Vfresh Diet Diet
Coke classic classic classic classic Coke coke
vfersh vfersh Coke Diet Pepsi Diet Coke Sprise Peps Coke
classic Coke coke Classi classic
c
Thực hiện đếm
Tên nước Số sinh viên Tần số
ngọt (số sinh viên)
Sprite ǀǀǀǀǀǀ 6
Pepsi ǀǀǀǀǀǀǀǀǀǀ 10
Vfresh ǀǀǀǀǀ 5
Tổng 50
Enter, cho ra 20, sau đó
Copy cho tới C6
Hình 2.1: Biểu đồ hình thanh biểu hiện các loại nước ngọt sinh viên dùng
Pareto Diagram
12 14 19 18 15 15 18 17 20 27
22 23 22 21 33 28 14 18 16 13
Giới hạn dưới là giá trị nhỏ nhất được gắn cho
nhóm
Giới hạn trên là giá trị lớn nhất được gắn cho
nhóm.
Các giá trị thích hợp cho giới hạn nhóm
phụ thuộc vào độ chính xác của dữ liệu.
Bảng 2.4 Phân phối tần số
cho dữ liệu thời gian giải trí
Tác giả
chọn 10 giờ là giới
Thời gian giải Frequency
trí, giờ/tuần
hạn dưới và 14 giờ
10 – 14 4
là giới hạn trên cho
15 – 19 8 nhóm đầu tiên; 15
20 – 24 5 giờ là giới hạn
25 – 29 2 dưới và 19 giờ là
30 – 34 1 giới hạn trên cho
Tổng 20 nhóm cho nhóm
Hai giới hạn dưới đầu tiên của tiếp theo; cứ thế
nhóm là 10 và 15, độ rộng nhóm
là 15 – 10 = 5
tiếp tục.
Chú ý
Không có một phân phối tần số tốt
nhất cho một tập dữ liệu. Những người khác
nhau có thể xây dựng phân phối tần số khác
nhau, nhưng đều chấp nhận được. Mục đích
là để thể hiện các nhóm tự nhiên và thấy
được sự thay đổi của dữ liệu.
Trị số giữa của nhóm: Trị số giữa của nhóm
bằng (Giới hạn dưới của nhóm + Giới hạn trên của
nhóm)/2.
)/2
Từ ví dụ bảng 2.4, Trị số giữa của nhóm
đầu tiên là: (10+14)/2 = 12; các nhóm còn lại là 17,
22, 27 và 32.
Thực hiện trên Excel:
Chọn hết cột Tần số
Type:
=FREQUENCY(A2:A51,B2:B6
)
Bấm Ctrl + Shift
+Enter
Bấm Ctrl + Shift +Enter
Relative Frequency and Percent
Frequency Distribution
Frequency of class
Relative Frequency =
n
Percent Frequency Distribution của một
nhóm là tần số tương đối (tần suất) nhân với
100.
Bảng 2.5 Relative Frequency and Percent
Frequency Distribution cho dữ liệu thời gian giải trí
của sinh viên
Thời gian Frequency Relative Percent
giải trí, Frequency Frequency
giờ/tuần
10 – 14 4 0,20 20
15 – 19 8 0,40 40
20 – 24 5 0,25 25
25 – 29 2 0,10 10
30 – 34 1 0,05 5
Tổng 20 1,00 100
Đồ thị điểm (Dot Plot)
Đồ thị điểm thể hiện chi tiết dữ liệu
và rất hữu ích để so sánh phân phối dữ liệu
cho hai hay nhiều biến.
Hình 2.1: Phân phối số sinh viên theo thời gian dành cho giải trí
Đồ thị phân phối tần số thể hiện:
□ Khái quát về sự tập trung của dữ liệu
□ Mức độ phân tán tương đối của tập dữ
liệu
□ Nhận dạng sơ bộ hình dáng của phân
phối (lệch trái, lệch phải, đối xứng)
Từ các biểu
Lệch phải
đồ
Histogram
bên cạnh ta
có thể thấy
các hình
dạng phân
phối của
Lệch phải nhiều tập dữ liệu:
Lệch trái,
lệch phải,
đối xứng.
Phân phối tích lũy (Cumulative Distribution)
Tần số tích lũy, tần suất, tần suất phần
trăm tích lũy tính được bằng cách cộng dồn các
tần số, tần suất, tần suất phần trăm trong phân
phối tần số, tần suất, tần suất phần tram.
Phân phối tần số tích lũy thể hiện số lượng
dữ liệu có giá trị nhỏ hơn hoặc bằng với giới
hạn trên của mỗi nhóm.
Phân phối tần suất tích lũy – thể hiện tỷ lệ dữ
liệu có giá trị nhỏ hơn hoặc bằng giới hạn
trên của mỗi nhóm.
Phân phối tần suất phần trăm tích lũy – thể
hiện phần trăm của dữ liệu có giá trị nhỏ hơn
hoặc bằng giới hạn trên của mỗi nhóm.
Nhóm cuối cùng của một phân phối tần số tích lũy
luôn bằng tổng số quan sát.
2.00 18 . 34
5.00 18 . 67899
15.00 19 . 000111222333444
8.00 19 . 55667788
5.00 20 . 01234
5.00 20 . 56789
Stem width: 10
Each leaf: 1 case(s)
Từ biểu đồ nhánh lá, xoay ngược chiều kim
đồng hồ, nó cung cấp một hình ảnh dữ liệu tương
tự một biểu đồ histogram với các nhóm 180-184,
185-189, …
Các nhóm Số ngày
Theo doanh số, trđ
180 - 184 2
185 - 189 5
190 - 194 15
195 - 199 8
200 - 204 5
205 - 209 5
Tổng 40
Biểu đồ histogram
Doanh số
Hai lợi thế của biểu đồ nhánh lá so với
histogram:
1. Biểu đồ nhánh là dễ dàng xây dựng
bằng tay.
2. Trong một nhóm, biểu đồ nhánh lá
cung cấp nhiều thông tin hơn biểu đồ
histogram bởi vì nhánh là cho thấy giá trị dữ
liệu thực tế.
• Trong ví dụ trước, đơn vị lá là 1.
• Đơn vị của lá có thề là 100; 10; 1; 0.1;...
Ví dụ: Đơn vị lá = 0,1
Nếu ta có dữ liệu như sau về điểm thi kết thúc
học phần của 7 sinh viên
8,6 9,7 9,5 9,1 8,2 7,0 6,8
đồ 6 8
7 0
nhánh
8 2 6
lá 9 1 5 7
Nếu ta có dữ liệu như sau:
1806 1717 1974 1791 1682 1910 1838
Đơn vị lá =10
16 8
17 1 9
18 0 3
19 1 7
Nhánh đầu tiên là 16 và lá tương ứng là 8. Kết
hợp chúng ta có được 168. Để tái tạo một giá trị xấp
xỉ giá trị ban đầu, ta nhân số này với 10, giá trị đơn
vị lá. Như vậy, 168x10=1680 là một giá trị xấp xỉ giá
trị ban đầu sử dụng để xây dựng biểu đồ nhánh lá.
Ví dụ, có dữ liệu về lương khởi điểm của 20 SV tốt
nghiệp ngành QT và kế toán được trình bày theo phương
pháp nhánh và lá:
Charge 4 2 1 7(58,3%)
(trả sau)
Cash 2 2 1 5(41,7%)
< 10 8 12 20
10 - 14 20 25 45
15 - 19 30 40 70
20 - 24 15 20 35
25 - 29 10 15 25
≥ 30 5 10 15
Tổng số 88 122 210
Click INSERT
Chọn
COLUMN
Hình 2.4 Số hộ gia đình theo thu nhập/ tháng của
thành phố Hà Nội và Tp.HCM
Bảng chéo
Ví dụ: Finger Lakes Homes
Số lượng căn hộ Finger Lakes được bán theo giá và
theo loại trong 2 năm qua như .
Biến định Biến định
lượng tính
Loại căn hộ
Khoảng giá
Colonial Log Split A-Frame Tổng
<200000USD 18 6 19 12 55
> 200.000USD 12 14 16 3 45
Tổng 30 20 35 15 100
< 200.000 18 6 19 12 55
≥ 200.000 12 14 16 3 45
Tổng 30 20 35 15 100
Loại căn hộ
Khoảng giá
Colonial Log Split A-Frame Tổng
< 200.000USD 32,73 10,91 34,55 21,82 100
> 200.000USD 26,67 31,11 35,56 6,67 100
Lưu ý: tổng hàng thật sự là 100,01 do làm tròn số.
Loạại icăn
Lo cănhhộộ
Khoảảng
Kho nggiá
giá
Colonial Log
Colonial Log Split
Split A-Frame
A-Frame
<200.000USD60,00
<200.000USD 60,00 30,00 54,29
30,00 54,29 80,00
80,00
>> 40,00
200.000USD40,00
200.000USD 70,00 45,71
70,00 45,71 20,00
20,00
TTổổng
ng 100
100 100
100 100
100 100
100
Điểm 7.0 8.0 9.0 9.5 Tổng Điểm 7.0 8.0 9.0 9.5 Tổng
Nam 1 3 2 6 Nam 1 6 7
Nữ 0 4 4 1 9 Nữ 0 7 1 8
Tổng 1 7 6 1 15 Tổng 1 13 1 15
Nam 2 9 2 13
Nữ 0 11 5 1 17
Tổng 2 20 7 1 30
Đồ thị phân tán và đường xu thế
Đồ thị phân tán trình bày bằng đồ họa mối liên
hệ giữa hai biến định lượng và một đường xu thế cung
cấp một xấp xỉ cho mối liên hệ.
hệ
Để minh họa, hãy xem mối liên hệ giữa hợp
đồng và doanh thu được quan sát trong 10 tuần
lễ của một công ty tư vấn (bảng 2.8)
Bảng 2.8 Dữ liệu về số hợp đồng và doanh thu được
quan sát trong 10 tuần lễ của một công ty tư vấn
Tuần Số HĐ Doan
lể h
số,tr.đ
1 2 50
2 3 56
3 2 48
4 4 60
5 5 70
5 5 76
6 2 45
7 4 62
8 1 30
9 3 60
10 4 65
Step1: Chọn Hình 2.5 Đồ thị phân tán và
B2:C11 đường xu thế của công ty tư vấn
Step2: Click Insert
Step3: Charts &
Click Scatter
Step4: Click Scatter
with only Markers
Step5: Click Chart
Layouts
Chọn Layout trong
số Layouts và
thêm Chart Layout
cũng như Chart
Title
Phương pháp bảng biểu và đồ thị
Dữ liệu
Dữ liệu định tính Dữ liệu định lượng
Điểm 5 6 5 9 7 6 7 8 9 7 8 7
BT
online
Điểm 6 6 7 10 7 5 6 9 9 7 9 9
thi kết
thúc
HP
Vẽ đồ thị phân tán thể hiện mối liên hệ giữa điểm bài
tập online và điểm thi kết thúc học phần.
Kết thức chương 2
CẢM ƠN CÁC BẠN ĐÃ LẮNG NGHE!
PivotTable Report
Creating the initial worksheet
□ Mở Excel với tập dữ liệu
□ Insert
□ Trong Tables Group, chọn PivotTable
(góc trái)
□ Đưa hết dữ liệu vào: Select a table or
range
Enter A1:C101 vào Table/Range box
Chọn: New Worksheet
Chọn OK
□ Rê (Drag) Quality Rating vào vùng
Row Labels
□ Rê (Drag) Meal Prices vào vùng
Column Labels
□ Rê (Drag) Restaurant vào vùng
Values
□ Click Sum of Restaurant và vào
Value Field Setting chọn Count và OK
□ Right-click B4 Click chuột phải và
chọn Group
□ Enter 10 vào Starting at box
□ Enter 49 vào Ending at box
□ Enter 10 vào By box
Click OK
Right-Click on Excellent in cell A5
Choose Move
Select Move”Excellent” to END