Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 14

Chương 4

Các Đại Lượng Thống Kê


Mô Tả

Lecturer: Nguyen Van Dung Ph.D.


Slides are based on slides accompanied the book “Business Analytics:
Methods, Models, and Decisions”, with improvement from the lecturer
Tổng thể và Mẫu
 Population (Tổng thể) - Tất cả các thành phần liên quan
đến một quyết định cụ thể hoặc cuộc điều tra cụ thể.
- tất cả tài xế đã kết hôn và trên 25 tuổi
- tất cả người đăng ký sử dụng Netflix.
 Sample (Mẫu) – một phần của tổng thể

- Danh sách những người đã xem một bộ phim hài từ


Netflix trong năm qua.
Mục đích của việc chọn mẫu là để thu được đủ thông tin để
đưa ra một suy luận có giá thị về một tổng thể.

Copyright © 2013 Pearson Education, Inc.


publishing as Prentice Hall 4-2
Hiểu về các Biểu thức Thống kê
 Thường thì chúng ta đặt nhãn cho các thành phần trong một
tập dữ liệu bằng cách sử dụng các biến có chỉ số dưới, x1,
x2, ..., và các giá trị tương ứng, trong đó xi biểu thị quan sát
thứ i.

Trong thống kê, việc sử dụng chữ cái Hy Lạp như là m (mu), s
(sigma), và p (pi), để biểu diễn các độ đo của tổng thể và sử dụng
các chữ cái in nghiêng như x (called x-bar), s, and p để đại diện
cho các mẫu thống kê.
 N đại diện cho số lượng các mục trong tổng thể và n đại diện
cho số lượng quan sát trong một mẫu.
 S biểu diễn phép tính tổng: Sxi = x1 + x2 + … xn

Copyright © 2013 Pearson Education, Inc.


publishing as Prentice Hall 4-3
Đo lường vị trí: Trung bình cộng
 Số bình quân tổng thể chung:

 Số bình quân mẫu:

 Hàm Excel: = Average (Phạm vi dữ liệu)


 Tính chất của giá trị trung bình:

 Giá trị ngoại lệ có thể ảnh hưởng đến giá trị của giá trị
trung bình. Giá trị ngoại lệ: các quan sát hoàn toàn
khác với phần còn lại — kéo giá trị trung bình về phía
các giá trị này.
Ví dụ 4.1: Tính toán giá trị trung bình của
mỗi đơn hàng
 Cơ sở dữ liệu đơn đặt hàng
 Sử dụng công thức:

=SUM(B2:B95)/COUNT(B2:B95)

Trung bình = $2,471,760/94


= $26,295.32

Sử dụng hàm AVERAGE trong Excel


=AVERAGE(B2:B95)
Đo lường vị trí: Trung vị
 Trung vị là giá trị nằm giữa khi dữ liệu được sắp xếp từ nhỏ
nhất đến lớn nhất.
◦ Phân nửa các số có giá trị bé hơn trung vị, và phân nửa các số
có giá trị lớn hơn nó
◦ Đối với một số lẻ các quan sát, trung vị là số nằm giữa các số
được sắp xếp.
◦ Đối với một số chẵn các quan sát, trung vị là giá trị trung bình của
hai số nằm giữa
 Chúng ta có thể sử dụng tùy chọn Sort trong Excel để sắp
xếp thứ tự dữ liệu và sau đó xác định trung vị. Hàm Excel =
Median (phạm vi dữ liệu) cũng có thể được sử dụng.
 Trung vị có ý nghĩa đối với dữ liệu tỷ lệ, dữ liệu khoảng và dữ
liệu thứ bậc
 Không bị ảnh hưởng bởi giá trị ngoại lệ
Ví dụ 4.2: Xác định Trung vị Chi phí trung bình mỗi
Đơn hàng
 Sắp xếp dữ liệu từ bé đến lớn. Vì chúng ta có 90
quan sát, nên trung vị chính là trung bình của
quan sát thứ 47 và 48.

Trung vị =
($15,562.50 + $15,750.00)/2
= $15,656.25

=MEDIAN(B2:B94)
Đo lường vị trí: Mode (Số lần xuất
hiện nhiều nhất)
 Mode là quan sát xuất hiện nhiều nhất trong tập dữ
liệu. Nó thường hữu ích nhất khi chúng ta có một số
lượng giá trị duy nhất tương đối nhỏ trong dữ liệu.
 Cách đơn giản để xác định mode là từ phân phối tần
suất, chúng ta nhìn vào giá trị hoặc nhóm có tần suất
xuất hiện lớn nhất. Hoặc từ biểu đồ cột, chúng ta tìm
thanh cột cao nhất.
 Trong Excel, bạn có thể sử dụng hàm
=MODE.SNGL(dãy dữ liệu) để tính mode cho một giá
trị mode duy nhất. Nếu có nhiều mode, bạn có thể sử
dụng hàm =MODE.MULT(dãy dữ liệu).
Ví dụ 4.3: Tìm Mode
 Số lượt mua hàng
hàng tháng
Mode ở đây là 30 months

 Chi phí trên một


lượt mua hang
Mode ở đây là nhóm
Từ $0 đến $13,000
Đo lường vị trí: Midrange

 Midrange là giá trị trung bình của giá trị lớn nhất
và giá trị nhỏ nhất.
 Tuy nhiên cần thẩn trọng khi sử dụng midrange vì

các giá trị cực đại hoặc cực tiểu dễ dẫn đến
sai lệch kết quả.Bởi vì midrange chỉ sử dụng 2
mẫu dữ liệu, trong khi giá trị trung bình sử dụng
toàn bộ dữ liệu; do đó midrange thường là một
ước lượng xấp xỉ thô hơn so với giá trị trung bình
và thường chỉ đuợc sử dụng cho các mẫu nhỏ.
Ví dụ 4.4: Tính toán Midrange

 Dữ liệu đơn hàng đã mua


 Sử dụng các hàm MIN và MAX trong Excel hoặc
sắp xếp dữ liệu và tìm chúng một cách dễ dàng
 Giá trị midrange của mỗi đơn hàng:
= ($68.78 + $127,500)/2
= $63,784.89
Sử dụng đo lường vị trí – Ví dụ 4.5: Trích
dẫn thời gian sữa chữa máy tính
Tệp Excel Computer Repair Times bao gồm 250
thời gian sưuax chữa cho khách hàng.
 Thời gian sữa chữa nào sẽ
hợp lý để áp dụng cho
khách hàng mới?
 Thời gian sữa chữa trung vị

là 2 tuần; trung bình và


mode khoảng 15 ngày
 Kiểm tra biểu đồ.
Ví dụ 4.5 (tiếp theo)

90% được hoàn thành trong vòng 3 tuần


Cảm ơn thầy và các bạn
đã lắng nghe <3

Copyright © 2013 Pearson Education, Inc.


publishing as Prentice Hall 4-14

You might also like