Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 2

Giá trị đo lường khuynh hướng trung tâm

Chúng ta sử dụng các thuật ngữ thống kê để mô tả vài điều về chuỗi dữ liệu. Với một chuỗi dữ
liệu đặc trưng, điều quan trọng là cần phải biết các giá trị quan sát có khuynh hướng tạo thành
cụm 3 giá trị đại diện trung tâm cho một quần thể dữ liệu là giá trị trung bình, trung vị và giá trị phổ
biến. Đối với phân phối Gaussian, các giá trị khuynh hướng trung tâm này là một, hay nói cách
khác giá trị trung bình = giá trị trung vị = giá trị phổ biến.

Giá trị trung bình (Mean )).


Giá trị trung bình là tổng giá trị các điểm dữ liệu chia cho số lượng các điểm. Đây là giá trị phổ biến
nhất dùng để tính toán khuynh hướng trung tâm

Ví dụ: Chuỗi dữ liệu gồm 7 số sau {2, 5, 9, 3, 5, 7, 4}, Giá trị trung bình là:

2+5+9+3+5+7+4 = 35/7 = 5 là giá trị trung bình


7

Một số tính chất của giá trị trung bình:


 Dễ tính toán
 Là duy nhất cho một chuỗi số liệu
 Ảnh hưởng bởi các điểm dữ liệu, bị ảnh hưởng mạnh bởi các giá trị lệch(outliers)

Trung vị (median)
Giá trị trung vị của moojt chuỗi dữ liệu là điểm có giá trị nằm giữa, khi dữ liệu được sắp xếp theo
thứ tự. Cũng sử dụng chuỗi dữ liệu trên, và sắp xếp từ nhỏ đến lớn {2, 3, 4, 5, 5, 7, 9}, chúng ta có thể xác
định được giá trị trung vị bằng cách gạch bỏ các giá trị cao nhất và nhỏ nhất. Tiếp tục gạch bỏ những giá
trị nhỏ nhất và lớn nhất cho đến khi chuôi dữ liệu chỉ còn 1 giá trị, giá trị nằm giữa, còn lại. { 2, 3, 4, 5, 5, 7,
9}. Đối với chuỗi dữ liệu trên, trung vị là 5

Nếu chuỗi dữ liệu có số điểm là chẵn, Lấy trung bình của 2 điểm giữa.

Ví dụ: chuỗi dữ liệu sau gồm 6 điểm dữ liệu {2, 3, 4, 5, 7, 9}, chúng ta có thể xác định giá trị trung vị
như sau: 2, 3, 4, 5, 7, 9. Và trong chuỗi dữ liệu còn lại 2 điểm dữ liệu 4 và 5 nằm ở giữa. Để xác định giá trị
trung vị của quần thể dữ liệu, chúng ta lấy giá trị trung bình của 4 và 5 như sau:

4+5 = 9/2 = 4.5. Giá trị trung vị là 4.5


2

Một số đặc điểm của giá trị trung vị:


 Luôn có trong một quần thể dữ liệu
 Duy nhất
 Không bị ảnh hưởng bởi các giá trị lệch xa (outliers)

Giá trị phổ biến (Mode)


Giá trị phổ biến là giá trị xuất hiện với tần xuất cao nhất trong chuỗi dữ liệu. Có thể có hơn 1 giá trị
phổ biến trong quần thể dữ liệu. nếu có từ 2 đến nhiều dữ liệu có cùng tần xuất xuất hiện. Trong trường
hợp có 2 giá trị phổ biến xuất hiện, phân phối của quần thể dữ liệu được phân loại là lưỡng đỉnh (có 2 giá
trị đại diện).

Cho chuỗi dữ liệu, {2, 5, 9, 3, 5, 7, 4}, tất cả các con số đều hiện diện 2 lần ngoại trừ giá trị 5; xuất
hiện 2 lần, và có tần xuất xuất hiện cao hơn tất cả các số còn lại. Vì vậy giá trị phổ biến là giá trị 5.

Các đặc điểm của giá trị phổ biến:


 Không cần phải tính toán
 Không là duy nhất
 Không bị ảnh hưởng bởi giá trị lệch xa
 Có thể không gần giá trị trung bình của quần thể dữ liệu.
Thực hành tính toán
Tính toán các giá trị trung bình, trung vị và giá trị phổ biến của các quần thể sau:

Mean Median Mode


Chuỗi dữ liệu #1 {2, 2, 2, 2, 42, 2, 2, 2, 2, 2}

Chuỗi dữ liệu #2 {9, 2, 3, 4, 11, 5, 8, 6, 7, 5}

Chuỗi dữ liệu #3 {6, 6, 6, 6, 6, 6, 6, 6, 6, 6}

You randomly select 20 sodium specimens submitted to you laboratory to track turn-around
time for the day. The results, in minutes, are as follows:
Bạn lựa chọn ngẫu nhiên 20 mẫu bệnh nhân làm XN Na và theo dõi thời gian trả kết quả
trong ngày (tính bằng phút). Kết quả như sau:

{45 48 41 49 102 44 43 141 44 46 43 43 45


49 41 42 40 43 48 43}

Giá trị trung bình của 20 mẫu là?

Giá trị trung vị của 20 mẫu là?

Giá trị phổ biến của 20 mẫu là?

Mang bản làm việc này đến hội thảo. Chúng ta sẽ sửa bài tập này.

Đối với chuỗi dữ liệu 3: mean = median = mode nhưng nó không phải là phân phối chuẩn,
chúng ta sẽ tìm hiểu các giá trị khác đại diện đặc trưng cho phân phối chuẩn.

You might also like