Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 37

THỐNG KÊ KINH DOANH

Faculty of Business and Economics


Chương 5
Chọn mẫu và phân phối mẫu

• Mẫu ngẫu nhiên giản đơn

• Ước lượng điểm

• Giới thiệu về phân phối mẫu


n = 100
• Phân phối mẫu của một trung bình

• Phân phối mẫu của một tỷ lệ

• Đặc tính của một ước lượng điểm


n = 30
• Các phương pháp lẫy mẫu khác
Thống kê suy diễn

• Thống kê suy diễn có mục đích thu được các thông tin về tổng thể từ thông tin
có được trong một mẫu

• Một tổng thể (population) là tập hợp của tất cả các phần tử được quan tâm.

• Một mẫu là một tập hợp con của tổng thể

• Các kết quả từ mẫu là các “ước tính”/ “ước lượng” về giá trị của các đặc điểm
tổng thể.

• Một tham số là một đặc tính số của một tổng thể.

• Với các phương pháp lấy mẫu thích hợp, kết quả từ một mẫu có thể cung cấp
các ước lượng tốt của các đặc điểm tổng thể (lấy mẫu tốt có thể sử dụng kết
quả từ mẫu suy ra cho tổng thể)
Lý do cần chọn mẫu

• Lý do:

- Không thể hoặc không cần thiết điều tra tổng thể

- Quá trình điều tra/lấy mẫu có thể làm phá hủy đối tượng điều tra: Ví dụ: Kiểm
tra phẩm chất của sữa hộp, thực phẩm đóng gói,….

- Nhà nghiên cứu cần cân nhắc giới hạn nguồn lực cho điều tra và tính đại diện
của dữ liệu

……………………………………..

• Yêu cầu:

- Đảm bảo tính đại diện và có thể suy diễn cho tổng thể

Ngụ ngôn: Bác sĩ không cần rút hết máu của bệnh nhân ra để kiểm tra mà chỉ
cần một lượng nhỏ
Các kí hiệu giữa mẫu và tổng thể

Tên gọi Tổng thể Mẫu


Cỡ N n
Trung bình
Độ lệch chuẩn S
Lấy mẫu ngẫu nhiên giản đơn

⁃ Tổng thể hữu hạn (thường định nghĩa bằng một danh sách và có thể đếm
được)
⁺ Một mẫu ngẫu nhiên giản đơn từ một tổng thể hữu hạn cỡ N là một
mẫu được chọn sao cho với mỗi mẫu n đều có xác suất chọn như nhau.
⁺ Có thể chọn mẫu có hoàn lại (các phần tử có thể lặp lại trong mẫu)
⁺ Lấy mẫu không hoàn lại là cách lấy mẫu phổ biến nhất
Lấy mẫu ngẫu nhiên giản đơn

⁃ Tổng thể vô hạn


⁺ Một mẫu ngẫu nhiên từ một tổng thể vô hạn là một mẫu được chọn sao
cho thoả mãn hai tiêu chuẩn sau:
• Mỗi phần tử được chọn đều đến từ cùng một tổng thể
• Mỗi phần tử được chọn là độc lập với nhau
⁺ Tổng thể được coi là vô hạn nếu nó liên quan đến một quá trình liên tục
làm cho việc liệt kê hay đếm các phần tử là không thể (do chi phí, thời
gian)
⁺ Quy trình chọn mẫu ngẫu nhiên không thể thực hiện được với các tổng
thể vô hạn.
Ước lượng điểm

⁃ Trong ước lượng điểm sử dụng dữ liệu từ một mẫu để tính toán một giá trị
thống kê mẫu đóng vai trò như một tham số ước lượng của tổng thể.

⁃ Trung bình mẫu là một ước lượng điểm của trung bình tổng thể

⁃ Phương sai, độ lệch chuẩn mẫu là ước lượng điểm của phương sai, độ
lệch chuẩn tổng thể.

⁃ Tỷ lệ mẫu là ước lượng của tỷ lệ tổng thể


Ví dụ

Một trường đại học nhận 900 hồ sơ của 900 sinh viên đăng ký học bao

gồm các thông tin cá nhân về điểm SAT và mong muốn của họ về được

xếp chỗ ở trong ký túc (có hoặc không).


Ví dụ

Trưởng phòng tuyển sinh muốn biết thông tin về sinh viên:

-Điểm trung bình SAT của các hồ sơ;

-Tỷ lệ sinh viên có nguyện vọng đăng ký ở ký túc xá.

Có ba phương án thay thế nhau được đưa ra lựa chọn

• Thực hiện đánh giá bằng 900 hồ sơ

• Lựa chọn một mẫu 30 hồ sơ sử dụng một bảng ngẫu nhiên (bước nhảy k)

• Sử dụng mẫu từ 30 hồ sơ sử dụng cách lấy ngẫu nhiên từ một chương trình
máy tính
Ví dụ

Dữ liệu từ 900 hồ sơ
⁃ Điểm SAT
• Trung bình tổng thể

• Đô lệch chuẩn tổng thể

⁃ Sinh viên muốn ở ký túc


Tỷ lệ muốn ở ký túc:
Ví dụ

⁃ Ước lượng điểm


• Trung bình

• Độ lệch chuẩn

• Tỷ lệ
Phân phối trung bình mẫu
• Quy trình của một thống kê suy diễn

Tổng thể có
trung bình Một mẫu lấy ra từ tổng
chưa biết thể này để ước tính
m=?

Giá trị của x được sử Dữ liệu mẫu cung cấp


dụng để suy diễn về giá thông tin để tính trung
trị của m. bình mẫu x
Phân phối trung bình mẫu x
• Phân phối của mẫu là phân phối xác suất của tất cả những giá trị
có thể có của trung bình mẫu

• Kỳ vọng toán của

E( ) = 

Với
 = trung bình tổng thể
Phân phối trung bình mẫu x
 Độ lệch chuẩn của x

Tổng thể hữu hạn Tổng thể vô hạn

N n 
x  ( ) x 
n N 1 n
• . x là sai số chuẩn của giá trị trung bình (còn được ký
hiệu SE trong các phần mềm thống kê)
Phân phối trung bình mẫu x

• Nếu một cỡ mẫu đủ lớn (n > 30) với một mẫu ngẫu nhiên giản đơn, định
lý giới hạn trung tâm cho thấy rằng phân phối của trung bình mẫu sẽ
xấp xỉ phân phối chuẩn.

• Khi một cỡ mẫu là nhỏ (n < 30) phân phối mẫu chỉ được xem là phân
phối chuẩn khi phân phối của tổng thể là phân phối chuẩn
Ví dụ
• Phân phối của trung bình điểm SAT

+/- 2 độ lệch chuẩn


Ví dụ

• Phân phối của trung bình mẫu điểm SAT

Vậy câu hỏi đặt ra là xác suất để một mẫu ngẫu nhiên với cỡ mẫu là
30 thì điểm SAT trung bình của tổng thể nằm trong khoảng +/- 10
điểm là bao nhiêu?

-> Xác suất để nằm trong khoảng 980 đến 1000 điểm là bao nhiêu?
Ví dụ

• Phân phối xác suất của trung bình điểm SAT

Phân phối mẫu của x

Diện tích = .2518 Diện tích = .2518

x
980 990 1000

Với n = 30, trung bình mẫu có phân phối chuẩn với độ lệch chuẩn là 14.6 =>
chuyển về hàm phân phối chuẩn hóa và tra bảng thì được
z = 10/14.6= .68. -> P= (.2518)(2)
Phân phối xác suất của một tỷ lệ

• Phân phối mẫu của một tỷ lệ là phân phối xác suất của tất cả các giá trị
mà tỷ lệ mẫu có thể nhận

• Kỳ vọng toán của tỷ lệ mẫu


E ( p)  p
Trong đó
p = tỷ lệ của tổng thể
Phân phối tỷ lệ mẫu

• Độ lệch chuẩn

Tổng thể hữu hạn Tổng thể vô hạn

p (1  p ) N  n p (1  p )
p  p 
n N 1 n
• p được xem như một sai số chuẩn của tỷ lệ mẫu
.
Ví dụ
• Phân phối tỷ lệ mẫu

.72(1  .72)
p   .082
30

E( p )  .72
Ví dụ

• Phân phối tỷ lệ mẫu

Tỷ lệ mẫu cung cấp một ước tính về tỷ lệ tổng thể. Với cỡ mẫu 30
ước tính xác suất để tỷ lệ những người nộp đơn không chênh lệch
quá 5% so với tỷ lệ tổng thể.

=> khoảng không chênh lệch quá 5% là 0.72 +/- 0.05 -> từ 0.67 đến 0.77
Ví dụ

• Phân phối mẫu của một tỷ lệ p

Phân phối
mẫu
của p

Diện tích = .2291 Diện tích = .2291

p
0.67 0.72 0.77
p tuân theo hàm phân phối chuẩn với độ lệch chuẩn 0.082, hoán chuyển

chuẩn hóa 0.4582.


Các tính chất của một ước lượng điểm

Các ước tính của một mẫu thu được các ước lượng điểm và được sử dụng thay
thế cho tham số của tổng thể. Tuy nhiên, cần kiểm tra xem các ước lượng như
vậy có phải là ước lượng tốt không. Để xem xét ước lượng là tốt cần xem xét
các tính chất:

• Không chệch

• Hiệu quả

• Vững
Tính chất của ước lượng điểm

• Không chệch

Nếu kỳ vọng toán của thống kê mẫu bằng tham số của tổng
thể thì thống kê mẫu được xem là ước lượng không chệch của tham
số tổng thể.

Trung bình mẫu, tỷ lệ mẫu được xem là các ước lượng không
chệch của trung bình tổng thể và tỷ lệ tổng thể.
Tính chất của một ước lượng điểm

• Hiệu quả

Với hai ước lượng không chệch của tham số tổng thể, ước
lượng nào có độ lệch chuẩn nhỏ hơn được xem là hiệu quả hơn.

Ước lượng điểm có độ lệch chuẩn nhỏ hơn được xem là ước
lượng có hiệu quả tương đối lớn hơn.
Tính chất của ước lượng điểm

• Tính vững

Một ước lượng điểm được xem là vững nếu giá trị của nó có
xu hướng gần với tham số của tổng thể khi cỡ mẫu lớn hơn.
Các phương pháp lấy mẫu khác

• Lẫy mẫu ngẫu nhiên phân tầng

• Lấy mẫu cụm/chùm

• Lẫy mẫu hệ thống

• Lấy mẫu thuận tiện

• Lẫy mẫu phán đoán


Lấy mẫu phân tầng
Lấy mẫu phân tầng

• Ưu diểm: Nếu các tầng là đồng nhất, phương pháp này “chính xác” như
lấy mẫu ngẫu nhiên đơn nhưng có cỡ mẫu nhỏ hơn

• Căn cứ phân tầng có thể là bộ phận, phòng ban, khu vực, ngành công
nghiệp….
Lấy mẫu chùm/cụm

• Tổng thể được chia thành các nhóm phần từ riêng biệt gọi là các
cụm

• Lý tường mỗi một cụm là một đại diện nhỏ hơn của tổng thể

• Sau đó lấy mẫu ngẫu nhiên của các cụm được lấy

• Tất cả các phần tử trong mỗi cụm được chọn tạo thành một mẫu
nghiên cứu
Lẫy mẫu chùm/cụm

• Lợi thế: Có thể có lợi thế về chi phí, dễ thu thập được nhiều quan sát
hơn các phương pháp khác

• Bất lợi: Phương pháp này có thể đòi hỏi cỡ mẫu lớn hơn cỡ mẫu lấy
theo phương pháp phân tầng hoặc lẫy mẫu giản đơn

• Ví dụ: Lấy mẫu theo khu vực địa lý


Lấy mẫu hệ thống

• Một phương pháp lấy mẫu xác suất theo đó chúng ta sẽ chọn một
cách ngẫu nhiên một trong k phần tử đầu tiên và sau đó chọn mỗi
phần tử thứ k kế tiếp
• Chọn bước nhảy k = N/n
• Lợi thế: Mẫu thường dễ xác định hơn cách lấy mẫu ngẫu nhiên giản
đơn
Lấy mẫu thuận tiện
• Một phương pháp lấy mẫu phi xác suất theo đó các phần tử được
chọn vào mẫu dựa trên cơ sở thuận tiện
Lấy mẫu phán đoán

• Một phương pháp lấy mẫu phi xác suất theo đó các phần tử được
chọn vào mẫu dựa trên sự phán đoán của người thực hiện nghiên cứu

You might also like