Kiểm Định Nhóm 1

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 29

Thực hành trên R bài toán kiểm định giả thuyết

Đỗ Thị Thanh Châu 20185434

Lê Thành Trung 20185486


Nguyễn Quang Huy 20185454
Hoàng Tú Linh 20185463

Nguyễn Đức Thiện 20173589


Tóm tắt nội dung
Kiểm định giả thuyết là phương pháp suy diễn cho phép xét tính hợp lý của 1 giả thuyết, hay là
1 nhận định cụ thể, thay vì dựa trên tính toán ước lượng một điểm hay xây dựng khoảng. Trong
chương này, chúng ta nghiên cứu một số bài toán kiểm định giả thuyết cơ bản nhất.
Mục lục

1 Các khái niệm cơ bản 3


1.1 Trị số p-value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Xác định p-value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3 Mối quan hệ với khoảng tin cậy . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Tỷ số hợp lý tổng quát . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Các bài toán kiểm định cơ bản 5


2.1 Kiểm định một mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Kiểm định cho kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2 Kiểm định cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.3 Kiểm định cho phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 So sánh hai mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.1 So sánh hai kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 So sánh hai tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.3 So sánh hai phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.4 Quan hệ giữa khoảng tin cậy và kiểm định giả thuyết . . . . . . . . . . . . . . 21
2.3 Phân tích phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Kiểm định F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 So sánh với t − test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.3 Kiểm định Turkey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Kiểm định phi tham số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.1 Kiểm định về phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.2 Kiểm định về tính độc lập của hai biến định tính . . . . . . . . . . . . . . . . . 26

2
Chương 1

Các khái niệm cơ bản

1.1 Trị số p-value


1.1.1 Khái niệm
Khái niệm: p-value là xác suất nhận được bộ dữ liệu này hoặc tệ hơn khi H0 đúng.
Bộ dữ liệu tệ hơn là bộ có H0 ít hợp lý hơn so với bộ dữ liệu ta có: Nếu H0 đúng, hầu như phép
thử không nhận được loại dữ liệu như ta đang có.
p-value thể hiện mức độ hợp lý của giả thuyết null dựa trên bộ dữ liệu x1 , . . . , xn . p-value càng
nhỏ, H0 càng hợp lý.
Liên hệ với mức ý nghĩa α, là xác suất xảy ra sai lầm loại I: Mức ý nghĩa α nhỏ đồng nhất với quan
điểm bảo vệ giả thuyết H0 . Nghĩa là chỉ bác bỏ giả thuyết H0 khi có đủ bằng chứng là nó sai.
Bác bỏ H0 nếu p-value < α.
Ngược lại, chấp nhận H0 nếu p-value > α.

1.1.2 Xác định p-value


Xét ví dụ bài toán kiểm định 2 phía với kỳ vọng.
Mức độ không tương thích giữa bộ dữ liệu với giả thuyết null được đo bởi thống kê t

n ( x − µ0 )
t= ∼ t ( n − 1)
s
p-value là xác suất sinh ra dữ liệu với µ = µ0 có thống kê t có trị tuyệt đối > |t|.

p-value = P( X ≥ |t|) + P( X ≤ |t|) = 2P( X ≥ |t|)


 
( n −1) α
Ta bác bỏ H0 nếu p-value ≤ α. Kết hợp P X ≥ t α = , trở thành
2 2
( n −1)
|t| > t α
2

3
( n −1)
Như vậy, bác bỏ H0 khi |t| > t α .
2

Nhận xét: Phương pháp này thống nhất với cách trình bày bằng miền bác bỏ trong bài giảng. Miền
bác bỏ được xác định theo các bước sau:
1. Chọn thống kê phù hợp biểu thị mức độ không tương thích của bộ dữ liệu với giả thuyết H0 .
2. Xác định phân phối của thống kê này.
3. Dựa trên p-value và phân phối của thống kê, xây dựng miền bác bỏ.

1.1.3 Mối quan hệ với khoảng tin cậy


Nếu µ0 nằm trong khoảng tin cậy với độ tin cậy γ = 1 − α thì p-value của bài toán kiểm định
H0 : µ = µ0 , H1 : µ 6= µ0 sẽ lớn hơn α, nghĩa là chấp nhận H0 .
Do đó, phương pháp khoảng tin cậy hoàn toàn cho phép kết luận chấp nhận hay bác bỏ giả thuyết
H0 .
Thông thường, người ta hay dùng khoảng tin cậy vì xây dựng khoảng tin cậy 1 − α cho µ có nhiều
ý nghĩa hơn kiểm định một giả thuyết cớ α.

1.2 Tỷ số hợp lý tổng quát


Trong chương này ta nghiên cứu một số bài toán kiểm định mà các nhà thống kê quan tâm khi giải
các bài toán thực tế. Các bài toán này đều dựa trên khái niệm về tỷ số hợp lý tổng quát (generalized
likelihood ratio). Đây là một nguyên lý quan trọng và có thể dùng để gợi ý quá trình kiểm định
trên thưc tế.
Định nghĩa: Cho y1 , . . . , yn là một mẫu ngẫu nhiên với các tham số θ1 , . . . , θk . Kí hiệu ω, Ω lần lượt
là không gian tham số chưa biết khi H0 đúng, không gian tất cả tham số chưa biết. Tỷ số hợp lý
tổng quát,
max L(θ1 , . . . , θk ) L ( ωc )
λ= ω =
max L(θ1 , . . . , θk ) L(Ωc )

Ta bác bỏ H0 khi 0 < λ < λ∗ , ở đó λ∗ thỏa mãn

P 0 < Λ < λ∗ | H0 đúng = α




Sử dụng nguyên lý này, người ta xây dựng được các phân phối cho bài toán kiểm định.

4
Chương 2

Các bài toán kiểm định cơ bản

2.1 Kiểm định một mẫu


2.1.1 Kiểm định cho kỳ vọng
Xét biến ngẫu nhiên X có kỳ vọng µ và phương sai σ. Nếu mẫu có phân phối chuẩn hoặc có cỡ đủ
lớn thì thống kê
X−µ
Z= σ

n
có phân phối chuẩn tắc.

Trường hợp đã biết phương sai


Kết quả: Cho y1 , . . . , yn là mẫu ngẫu nhiên cỡ n có phân phối chuẩn với phương sai σ2 đã biết. Đặt
x − µ0
z= σ

n

Kiểm định H0 : µ = µ0 và H1 : µ 6= µ0 với mức ý nghĩa α, bác bỏ H0 nếu z ≤ −z α hoặc z ≥ z α .


2 2

Ví dụ: Một hãng bảo hiểm thông báo rằng số tiền trung bình hãng chi trả cho khách hàng bị tai
nạn ô tô là 8500 USD. Để kiểm tra lại, người ta kiểm tra ngẫu nhiên hồ sơ chi trả của 25 khách
hàng thì thấy số tiền trung bình chi trả là 8900 USD. Giả sử số tiền chi trả tuân theo luật phân phối
chuẩn với độ lệch chuẩn là 2600 USD. Hãy kiểm định lại thông báo của hãng bảo hiểm trên với
mức ý nghĩa 5%.

[24]: utest = function(x_, mu, sigma, n, anpha, alternative) {


u = (x_ - mu )* sqrt(n)/sigma
ketqua = ""
if (alternative == "two.sided") {
if ((u >= qt(1-anpha/2,df = n-1)) | ( u <= -qt(1-anpha/2,df = n-1))) {
ketqua = "Bac bo H0"
}

5
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "left") {
if ( u <= -qt(1-anpha,df = n-1)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "right") {
if ( u >= qt(1-anpha, df = n-1)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
print(paste(ketqua))
}

Đặt giả thuyết:


H0 : µ = µ0 = 8500
H1 : µ 6= µ0

[25]: utest(x_ = 8900,mu = 8500,sigma = 2900,n = 25,anpha = 0.05, alternative = "two.


,→sided")

[1] "Chua co co so de bac bo H0"

Trường hợp chưa biết phương sai, n < 30.


Trong thống kê S, thay σ bằng ước lượng không chệch S thì thống kê
X−µ
T=
S

n
có phân phối Student với n − 1 bậc tự do.
Kết quả: Cho y1 , . . . , yn là mẫu ngẫu nhiên cỡ n có phân phối chuẩn với phương sai σ2 chưa biết.
Đặt
x − µ0
t= s

n
( n −1) ( n −1)
Kiểm định H0 : µ = µ0 và H1 : µ 6= µ0 với mức ý nghĩa α, bác bỏ H0 nếu t ≤ −t α hoặc t ≥ t α
2 2

6
Ví dụ: Một công ty sản xuất hạt giống tuyên bố rằng một loại giống mới của họ có năng suất trung
bình là 21,5 tạ/ha. Gieo thử hạt giống mới này tại 16 vườn thí nghiệm và thu được kết quả:

19, 2; 18, 7; 22, 4; 20, 3; 16, 8; 25, 1; 17, 0; 15, 8; 21, 0; 18, 6; 23, 7; 24, 1; 23, 4; 19, 8; 21, 7; 18, 9.

Dựa vào kết quả này hãy xác nhận xem quảng cáo của công ty có đúng không với mức ý nghĩa α =
0, 05. Biết rằng năng suất giống cây trồng là một biến ngẫu nhiên tuân theo luật phân phối chuẩn.

[27]: ketquatn = c(19.2,18.7,22.4,20.3,16.8,25.1,17,15.8,21,18.6,23.7,24.1,23.4,19.


,→8,21.7,18.9)

Đặt giả thuyết:


H0 : µ = µ0 = 21.5
H1 : µ 6= µ0

[28]: t.test(x = ketquatn,mu = 21.5,alternative = "two.sided")

One Sample t-test

data: ketquatn
t = -1.5626, df = 15, p-value = 0.139
alternative hypothesis: true mean is not equal to 21.5
95 percent confidence interval:
18.9143 21.8982
sample estimates:
mean of x
20.40625

Ở đây giá trị p-value = 0.139 > 0.05. Ta kết luận rằng “Chưa có cơ sở để bác bỏ H0 ”
Từ đó ta chấp nhận quảng cáo của công ty.

Trường hợp chưa biết phương sai, n ≥ 30.


Khi cỡ mẫu đủ lớn, phân phối Student tiến dần đến phân phối chuẩn. Trong trường hợp này, thống

X − µ√
U= n
S
có phân phối chuẩn tắc khi n ≥ 30.
Kiểm định H0 : µ = µ0 và H1 : µ 6= µ0 với mức ý nghĩa α, bác bỏ H0 nếu u ≤ −u α hoặc u ≥ u α .
2 2

Ví dụ: Một công ty có một hệ thống máy tính có thể xử lý 1200 hóa đơn trong một giờ. Công ty
mới nhập một hệ thống máy tính mới. Hệ thống này khi chạy kiểm tra trong 40 giờ cho thấy số
hóa đơn được xử lý trung bình trong một giờ là 1260 với độ lệch chuẩn hiệu chỉnh 215. Với mức ý
nghĩa 5% hãy nhận định xem hệ thống mới có tốt hơn hệ thống cũ hay không?

7
Đặt giả thuyết:
H0 : µ = µ0 = 1200
H1 : µ > µ0

[26]: utest(x_ = 1260, mu = 1200, sigma = 215, n=40, anpha = 0.05, alternative =␣
,→"right")

[1] "Bac bo H0"


Vậy điều nghi ngờ trên là có cơ sở với mức ý nghĩa 5%
Chú ý: Ở đây dù cỡ mẫu lớn hơn 30 hay nhỏ hơn 30 thì ta có thể dùng 1 hàm utest() vì phân phối
student sẽ hội tụ đến chuẩn khi mà cỡ mẫu lớn hơn 30. .

2.1.2 Kiểm định cho tỷ lệ


Giả sử bộ dữ liệu k1 , . . . , k n biểu diễn kết quả của n phép thử Bernoulli. Tổng số lần “thành công”,
X, trong n phép thử độc lập, có phân phối nhị thức.
Có 2 trường hợp khác nhau dựa trên cỡ mẫu n. Nếu cỡ mẫu n đủ lớn, ta tiến hành kiểm định
H0 : p = p0 dựa trên phân phối tiệm cận chuẩn. Nếu mẫu nhỏ, miền bác bỏ được xác định chính
xác bằng phân phối nhị thức ứng với biến X.

Trường hợp mẫu cỡ lớn


Kết quả: Cho k1 , . . . , k n là mẫu ngẫu nhiên cỡ n có phân phối Bernoulli thỏa mãn
q q
0 < np0 − 3 np0 (1 − p0 ) < np0 + 3 np0 (1 − p0 ) < n

Đặt k = k1 + . . . + k n là số lần “thành công” trong n phép thử. Thống kê


k − np
Z= p
np(1 − p)
k − np0
có phân phối chuẩn tắc. Nếu giả thuyết H0 đúng, có z = p .
np0 (1 − p0 )
Kiểm định H0 : p = p0 và H1 : p 6= p0 với mức ý nghĩa α, bác bỏ H0 nếu z ≤ −z α hoặc z ≥ z α .
2 2

Chú ý: Có rất nhiều cách để chọn mẫu cỡ là đủ lớn. Trên thực tế, thay vì kiểm tra bất đẳng thức
trên, có thể tiếp cận ở dạng đơn giản hơn là kiểm tra np0 > 5 và n(1 − p0 ) > 5.
Ví dụ: Một công ty A sản xuất bánh kẹo tuyên bố rằng 1/2 số trẻ em thích ăn bánh kẹo của công
ty. Trong một mẫu gồm 100 trẻ em được hỏi, có 47 em tỏ ra thích ăn bánh của công ty. Với mức ý
nghĩa 5%, số liệu trên có chứng tỏ là tuyên bố của công ty là đúng hay không?
Đặt giả thuyết
1
H0 : p = p0 =
2
H1 : p 6= p0
Ta sử dụng kiểm định prop.test()

8
[29]: prop.test(47,100,0.5,alternative = "two.sided")

1-sample proportions test with continuity correction

data: 47 out of 100, null probability 0.5


X-squared = 0.25, df = 1, p-value = 0.6171
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.3703535 0.5719775
sample estimates:
p
0.47

Giá trị p-value = 0.6171 > 0.05. Ta kết luận được “chưa có cơ sở để bác bỏ H0 ”. Ta có thể nói tuyên
bố của công ty là có cơ sở.
Ta sử dụng một kiểm định khác là binom.test()

[30]: binom.test(47,100,0.5,alternative = "two.sided")

Exact binomial test

data: 47 and 100


number of successes = 47, number of trials = 100, p-value = 0.6173
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.3694052 0.5724185
sample estimates:
probability of success
0.47

Giá trị p-value = 0.6173 > 0.05 gần giống với kiểm định prop.test(). Ta kết luận rằng “chưa có cơ
sở để bác bỏ H0 ” và tuyên bố của công ty là có cơ sở.

Trường hợp mẫu cỡ nhỏ.


p p
Trong trường hợp bất đẳng thức 0 < np0 − 3 np0 (1 − p0 ) < np0 + 3 np0 (1 − p0 ) < n không
thỏa mãn, miền bác bỏ được xác định trực tiếp bằng phân phối nhị thức, thay vì phân phối chuẩn
như trên.
Ví dụ: Có 19 bệnh nhân được điều trị bằng thuốc giảm đau. Đánh giá thực tế có 85% bệnh nhân
cho kết quả tốt. Hãy ước lượng cho tỷ lệ bệnh nhân có kết quả tốt khi sử dụng thuốc này với mức
nghĩa khoảng 10%?
Ta muốn kiểm định H0 : p = 0.85 và H1 : p 6= 0.85. Xét k = k1 + . . . + k n là số lần thành công trong

9
tổng số n phép thử, với
(
0 nếu bệnh nhân không có kết quả tốt
ki =
1 nếu bệnh nhân có kết quả tốt
Nếu H0 đúng thì kỳ vọng của số lần thành công là np0 = 16.2. Suy ra các giá trị k quá sai lệch bên
trên và bên dưới 16.2 tạo thành miền bác bỏ.

Từ hình vẽ ta thấy miền bác bỏ



C = k | k ≤ 13 hoặc k = 19
với mức ý nghĩa khoảng 10%. Thật vậy,

P X ∈ C | H0 đúng = P( X ≤ 13 | p = 0.85) + P( X = 19 | p = 0.85)
= 0.053696 + 0.045599
= 0.10

2.1.3 Kiểm định cho phương sai


Tình huống xảy ra khi ta quan tâm tới độ chính xác trong các phép đo. Khi đó, sử dụng đến 2 ước
lượng dưới đây, ta đưa ra các suy diễn về σ, trong đó có bài toán kiểm định giả thuyết.
1. Ước lượng không chệch của σ2 dựa trên hàm hợp lý cực đại, phương sai mẫu S2
n
1
n − 1 i∑
S2 = (Yi − Y )2
=1

n
( n − 1) S2 1
2. Tỷ số
σ 2
= 2
σ ∑ (Yi − Y )2 có phân phối khi bình phương với n − 1 bậc tự do.
i =1

10
Trường hợp chưa biết kỳ vọng.
Kết quả: Gọi s2 là phương sai mẫu tính được từ mẫu ngẫu nhiên cỡ n có phân phối chuẩn kỳ vọng
µ và phương sai σ2 .
( n − 1) s2
Đặt χ2 = . Kiểm định H0 : σ = σ0 và H1 : σ 6= σ0 với mức ý nghĩa α, bác bỏ H0 nếu
σ02
χ2 < χ2α hoặc χ2 > χ2 α .
2 , n −1 1− 2 , n −1

Ví dụ: Để kiểm tra chất lượng của một loại sản phẩm, người kỹ sư đo đường kính của 12 sản phẩm
của một dây chuyền sản xuất tính được s = 0, 3. Biết rắng nếu độ biến động của các sản phẩm lớn
hơn 0,2 thì dây chuyền sản xuất phải dừng lại để điều chỉnh. Với mức ý nghĩa 5% người kỹ sư sẽ
kết luận gì? Giả thiết rằng đường kính của các sản phẩm có phân phối chuẩn.
Đặt giả thuyết:
H0 : σ2 = σ02 = 0.22
H1 : σ2 > σ02

[31]: vartest = function(s, sigma, n, anpha, alternative) {


chi = (n - 1 )* s^2/sigma^2
ketqua = ""
if (alternative == "two.sided") {
if ((chi >= qchisq(1-anpha/2,df = n-1)) | ( chi <= -qchisq(1-anpha/2,df =␣
,→n-1))) {

ketqua = "Bac bo H0"


}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "left") {
if ( chi <= -qchisq(anpha,df = n-1)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "right") {
if (chi >= qchisq(1-anpha, df = n-1)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
print(paste(ketqua))
}

11
[32]: vartest(0.3,0.2,12,0.05, alternative = "right")

[1] "Bac bo H0"


Tức là dây chuyền cần điều chỉnh vì độ biến động đã lớn hơn mức cho phép.

Trường hợp đã biết kỳ vọng.


Đây là trường hợp ít gặp trên thực tế do hiếm khi ta biết trước µ.
Ví dụ: Sự biến động về khối lượng của một viên thuốc khi sản xuất ra là một chỉ số quan trọng
trong công nghiệp dược phẩm. Tại một công ty dược phẩm, người ta xác định khối lượng của 15
viên thuốc cùng loại được chọn một cách ngẫu nhiên cho kết quả như sau (đơn vị là gam)

3, 48; 3, 52; 3, 50; 3, 47; 3, 49; 3, 54; 3, 51; 3, 62; 3, 46; 3, 45; 3, 55; 3, 48; 3, 51; 3, 52; 3, 50.

Giả sử khối lượng những viên thuốc này có phân phối chuẩn. Hãy kiểm định xem phương sai của
khối lượng viên thuốc có vượt quá 0,02 (gam)2 không?
Đặt giả thuyết:
H0 : σ2 = σ02 = 0.02
H1 : σ2 > σ02

[33]: vartest2 = function(x, sigma, anpha, alternative) {


chi = sum((x-mean(x))^2)/sigma^2
n = length(x)
if (alternative == "two.sided") {
if ((chi >= qchisq(1-anpha/2,df = n)) | ( chi <= -qchisq(1-anpha/2,df =␣
,→n))) {

ketqua = "Bac bo H0"


}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "left") {
if ( chi <= -qchisq(anpha,df = n)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "right") {
if (chi >= qchisq(1-anpha, df = n)) {
ketqua = "Bac bo H0"
}
else {

12
ketqua = "Chua co co so de bac bo H0"
}
}
print(paste(ketqua))
}

klcacvienthuoc = c(3.48,3.52,3.5,3.47,3.49,3.54,3.51,3.62,3.46,3.45,3.55,3.48,3.
,→51,3.52,3.5)

vartest2(x = klcacvienthuoc, sigma = sqrt(0.02),anpha = 0.05, alternative =␣


,→"right")

[1] "Chua co co so de bac bo H0"


Tức là ta có thể coi phương sai của khối lượng viên thuốc không vượt quá 0, 02 gam2

2.2 So sánh hai mẫu


Xét 2 mẫu X và Y có kích thước tương ứng là n1 , n2 . Cần đặc biệt quan tâm khi nào X và Y độc lập
và có phân phối chuẩn.

2.2.1 So sánh hai kỳ vọng


Trường hợp mẫu cặp.
2 quan sát trong cặp thứ i có thể biểu diễn dưới dạng
(
Xi = µ X + Pi + ε i
Yi = µY + Pi + ε0i

trong đó µ X , µY là kỳ vọng của X và Y, Pi là “ảnh hưởng”.


Giả thuyết của mô hình: Ta giả sử ε i , ε0i là độc lập, có phân phối chuẩn với kỳ vọng 0, phương sai
tương ứng là σX2 , σY2 .
Khi trừ Xi cho Yi , ta triệt tiêu được Pi :

Di = µ X − µY + ε i − ε0i

Ta có
1. E( Di ) = µ D = µ X − µY
2 = σ2 + σ2
2. V ( Di ) = σD X Y

3. Di có phân phối chuẩn.


D − µD
Thống kê T = có phân phối Student với b − 1 bậc tự do. Ta đưa về bài toán kiểm định
S
√D
b
một mẫu giả thuyết H0 : µ = 0.
Nhận xét: Bài toán này, X và Y là 2 mẫu có phân phối chuẩn nhưng không cần độc lập với nhau.

13
Ví dụ: Để so sánh hai chế độ chăm bón cho một loại cây trồng A, trên 8 mảnh ruộng người ta
chia mỗi mảnh thành hai nửa: nửa thứ nhất áp dụng phương pháp chăm bón I, nửa thứ hai theo
phương pháp chăm bón II. Sau khi thu hoạch ta được số liệu về năng suất loại cây trồng A như
sau:

Đánh giá xem hai chế độ chăm bón có giống nhau không với mức ý nghĩa 1%. Biết rằng năng suất
loại cây trồng A (sau hai phương pháp chăm bón) có phân phối chuẩn.
Đặt giả thiết:
H0 : µ1 = µ2
H1 : µ1 6= µ2

[43]: ns1 = c(5, 20, 16, 22, 24, 14, 18, 20)
ns2 = c(15, 22, 14, 25, 29, 16, 20, 24)
bp = data.frame(ns1, ns2)
t.test(bp$ns1, bp$ns2, paired=TRUE,conf.level = 0.01)

Paired t-test

data: bp$ns1 and bp$ns2


t = -2.694, df = 7, p-value = 0.03091
alternative hypothesis: true difference in means is not equal to 0
1 percent confidence interval:
-3.265668 -3.234332
sample estimates:
mean of the differences
-3.25

Nhận thấy giá trị p-value = 0.02 > 0.01 nên ta kết luận “chưa có cơ sở để bác bỏ H0 ”. Có thể coi là
hai chế độ chăm bón có giống nhau không với mức ý nghĩa 1%.

Trường hợp mẫu độc lập.


Xét ước lượng X − Y là ước lượng không chệch của µ X − µY là X − Y.
σX2 σ2
Hơn nữa, nếu X và Y độc lập, V ( X ) = và V (Y ) = Y thì
n1 n2
s
σX2 σ2
s.e( X − Y ) = + Y
n1 n2

14
Có một sự thật là độ chính xác của bài toán kiểm định H0 : µ X = µY phụ thuộc rất nhiều vào
phương sai của X và Y. Nếu σX = σY , sử dụng tỷ số hợp lý tổng quát, ta giải quyết được ngay bài
toán kiểm định µ X = µY .
Nhưng nếu không thể giả sử σX = σY , bài toán trở nên phức tạp hơn nhiều. Bài toán này được
biết đến là bài toán Behrens-Fisher, đã tồn tại hơn 25 năm và vẫn là một bài toán chưa có lời giải nổi
tiếng trong thống kê. Có một số lời giải xấp xỉ được đưa ra, nhưng để đơn giản, trước hết ta giả sử
σX = σY .
Kết quả: Cho X và Y là 2 mẫu ngẫu nhiên có phân phối chuẩn và độc lập với nhau và có cùng
phương sai σ. Khi đó, ước lượng cho σ là

(n1 − 1)S2X + (n2 − 1)SY2


σ̂ = S2p =
n1 + n2 − 2
s
σX2 σ2
Đồng thời, từ s.e( X − Y ) = + Y , ta có
n1 n2
s
1 1
s.e( X − Y ) = S p +
n1 n2

Chọn thống kê
X − Y − ( µ X − µY )
T= s
(n1 − 1)S2X + (n2 − 1)SY2
 
1 1
+
n1 + n2 − 2 n1 n2

có phân phối Student với n1 + n2 − 2 bậc tự do.


Giá trị quan sát
x−y
t= r
1 1
sp +
n1 n2
( n + m −2)
Bác bỏ giả thuyết H0 nếu |t| > t α .
2

Ta thường áp dụng trong tình huống dưới đây:


a) Trường hợp chưa biết phương sai, cỡ mẫu nhỏ n1 < 30, n2 < 30.
Ví dụ: Người ta ghi lại sản lượng lúa mì, tính bằng tạ/héc-ta của các mảnh ruộng đã bón lót 50 và
100 đơn vị đạm trên một héc-ta. 1. Bón 50 đơn vị: 47,2; 43,1; 35,7; 47,0; 5,7; 42,6; 46,7; 42,3. 2. Bón
100 đơn vị: 47,9; 48,9; 43,5; 53,1; 50,8; 46,1; 41,1; 43,0; 41,0; 48,5; 47,7.
Với mức ý nghĩa 5% có thể kết luận rằng bón lót 100 đơn vị đạm cho năng suất cao hơn bón lót 50
đơn vị đạm hay không?
Đặt giả thuyết:
H0 : µ1 = µ2
H1 : µ1 > µ2

15
[34]: phuongphap1 = c(47.2,43.1,35.7,47.0,5.7,42.6,46.7,42.3)
phuongphap2 = c(47.9,48.9,43.5,53.1,50.8,46.1,41.1,43,41,48.5,47.7)

[35]: t.test(phuongphap1,phuongphap2,alternative = "greater")

Welch Two Sample t-test

data: phuongphap1 and phuongphap2


t = -1.528, df = 7.8286, p-value = 0.9171
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
-17.14529 Inf
sample estimates:
mean of x mean of y
38.78750 46.50909

Ta có p-value = 0.9171 > 0.05 nên “chưa có cơ sở để bác bỏ H0 ”. Ta kết luận được chưa thể khẳng
định được bón lót 100 đơn vị đạm cho năng suất cao hơn bón lót 50 đơn vị đạm với mức ý nghĩa
5%.

Tìm một thống kê với phân phối đã biết để kiểm định sự bằng nhau của hai kỳ vọng từ mẫu có
phân phối chuẩn khi độ lệch chuẩn mẫu không bằng nhau được gọi là bài toán Behrens-Fisher. Bài
toán này không có lời giải chính xác, nhưng xấp xỉ được dùng phổ biến dựa trên thống kê

X − Y − ( µ X − µY )
W= s
S2X S2
+ Y
n1 n2

Kết quả: Cho X và Y là 2 mẫu ngẫu nhiên có phân phối chuẩn và độc lập với nhau. Xét

X − Y − ( µ X − µY )
W= s
S2X S2
+ Y
n1 n2

có phân phối xấp xỉ phân phối Student với bậc tự do

n 2
 
θ+
m S2X
v=  2 , θ= .
θ 2 1 n SY2
+
n−1 m−1 m
Khi mẫu đủ lớn, phân phối Student tiến đến phân phối chuẩn nên thống kê

X − Y − ( µ X − µY )
U= s
S2X S2
+ Y
n1 n2

16
có phân phối chuẩn tắc. Giá trị quan sát
x−y
u= s
s2X s2
+ Y
n1 n2
Bác bỏ giả thuyết H0 nếu |z| > z α .
2

Trong thực tế, người ta thường chọn mẫu lớn là mẫu có n1 > 30, n2 > 30.
b) Trường hợp chưa biết phương sai, cỡ mẫu lớn n1 ≥ 30, n2 ≥ 30.
Ví dụ: Hai máy tự động dùng để cắt những thanh kim loại do cùng một kỹ thuật viên phụ trách
và căn chỉnh. Từ mỗi máy lấy ra 31 thanh kim loại để kiểm tra và thu được kết quả sau:
Máy 1: Trung bình mẫu là 12 cm, độ lệch chuẩn hiệu chỉnh là 1,2 cm.
Máy 2: Trung bình mẫu là 12,3 cm, độ lệch hiệu chỉnh là 1,4 cm.
Với mức ý nghĩa α = 0,01 có thể cho rằng chiều dài của các thanh kim loại do máy 2 sản xuất khác
chiều dài do máy 1 sản xuất hay không. Biết chiều dài thanh kim loại do các máy sản xuất có phân
phối chuẩn.

[36]: u2test = function(x_, y_, sigma.x, sigma.y, n.x, n.y, anpha, alternative) {
u = (x_ - y_)/sqrt(sigma.x^2/n.x + sigma.y^2/n.y)
ketqua = ""
if (alternative == "two.sided") {
if ((u >= qnorm(1-anpha/2)) | ( u <= -qnorm(1-anpha/2))) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "left") {
if ( u <= -qnorm(1-anpha)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
else if (alternative == "right") {
if (u >= qnorm(1-anpha)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
print(paste(ketqua))

17
}

[37]: u2test(x_ = 12,y_ = 12.3,sigma.x = 1.2,sigma.y = 1.4,n.x = 31,n.y = 31,anpha =␣


,→0.01,alternative ="two.sided" )

[1] "Chua co co so de bac bo H0"


Ta kết luận rằng chiều dài của các thanh kim loại do máy 2 sản xuất không khác chiều dài do máy
1 sản xuất với mức ý nghĩa 5%

Trong nhiều trường hợp, nếu biết σX và σY , sử dụng phân phối t như trên không chính xác. Khi
đó, ta sử dụng phân phối chuẩn tắc để kiểm định.
c) Trường hợp đã biết phương sai σX2 , σY2 .
Chọn thống kê
X − Y − ( µ X − µY )
Z= s
σX2 σ2
+ Y
n1 n2
có phân phối chuẩn tắc. Giá trị quan sát

x−y
z= s
σX2 σ2
+ Y
n1 n2

Bác bỏ giả thuyết H0 nếu |z| > z α .


2

Chú ý: X và Y có phân phối chuẩn và độc lập với nhau.

2.2.2 So sánh hai tỷ lệ


Trong bài toán này, X và Y không còn có phân phối chuẩn mà nó có phân phối nhị thức.
Theo định lý giới hạn trung tâm
 
X Y X Y
− −E −
n1 n n1 n2
s2  
X Y
V −
n1 n2

có phân phối tiệm cận chuẩn. Khi H0 đúng ta có

( n + n2 ) p (1 − p )
   
X Y X Y
E − = 0 và V − = 1
n1 n2 n1 n2 n1 n2
x+y
Thay p bởi , ước lượng hợp lý cực đại của nó, khi H0 đúng, ta có:
n1 + n2

18
Kết quả: Cho x và y là số lần “thành công” trong 2 tập độc lập n và m phép thử Bernoulli. Đặt
x+y
f = và định nghĩa
n1 + n2
x y

n1 n2
z= s
f (1 − f ) f (1 − f )
+
n1 n2
Kiểm định H0 : p X = pY và H1 : p X 6= pY với mức ý nghĩa α: Bác bỏ H0 nếu z ≤ −z α hoặc z ≥ z α .
2 2

Chú ý: Để có thể dùng phân phối tiệm cận chuẩn như trên, ta cần kiểm tra điều kiện (n1 + n2 ) f > 5
và (n1 + n2 )(1 − f ) > 5.
Ví dụ: Từ kho đồ hộp thứ nhất lấy ngẫu nhiên 1000 hộp để kiểm tra thấy có 20 hộp bị hỏng. Từ
kho đồ hộp thứ hai lấy ngẫu nhiên 900 hộp kiểm tra thấy 30 hộp bị hỏng. Hỏi chất lượng bảo quản
của 2 kho có thực sự giống nhau hay không với mức ý nghĩa 5%.
Đặt giả thuyết:
H0 : p1 = p2
H1 : p1 6= p2

[44]: hopbihong = c(20,30)


hoptongthe = c(1000,900)
prop.test(hopbihong, hoptongthe)

2-sample test for equality of proportions with continuity correction

data: hopbihong out of hoptongthe


X-squared = 2.7867, df = 1, p-value = 0.09505
alternative hypothesis: two.sided
95 percent confidence interval:
-0.02897746 0.00231079
sample estimates:
prop 1 prop 2
0.02000000 0.03333333

Kết quả phân tích trên cho thấy tỉ lệ gãy xương trong nhóm 1 là 0.02 và nhóm 2 là 0.03.
Với trị số p-value = 0.095 > 0.05 . Từ đó “chưa có cơ sở bác bỏ H0 ”. Suy ra tỉ lệ hộp hỏng của hai
nhóm giống nhau với mức ý nghĩa 5%.
Ví dụ: Trong 102 bệnh nhân điều trị phương pháp I có 82 bệnh nhân khỏi bệnh.
Trong 98 bệnh nhân điều trị phương pháp II có 69 bệnh nhân khỏi bệnh.
Hỏi có phải phương pháp I điều trị tốt hơn phương pháp II hai hay không với mức ý nghĩa 5%?

19
[45]: bnkhoibenh = c(82,69)
bn = c(102,98)
prop.test(bnkhoibenh, bn,alternative = "greater")

2-sample test for equality of proportions with continuity correction

data: bnkhoibenh out of bn


X-squared = 2.1806, df = 1, p-value = 0.06988
alternative hypothesis: greater
95 percent confidence interval:
-0.009829655 1.000000000
sample estimates:
prop 1 prop 2
0.8039216 0.7040816

Kết quả phân tích trên cho thấy tỉ lệ gãy xương trong nhóm 1 là 0.8 và nhóm 2 là 0.7.
Với trị số p-value = 0.06 > 0.05 . Từ đó chưa có cơ sở bác bỏ H0 . Như vậy,tỉ lệ bệnh nhân khỏi bệnh
của hai nhóm giống nhau với mức ý nghĩa 5%.

2.2.3 So sánh hai phương sai


Bài toán xuất hiện trong một số trường hợp so sánh độ phân tán của hai tham số (ví dụ: trong sản
xuất, máy móc, kĩ thuật,. . . ) và kiểm tra điều kiện bài toán so sánh 2 giá trị trung bình.
Kết quả: Cho X và Y là 2 mẫu độc lập có phân phối chuẩn có kỳ vọng µ X , µY và phương sai
σX2 , σY2 tương ứng. Kiểm định H0 : σX = σY và H1 : σX 6= σY với mức ý nghĩa α: Bác bỏ H0 nếu
SY2 SY2
< F α hoặc > F1− α ,m−1,n−1 .
S2X 2 ,m−1,n−1 S2X 2

Ví dụ: Thử nghiệm hai mẫu đạn của hai công ty khác nhau, người ta đo tốc độ xuất phát của đạn
khi súng phát hỏa. Số liệu thử nghiệm của mẫu thứ nhất là n1 = 10, x1 = 1210, s1 = 2500 và của
mẫu thứ hai lần n2 = 10, x2 = 1175, s2 = 3600. Với mức ý nghĩa 5% có thể kết luận gì về chất lượng
giống nhau của hai mẫu đạn. Biết rằng tốc độ xuất phát của đạn của hai công ty X1 , X2 là các biến
ngẫu nhiên có phân phối chuẩn.

[46]: var2test = function(s1, s2, n1, n2, anpha, alternative) {


f = s1^2/s2^2
ketqua = ""
if (alternative == "two.sided") {
if ( (f >= qf(p = anpha/2,df1 = n1-1,df2 = n2-1)) | (f <= qf(p = 1-anpha/
,→2,df1 = n1-1,df2 = n2-1)) ) {

ketqua = "Bac bo H0"


}
else {
ketqua = "Chua co co so de bac bo H0"
}

20
}
else if (alternative == "right") {
if (f >= qf(p = 1-anpha,df1 = n1-1,df2 = n2-1)) {
ketqua = "Bac bo H0"
}
else {
ketqua = "Chua co co so de bac bo H0"
}
}
print(paste(ketqua))
}

[47]: var2test(s1 = 2500,s2 = 3600,n1 = 10,n2 = 10,anpha = 0.05,alternative = "right")

[1] "Chua co co so de bac bo H0"


Ta có thể kết luận chất lượng hai mẫu đạn giống nhau.

2.2.4 Quan hệ giữa khoảng tin cậy và kiểm định giả thuyết
Tương tự như trường hợp 1 mẫu, xây dựng khoảng tin cậy 1 − α cho µ có nhiều ý nghĩa hơn kiểm
định một giả thuyết cỡ α.
Với các thống kê tìm được trên, ta hoàn toàn có thể xây dựng khoảng tin cậy cho kỳ vọng, phương
sai và tỷ lệ.

2.3 Phân tích phương sai


2.3.1 Kiểm định F
Giả thiết phân phối
Giả sử Yij độc lập và có phân phối chuẩn với kỳ vọng µ j , j = 1, 2, . . . , m và phương sai σ2 , hay
2
y−µ j

1
1 −2
f Yi (y) = √ e σ
2πσ
Ta có thể viết lại dưới dạng phương trình mô hình
Yij = ui + ε ij

ở đó ε ij gọi là sai số và có phân phối chuẩn, kỳ vọng 0, phương sai σ2 .

Tổng bình phương


Kết quả: Gọi SSF là tổng bình phương do nhân tố xác định bởi k mẫu độc lập cỡ n1 , . . . , nk . Khi
đó,
n
E(SSF ) = (k − 1)σ2 + ∑ n j (u j − µ)2
j =1

Từ đây ta xét 2 trường hợp dưới

21
Đã biết σ2
Khi µ j giống nhau thì E(SSF ) = (k − 1)σ2 . Khi các kỳ vọng không bằng nhau, ta thấy E(SSF ) >
(k − 1)σ2 . Như vậy, ta có thể bác bỏ H0 khi E(SSF ) đủ lớn
SSF
Kết quả: Khi H0 : µ1 = . . . = µk đúng thì có phân phối khi bình phương với k − 1 bậc tự do.
σ2
SSF
Như vậy, ta sẽ bác bỏ H0 nếu > χ21−α, k−1 .
σ2
Trên thực tế rất ít khi xảy ra trường hợp đã biết σ2 nên người ta hay quan tâm đến kết quả dưới
đây.

Chưa biết σ2
SSE SSF
Xuất phát từ việc luôn là ước lượng không chệch của σ2 , và khi H0 đúng, cũng là ước
n−k   k −1
SSF
lượng không chệch của σ2 , nhưng nếu H0 không đáng tin cậy thì E lớn hơn rất nhiều so
k−1
với σ2 .
Kết quả: Giả sử mỗi quan sát trong k mẫu độc lập có phân phối chuẩn với cùng phương sai σ2 . Ta

1. Nếu H0 : µ1 = . . . = µk đúng thì
SSF/(k − 1)
F=
SSE/(n − k)
có phân phối Fisher với k − 1 và n − k bậc tự do.
2. Với mức ý nghĩa α, bác bỏ H0 nếu F > F1−α,k−1,n−k .
Ví dụ: Ban chấp hành liên chi đoàn muốn nghiên cứu ảnh hưởng của việc đi làm thêm đối với kết
quả học tập của sinh viên Đại học Bách khoa Hà Nội, họ đã thu thập ngẫu nhiên 3 nhóm sinh viên
về kết quả học tập và thời gian làm thêm trong tuần. Nhóm I gồm 7 sinh viên làm thêm ít hơn 6
giờ/tuần, Nhóm II gồm 7 sinh viên làm thêm từ 6 đến 12 giờ/tuần; Nhóm III gồm 8 sinh viên làm
thêm nhiều hơn 12 giờ/tuần). Điểm trung bình học tập của các sinh viên được cho trong bảng sau:

[49]: analysis = lm(bang$dulieu ~ bang$nhom)


anova(analysis)
summary(analysis)

22
Df Sum Sq Mean Sq F value Pr(>F)
<int> <dbl> <dbl> <dbl> <dbl>
A anova: 2 × 5
bang$nhom 2 3.003636 1.5018182 6.69825 0.006286766
Residuals 19 4.260000 0.2242105 NA NA

Call:
lm(formula = bang$dulieu ~ bang$nhom)

Residuals:
Min 1Q Median 3Q Max
-0.7000 -0.3875 0.0250 0.3375 0.7000

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.7000 0.1790 37.437 < 2e-16 ***
bang$nhomII -0.2000 0.2531 -0.790 0.43916
bang$nhomIII -0.8500 0.2451 -3.468 0.00257 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4735 on 19 degrees of freedom


Multiple R-squared: 0.4135, Adjusted R-squared: 0.3518
F-statistic: 6.698 on 2 and 19 DF, p-value: 0.006287

Pr (> F ) = 0.0062 cho ta thấy “bác bỏ H0 ”. Như vậy việc làm thêm ảnh hưởng tới kết quả học tập.

2.3.2 So sánh với t − test


Phân tích phương sai là mở rộng cho k mẫu của t − test cho 2 mẫu. Câu hỏi đặt ra là kỹ thuật nào
là tốt hơn khi kiểm định H0 : µ X = µY ?
Người ta đã chứng minh được rằng câu trả lời là “không”. 2 phương pháp trên là tương đương,
nếu H0 bị bác bỏ bởi phương pháp này, nó cũng sẽ bị bác bỏ khi xét theo phương pháp còn lại.

2.3.3 Kiểm định Turkey


Sau kiểm định ANOVA, ta muốn tìm hiểu sâu hơn để tìm các cặp trung bình nào khác nhau, và
khác nhau bao nhiêu?
Nhưng phương án đưa ra không đơn giản như vậy, để đảm bảo đạt mức ý nghĩa α cho trước. Từ
đó các nhà thống kê đã tập trung vào chủ đề này gọi là “Bài toán so sánh đã biến”.
Kiểm định Turkey thuộc loại kiểm định từng cặp H0 : µi = µ j và H1 : µi 6= µ j . Việc xây dựng kiểm
R
định Turkey dựa trên việc biết các quy tắc xác suất của tỷ số Qk,k(r−1) = , ở đó R là miền giá trị
Q
của các biến có phân phối chuẩn, S là ước lượng điểm cho độ lệch chuẩn của phân phối chuẩn này.
Kết quả: Gọi Yj là các trung bình mẫu. Đặt n j = r là cỡ mẫu chung. Khi đó xác suất là 1 − α để tất

23
 
k
cả hiệu µi − µ j đồng thời thỏa mãn
2
√ √
Yi − Yj − D MSE < µi − µ j < Yi − Yj + D MSE
Qk,k(r−1)
với D = √ .
r
Nếu với i, j cho trước, số 0 không nằm trong khoảng này thì có thể bác bỏ H0 : µi = µ j bởi H0 : µi 6=
µ j với mức ý nghĩa α.

[50]: analysis_t = aov(bang$dulieu ~ bang$nhom+bang$stt)


TukeyHSD(analysis_t,'bang$nhom', conf.level=0.95)

Tukey multiple comparisons of means


95% family-wise confidence level

Fit: aov(formula = bang$dulieu ~ bang$nhom + bang$stt)

$`bang$nhom`
diff lwr upr p adj
II-I -0.20 -0.7792574 0.37925739 0.6378689
III-I -0.85 -1.4108636 -0.28913645 0.0042941
III-II -0.65 -1.2108636 -0.08913645 0.0235155

Ta thấy sự khác biệt giữa giá trị hai nhóm I-II là không đáng kể. Còn khác biệt giữa nhóm I-III và
II-III là đáng kể.

2.4 Kiểm định phi tham số


2.4.1 Kiểm định về phân phối xác suất
Mở đầu về kiểm định khi bình phương
Xuất phát từ phân phối nhị thức Y1 ∼ B(n, p1 ), theo định lý giới hạn trung tâm
Y1 − np1
Z= p
p1 (1 − p1 )

có phân phối tiệm cận chuẩn khi mẫu đủ lớn, np1 > 5 và n(1 − p1 ) > 5.
Khi đó, Q1 = Z2 có phân phối xấp xỉ χ2 (1). Đặt Y2 = n − Y1 và p2 = 1 − p1 , có

(Y1 − np1 )2 (Y − np1 )2 (Y1 − np2 )2


Q1 = = 1 +
p1 (1 − p1 ) np1 np2

Trong đó, Y1 là số lần “thành công”, np1 là số lần “thành công” mong đợi. Tương tự, Y2 là số lần
“thất bại”, np2 là số lần “thất bại” mong đợi. Viết lại Q1 như sau
2
(Yi − npi )2
Q1 = ∑ npi
i =1

24
có phân phối khi bình phương với 1 bậc tự do.
Q1 đo độ gần của dữ liệu với giá trị kỳ vọng của nó.

Phân phối nhị thức nhiều chiều


Tổng quát hóa, xét phép thử có k (thay vì chỉ 2) kết quả có thể xảy ra, kí hiệu A1 , . . . , Ak . Gọi
pi = P( Ai ) thì pi = 1. Thực hiện phép thử n lần độc lập, gọi Yi là số lần xuất hiện kết quả Ai .
Pearson mở rộng Q1 ra thành
k
(Yi − npi )2
Q k −1 = ∑ npi ∼ χ2 ( k − 1)
i =1

Chỉ số k − 1 vì thực chất chỉ cần xác định Y1 , . . . , Yk−1 thì Yk cũng được xác định Yk = n − Y1 −
. . . − Yk−1 .
Sử dụng tính chất quan trọng là Qk−1 ∼ χ2 (k − 1) để kiếm định giả thuyết về xác suất xảy ra của
các kết quả đầu ra. Ta muốn kiểm định
H0 : pi = pi0 , (i = 1, . . . , k )
trong đó pi0 là các số cho trước.
Ta chấp nhận H0 nếu với mọi i = 1, . . . , k, số lần xảy ra Ai từ bộ dữ liệu sát với số lần Ai sẽ xảy ra
theo kỳ vọng, có nghĩa là nếu Qk−1 nhỏ. Như vậy, bác bỏ H0 nếu Qk−1 > χ2α (k − 1).

Giải quyết bài toán kiểm định phân phối


Sử dụng kiểm định khi bình phương, ta có thể kiểm định một biến ngẫu nhiên có phân phối cho
trước hay không.
Xét bài toán
Ho : F (W ) = F0 (W )
trong đó F (W ) là hàm phân phối của biến liên tục cho trước.
Để dùng kiểm định khi bình phương, ta chia miền giá trị của W thành k tập rời nhau: Chia đoạn
[0, 1] bởi k + 1 điểm
0 = b0 < b1 < . . . < bk = 1
Tính ai = F −1 (bi ), thì ta có k tập A1 = (−∞, a1 ], A2 = [ a1 , a2 ], . . . , Ak = [ ak , +∞).
Tính pi0 = P(W ∈ Ai ) khi W có hàm phân phối F0 .
Gọi pi = P(W ∈ Ai ) và Yi là số lần thu được số liệu thuộc Ai trong n lần thực hiện phép thử một
cách độc lập. Khi đó, Y1 , . . . , Yk có phân phối nhị thức nhiều chiều với các tham số n, p1 , . . . , pk−1 .
Bài toán trở thành kiểm định giả thuyết
H0 : pi = pi0 , (i = 1, . . . , k )
như ta đã đưa ra.
Giả thuyết này sẽ bị bác bỏ nếu
k
(Yi − npi0 )2
Q k −1 = ∑ np i0
> χ2α (k − 1).
i =1

25
Trường hợp thiếu tham số
Trong nhiều trường hợp, các pi0 không được cho trước để tính Qk−1 mà nó lại là một hàm của
tham số chưa biết p. Khi đó, ta sẽ sử dụng phương pháp hợp lý cực đại để ước lượng p.
Tương tự trong trường hợp kiểm định phân phối không biết trước tham số đặc trưng. Khi đó, số
bậc tự do của phân phối khi bình phương giảm xuống.
Ví dụ: Điều tra thời gian sản xuất một sản phẩm của nhà máy A (phút) ở 100 công nhân ta thu
được số liệu sau:

Với mức ý nghĩa 5% có thể coi thời gian sản xuất một sản phẩm là biến ngẫu nhiên tuân theo luật
phân phối chuẩn không?

[51]: tgsx1sp = c(rep(16.5,6),rep(17.5,10),rep(18.5,24),rep(19.5,30),rep(20.


,→5,18),rep(21.5,12))

shapiro.test(tgsx1sp)

Shapiro-Wilk normality test

data: tgsx1sp
W = 0.93389, p-value = 8.332e-05

Giá trị p-value < 0.05 nên ta "Bác bỏ H0 ". Vậy biến ngẫu nhiên thời gian sản suất trong một phút
không tuân theo phân phối chuẩn.

2.4.2 Kiểm định về tính độc lập của hai biến định tính
Trong mục này, ta sử dụng kiểm định khi bình phương để kiểm định tính độc lập của hai biến
định tính.
Giả sử một phép thử ngẫu nhiên cho kết quả được phân loại thành 2 thuộc tính A hoặc B, ví dụ
chiều cao và cân nặng. Thuộc tính A được chia tiếp thành k nhóm nhỏ hơn A1 , . . . , Ak và thuộc
tính B được chia thành h nhóm B1 , . . . , Bh . Định nghĩa

pij = P( Ai ∩ Bj )

Thực hiện phép thử n lần độc lập, gọi Yij là số lần xuất hiện kết quả Ai ∩ Bj , khi đó

h k (Yij − npij )2
Qkh−1 = ∑∑ npij
i =1 i =1

là biến ngẫu nhiên có phân phối xấp xỉ phân phối khi bình phương với kh − 1 bậc tự do, với n đủ
lớn.

26
Xét bài toán kiểm định tính độc lập của A, B:

H0 : P( Ai ∩ Bj ) = P( Ai ) P( Bj ), i = 1, . . . , k, j = 1, . . . , h.

h k
Kí hiệu P( Ai ) = pi. = ∑ pij và P( Bj ) = p.j = ∑ pij , viết lại giả thuyết null:
j =1 i =1

H0 : pij = pi. p.j

Nếu H0 đúng, ta có thể thay pij = pi. p.j vào Qkh−1 . Nhưng pi. , p.j chưa biết, ta sử dụng ước lượng

h k
∑ yij ∑ yij
yi. j =1 y.j i =1
pˆi. = = , pˆj. = =
n n n n
k h
Vì ∑ pi. = ∑ p j. = 1 nên ta chỉ cần tính k − 1 + h − 1 = k + h − 2 ước lượng. Suy ra biến ngẫu
i =1 j =1
nhiên !2
Yi. Y.j
Yij − n
h k n n
Q= ∑∑ Yi. Y.j
i =1 i =1 n
n n
xấp xỉ phân phối xấp xỉ phân phối khi bình phương với (k − 1)(h − 1) bậc tự do.
Ta bác bỏ H0 nếu
Q > χ2α [(k − 1)(h − 1)].

Ví dụ: Để nghiên cứu mối liên hệ giữa việc hút thuốc là và chất lượng lá phổi, chọn ngẫu nhiên
200 năm giới để khảo sát. Bảng dưới đây cho ta thông tin về thói quen hút thuốc (có hút và không
hút) và chất lượng lá phổi với 4 mức A là mức tốt, B là bình thường, C là kém và D là rất kém.

Với mức ý nghĩa 5% nhận định xem giữa việc hút thuốc và chất lượng lá phổi có tương quan hay
không?

[2]: file_path = "Book1.csv"


bangmqh= read.csv(file_path, row.names = 1,header = TRUE)

27
[54]: chisq.test(bangmqh)

Pearson's Chi-squared test

data: bangmqh
X-squared = 42.736, df = 3, p-value = 2.8e-09

Giá trị p-value = 2.8e−9 < 0.05 nên ta “Bác bỏ H0 ”, ta có thể kết luận rằng việc hút thuốc và chất
lượng lá phổi có tương quan.

28

You might also like