Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

HCMUT-CNCP LỚP XÁC SUẤT THÔNG KÊ HK232

PHẦN 1: XÁC SUẤT


Định lý bernoully Hàm mật độ xác suất
+∞
Thực hiện n phép thử độc lập với nhau, xác suất thành công của một phép  ∫−∞ f(x)dx = 1 Một số trường hợp hay dùng
thử không đổi là p. Xác suất có đúng k phép thử thành công trong n lần thử  P(X = a) = f(a)
 f(x) ≥ 0 a
là  P(X ≤ a) = ∫−∞ f(x)dx =
 P(X = xi) ≈ 0 (gần bằng 0)
Cnk pk . (1 − p)n−k b +∞
 P(a ≤ X ≤ b)=∫a f(x) dx 1 − ∫a f(x)dx
Công thức xác suất đầy đủ +∞
Cho {A1, A2, A3} là hệ biến cố đầy đủ khi đó  P(X ≥ a) = ∫a f(x)dx =
a
P(A1)+P(A2)+P(A3) = 1 1 − ∫−∞ f(x)dx
F F b
P(F) = P(A1). P ( ) + P(A2). P ( )  P(a ≤ X ≤ b) = ∫a f(x)dx
A1 A2
F Tính chất hay thi:
+ P(A3). P ( )
A3 Tính chất của E(X) Tính chất phương sai D(X)
Công thức Bayes  E(aX + b) = aE(X) + b  D(aX + b) = a2 D(X)
F  E(X + Y) = E(X) + E(Y)  D(X + Y) = D(X) +
Ai P(Ai ). P ( )
Ai
P( ) = Với i = 1,2,3..  E(X. Y) = E(X). E(Y) nếu D(Y) nếu X và Y độc lập
F P(F) X, Y là 2 biến cố độc lập  D(X − Y) = D(X + Y)

Phân phối mũ Phân phối nhị thức


Biến ngẫu nhiên X có phân phối mũ khi có hàm mật độ có dạng Đại lượng ngẫu nhiên X có phân phối nhị thức thì
−λx 𝑃(𝑋 = 𝑘) = 𝐶𝑛𝑘 𝑝𝑘 . (1 − 𝑝)𝑛−𝑘
f(x) = {λe , x ≥ 0
0, x<0 Kí hiệu: : 𝑋~𝐵(𝑛, 𝑝)
1
Trong đó: λ = E(X); Ký hiệu: X~E(λ) Một số tính chất 𝐸(𝑋) = 𝑛𝑝, 𝐷(𝑋) = 𝑛𝑝(1 − 𝑝)
Lưu ý:
Lưu ý cần nhớ
1  Nếu n rất lớn (n>30) và p ≤ 5% ta xấp sỉ phân phối nhị
 D(X) = λ2 thức về phân phối Poisson. Với 𝜆 = 𝐸(𝑋) = 𝑛𝑝
ln(2)
 Med(X) = λ  Nếu n rất lớn (n>30) và p > 5% ta xấp sỉ phân phối nhị
Đặc biệt: Y = min{𝑋1 , 𝑋2 , 𝑋3 , … 𝑋𝑛 } => λ = λ1 + ⋯ + λn thức về phân phối chuẩn. Với 𝑎 = 𝐸(𝑋) = 𝑛𝑝 , 𝜎 2 =
Phân phối Poisson 𝐷(𝑋) = 𝑛𝑝(1 − 𝑝), nhưng khác là phải tính theo công
Biến ngẫu nhiên rời rạc X có phân phối Poisson thức PP chuẩn hiệu chỉnh sau 𝑃(𝑚 ≤ 𝑋 ≤ 𝑛) =
n+0,5−a m−0,5−a
e −λ .λk Φ( σ )− Φ( σ )
P(X = k) = k! , kí hiệu: X~P(λ). Trong đó E(X) = D(X) = λ
Đặc biệt:𝑌 = 𝑋1 + 𝑋2 + 𝑋3 + ⋯=> λ = λ1 + λ2 + ⋯ + λn Đặc biệt: 𝑥1 ~𝐵(𝑛1 ; 𝑝),𝑋2 ~𝐵(𝑛2 ; 𝑝), 𝑋3 ~𝐵(𝑛3 ; 𝑝),….. 𝑋𝑛 ~𝐵(𝑛𝑛 ; 𝑝)
Phân phối chuẩn thì 𝑌 = 𝑋1 + 𝑋2 + 𝑋2 + ⋯ 𝑋𝑛 thì 𝑋𝑛 ~𝐵(𝑛1 + 𝑛2 + ⋯ + 𝑛𝑛 ; 𝑝)
1 (x−a)2

f(x) = e 2σ2 Phân phối đều
σ√2π Đại lượng ngẫu nhiên X gọi là có phân phối đều trên đoạn [a, b] nếu
Trong đó: a=E(X), σ2 = D(X), Kí hiệu: X~N(a, σ2 ) hàm mật độ của X là
Hàm phân phối xác suất của biến cố ngẫu nhiên có phân phối chuẩn chỉnh 1
tắc , 𝑥 ∈ [𝑎, 𝑏]
x 𝑓(𝑥) = {𝑏 − 𝑎
1 −t2 0, 𝑥 ≠ [𝑎, 𝑏]
F(x) = Φ(x) = ∫ e 2 dt
−∞ √2π 𝑎+𝑏 (𝑏−𝑎)2
n (x−a)2
Kí hiệu: 𝑋~𝑈(𝑎, 𝑏) và 𝐸(𝑋) = 2 , 𝐷(𝑋) = 12
1 −
P(m ≤ X ≤ n) = ∫ e 2σ2 dx Phân phối siêu bội
m σ√2π Cho đại lượng ngẫu nhiên X gọi là phân phối siêu bội nếu tồn tại các
n−a
σ 1 −x2 n−a m−a số tự nhiên M, N sao cho 𝑛 ≤ 𝑀 ≤ 𝑁 thỏa
= ∫m−a e 2 dx = Φ ( ) − Φ( )
√2π σ σ 𝐶𝑀𝑘 𝐶𝑁−𝑀
𝑛−𝑘
σ 𝑃(𝑋 = 𝑘) =
Cách bấm máy tính tìm 𝚽(𝐚) 𝐶𝑁𝑛
𝑁−𝑛
Casio 570, Vinacal Casio 580 Kí hiệu: 𝑋~𝐻(𝑁, 𝑀, 𝑛), 𝐸(𝑋)~𝑛𝑝, 𝐷(𝑋) = 𝑛𝑝𝑞 𝑁−1
𝑀
Với: 𝑝 = , 𝑞 = 1 − 𝑝
Step1: Bật tính năng thống Step 1: Bật tính năng thống kê 𝑁
kê Menu → 6 → AC Định lý giá trị trung bình
Mode →3→ 1→ AC Step2: Tìm 𝛷(𝑎) Cho các biến ngẫu nhiên 𝑥1 + x2 + 𝑥3 + ⋯ x𝑛 có cùng quy luật phân
Step2: Tìm 𝛷(𝑎) Option → 𝛻 → 4 phối bất kì và có cùng kì vọng a=E(X) và phương sai 𝜎 2.
Nhấn Shift →1→ 5 → 1 Nhập P(a)  Với BNN Y = 𝑥1 + x2 + 𝑥3 + ⋯ x𝑛 thì BNN Y sẽ có quy
(P) luật phân phối chuẩn 𝑌~𝑁(𝑛. 𝑎; n. 𝜎 2 ).
𝑥 +x +𝑥 +⋯x𝑛
Nhập P(a)  Với BNN Y=𝑌 = 1 2 𝑛3 thì BNN Y sẽ có quy luật
Đặc biệt: 𝑌 = 𝑋1 + 𝑋2 + 𝑋3 + ⋯ đều là PP chuẩn thì 𝑌~𝑁 (𝑎1 + 𝑎2 + phân phối chuẩn là 𝑌~𝑁(𝑎; 𝜎 2 /𝑛)
𝑎3+. . , 𝜎12 + 𝜎22 + 𝜎32 +. . )
PHẦN 2: THỐNG KÊ: Nhắc cách tra bảng:
Tính 𝑧𝛼/2 dùng bảng phân phối chuẩn tra Tính 𝑧𝛼 dùng bảng phân phối chuẩn tra Tính 𝑡𝛼;𝑛−1 dùng bảng Student tra giá trị tại hàng n-
2
ngược giá trị, sao cho: Φ (𝑧𝛼 ) = 1 − 𝛼/ ngược giá trị, sao cho 𝛼
1 và cột 2
2 Φ(𝑧𝛼 ) = 1 − 𝛼 = 𝛽
Tính 𝑡𝛼;𝑛−1 dùng bảng Student tra giá trị Tính 𝜘𝛼2;𝑛−1 dùng bảng chi bình phương tại Tính 𝑓𝛼 𝑘 − 1; 𝑁 − 𝑘 bằng các tra bảng fisher với
tại hàng n-1 và cột 𝛼 2
𝛼 mức ý nghĩa 𝛼, cột 𝑘 − 1 và hàng 𝑁 − 𝑘
hàng n-1 cột 2

Khoảng tin cậy, ước lượng Bài toán ngược tìm n

Dạng Điều kiện Loại Khoảng tin cậy (khoảng ước lượng) Dạng Điều kiện Khoảng tin cậy (khoảng ước lượng)
Tỷ lệ Đối √𝑓(1−𝑓) Bài Đã cho 𝜎 2 𝜎 2
𝑝 ∈ ( 𝑓 − 𝜀; 𝑓 + 𝜀 ) với 𝜀 = 𝑧𝛼/2 . 𝑛 = (𝑧𝛼/2 . )
xứng √𝑛 toán 𝜀
𝜎 𝑠 2
Trung Biết 𝜎 2 , phân 𝜇 ∈ (𝑥 − 𝜀; 𝑥 + 𝜀 ) với 𝜀 = 𝑧𝛼/2 . trung Chưa cho
√𝑛 𝑛 = (𝑧𝛼/2 . )
bình phối chuẩn bình 𝜎2 𝜀
𝑠 𝑧𝛼 √𝑓(1−𝑓) 2
Chưa biết 𝜎 2, 𝜇 ∈ ( 𝑥 − 𝜀; 𝑥 + 𝜀 ) với 𝜀 = 𝑡𝛼;𝑛−1 . Tỷ lệ đã biết 𝑓
tìm được s và 2 √𝑛
𝑛=( 2 )
𝜀
n < 30, phân
chưa biết 𝑓 𝑧𝛼/2 2
phối chuẩn 𝑛=( ) . 0,25
𝑠 (thường thi 𝜀
Chưa biết 𝜎 2 , 𝜇 ∈ (𝑥 − 𝜀; 𝑥 + 𝜀) với 𝜀 = 𝑧𝛼/2 .
√𝑛 hơn)
tìm được s và
n ≥30 Lưu ý: n làm tròn lên
Phương Tìm được s Chỉ thi (𝑛 − 1)𝑠 2 (𝑛 − 1)𝑠 2
sai đối 𝜎2 ∈ ( ; 2 )
𝜘𝛼2 𝜘 𝛼
xứng ;𝑛−1 1− ;𝑛−1
2 2
Kiểm định tỉ lệ một mẫu

Giả thuyết 𝐻𝑜 Giả thuyết đối 𝐻1 Tiêu chuẩn kiểm định Miền bác bỏ
𝑝 = 𝑝𝑜 𝑝 ≠ 𝑝𝑜 𝑓 − 𝑝𝑜 𝑅𝑅 = (−∞; −𝑧𝛼 ) ∪ (𝑧𝛼 ; +∞)
𝑍𝑞𝑠 = 2 2
𝑝 = 𝑝𝑜 hoặc 𝑝 ≤ 𝑝𝑜 𝑝 > 𝑝𝑜 √𝑝𝑜 (1 − 𝑝𝑜 ) RR=(𝑧𝛼 ; +∞)
𝑝 = 𝑝𝑜 hoặc 𝑝 ≥ 𝑃𝑜 𝑝 < 𝑝𝑜 𝑛 RR=(−∞; −𝑧𝛼 )
Kiểm định trung bình một mẫu

Dạng Giả thuyết Giả thuyết đối 𝐻1 Tiêu chuẩn kiểm Miền bác bỏ 𝐻𝑜
𝐻𝑜 định
Có phân phối chuẩn 𝜇 = 𝜇𝑜 𝜇 ≠ 𝜇𝑜 𝑥 − 𝜇𝑜 𝑅𝑅 = (−∞; −𝑧𝛼 ) ∪ (𝑧𝛼 ; +∞)
và đã biết 𝜎 2 𝑍𝑞𝑠 = 2 2
𝜇 > 𝜇𝑜 𝜎/√𝑛 RR=(𝑧𝛼 ; +∞)
𝜇 < 𝜇𝑜 RR=(−∞; −𝑧𝛼 )
Có phân phối chuẩn 𝜇 = 𝜇𝑜 𝜇 ≠ 𝜇𝑜 𝑥 − 𝜇𝑜 𝑅𝑅 = (−∞; −𝑡𝛼;𝑛−1 ) ∪ (𝑡𝛼;𝑛−1 ; +∞)
và chưa biết 𝑇𝑞𝑠 = 2 2
𝜇 > 𝜇𝑜 𝑠/√𝑛 RR=(𝑡𝛼;𝑛−1 ; +∞)
𝜎 2 , 𝑛 < 30
𝜇 < 𝜇𝑜 RR=(−∞; −𝑡𝛼;𝑛−1 )
Có phân phối tùy ý 𝜇 ≠ 𝜇𝑜 𝑥 − 𝜇𝑜 𝑅𝑅 = (−∞; −𝑧𝛼 ) ∪ (𝑧𝛼 ; +∞)
chưa biết 𝜎 2 , 𝑛 ≥ 𝑍𝑞𝑠 = 2 2
𝜇 > 𝜇𝑜 𝑠/√𝑛 RR=(𝑧𝛼 ; +∞)
30
𝜇 < 𝜇𝑜 RR=(−∞; −𝑧𝛼 )
Kiểm định tỉ lệ 2 mẫu

Giả thuyết Giả thuyết đối Tiêu chuẩn kiểm định Miền bác bỏ
𝐻𝑜 𝐻1
𝑓1 −𝑓2 𝑚1 +𝑚2 𝑛 𝑛 𝑅𝑅 = (−∞; −𝑧𝛼 ) ∪ (𝑧𝛼 ; +∞)
𝑝1 = 𝑝2 𝑝1 ≠ 𝑝2 𝑍𝑞𝑠 = Với 𝑓 = ; 𝑛 = 𝑛 1+𝑛2
𝑛1 +𝑛2 2 2
√𝑓(1−𝑓) 1 2
𝑝1 = 𝑝2 𝑝1 > 𝑝2 𝑛 RR=(𝑧𝛼 ; +∞)
𝑝1 = 𝑝2 𝑝1 < 𝑝2 RR=(−∞; −𝑧𝛼 )
Kiểm định trung bình 2 mẫu

Dạng Giả Giả thuyết đối 𝐻1 Tiêu chuẩn kiểm định Miền bác bỏ 𝐻𝑜
thuyết
𝐻𝑜
X, Y Có phân phối 𝜇1 𝜇1 ≠ 𝜇2 𝑥1 − 𝑥2 𝑅𝑅 = (−∞; −𝑧𝛼 ) ∪ (𝑧𝛼 ; +∞)
chuẩn và đã biết = 𝜇2 𝑍𝑞𝑠 = 2 2
𝜇1 > 𝜇2 𝜎2 𝜎2 RR=(𝑧𝛼 ; +∞)
𝜎12, 𝜎22 (z-test) √ 1+ 2
𝜇1 < 𝜇2 𝑛1 𝑛2 RR=(−∞; −𝑧𝛼 )
Có phân phối chuẩn 𝜇1 𝜇1 ≠ 𝜇2 𝑥1 −𝑥2 𝑅𝑅 = (−∞; −𝑡𝛼;𝑛 ) ∪ (𝑡𝛼;𝑛 ; +∞)
𝑇𝑞𝑠 = 2 1 +𝑛2 −2 2 1 +𝑛2 −2
và chưa biết 𝜎12, 𝜎22 , = 𝜇2 𝑠2 𝑠2
√ 𝑝+ 𝑝
𝜇1 > 𝜇2 RR=(𝑡𝛼;𝑛1+𝑛2−2 ; +∞)
và cho biết rằng 𝑛1 𝑛2

𝜎12= 𝜎22 , 𝑛1 , 𝑛2 ≤ 30 𝜇1 < 𝜇2 RR=(−∞; −𝑡𝛼;𝑛1+𝑛2−2 )


(t-test)
(𝑛1 −1)𝑠12 + (𝑛2 −1)𝑠22
với 𝑠𝑝2 =
𝑛1 +𝑛2 −2

Có phân phối chuẩn 𝜇1 𝜇1 ≠ 𝜇2 𝑥1 −𝑥2 𝑅𝑅 = (−∞; −𝑡𝛼;𝑣 ) ∪ (𝑡𝛼;𝑣 ; +∞)


𝑇𝑞𝑠 = 2 2
và chưa biết 𝜎12, 𝜎22 , = 𝜇2 𝑠2 𝑠2
√ 1+ 2
và cho biết rằng 𝜎12 ≠ 𝑛1 𝑛2

𝜎22 , 𝑠2 𝑠 2 2
( 1+ 2)
𝑛1 𝑛2
𝑛1 , 𝑛2 ≤ 30 𝜇1 > 𝜇2 𝑣= (làm tròn, dùng để tìm RR=(𝑡𝛼;𝑣 ; +∞)
2 2
(t-test) 𝜇1 < 𝜇2 𝑠2 𝑠2 RR=(−∞; −𝑡𝛼;𝑣 )
( 1) ( 2)
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1
RR)
𝑠
Lưu ý, để kiểm tra 𝜎12= 𝜎22 hay 𝜎12 ≠ 𝜎22 khi biết 𝑠1 và 𝑠2 , ta tính nếu 𝑠1 ∈ [0,5; 2] thì 𝜎12= 𝜎22 và ngược lại
2
Có phân phối tùy ý 𝜇1 𝜇1 ≠ 𝜇2 𝑥1 − 𝑥2 𝑅𝑅 = (−∞; −𝑧𝛼 ) ∪ (𝑧𝛼 ; +∞)
và chưa biết 𝜎12, 𝜎22 = 𝜇2 𝑍𝑞𝑠 = 2 2

và 𝑛1 , 𝑛2 ≥ 30 𝜇1 > 𝜇2 𝑠2 𝑠22 RR=(𝑧𝛼 ; +∞)


𝜇1 < 𝜇2 √ 1 + RR=(−∞; −𝑧𝛼 )
(z-test) 𝑛1 𝑛2

Phân tích phương sai Anova, LSD test và khoảng tin cậy LSD
Phương tích phương sai Anova Mối quan hệ giữa SSB, SSW, SST: 𝑆𝑆𝑇 = 𝑆𝑆𝑊 + 𝑆𝑆𝐺
Step 1:Giả thuyết kiểm định  Tính phương sai toàn bộ:𝑀𝑆𝑇 = 𝑁−1
𝑆𝑆𝑇

𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 𝑀𝑆𝐵
𝐻1 : ∃𝜇𝑖 ≠ 𝜇𝑗 (tồn tại ít nhất 1 cặp trung bình tổng thể khác nhau)  Tính tiêu chuẩn kiểm định F là ∶ 𝐹 =
𝑀𝑆𝑊
𝑆𝑆𝐵
Step 2: Miền bác bỏ 𝐻0: 𝑅𝑅 = ((𝑓𝛼 𝑘 − 1; 𝑁 − 𝑘); +∞)  Hệ số xác định: 𝑅2 = 𝑆𝑆𝑇 𝑥100%
Xác định 𝑓𝛼 𝑘 − 1; 𝑁 − 𝑘 bằng các tra bảng fisher với mức ý nghĩa 𝛼, cột LSD test
𝑘 − 1 và hàng 𝑁 − 𝑘 (N là kích thước mẫu gộp) Ta phải kiểm tra từng cặp mẫu theo quy trình sau (𝐶𝑘2 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝)
Step 3: Tính tiêu chuẩn kiểm định 𝐹 Giả thuyết
Source Tổng bình Bậc Phương sai Tiêu chuẩn  𝐻0: 𝜇𝑖 = 𝜇𝑗
of phương tự kiểm định 𝐹  𝐻1 : 𝜇𝑖 ≠ 𝜇𝑗
groups chêch lệch do Giả thuyế 𝐻0 được bác bỏ nếu |𝑥̅𝑖 − 𝑥̅𝑗 | > 𝐿𝑆𝐷𝑖;𝑗 với
Between SSB (sstr) k-1 Phương sai giữa các 𝑀𝑆𝐵
𝑆𝑆𝐵 𝐹= 1 1
𝐿𝑆𝐷𝑖;𝑗 = 𝑡𝛼;(𝑁−𝑘) ∗ √𝑀𝑆𝑊(𝑛 + 𝑛 ) (gọi là giá trị thống kê kiểm định)
groups nhóm: 𝑀𝑆𝐵 = 𝑀𝑆𝑊
𝑘−1 2 𝑖 𝑗
𝑡𝛼 𝛼
Within SSW (sse) N- Phương sai trong nội bộ Cách tính: ; (𝑁 − 𝑘): Tra bảng student tại cột 2 và hàng N-k
𝑆𝑆𝑊 2
groups k nhóm: 𝑀𝑆𝑊 = 𝑁−𝑘 2𝑀𝑆𝑊
Thường bài toán sẽ cho 𝑛𝑖 = 𝑛𝑗 = 𝑛 thì 𝐿𝑆𝐷𝑖;𝑗 = 𝑡𝛼;(𝑁−𝑘) ∗ √
Total SST N- N là kích thước mẫu gộp, 2 𝑛
1 k là số mẫu khảo xác Kết luận:
 |𝑥̅𝑖 − 𝑥̅𝑗 | > 𝐿𝑆𝐷𝑖;𝑗 thì bác bỏ 𝐻0 có nghĩa là 𝜇𝑖 ≠ 𝜇𝑗
𝑖=𝑘,𝑗=𝑛𝑘

𝑖,𝑗=1
𝑥𝑖𝑗 o 𝑥̅𝑖 > 𝑥̅𝑗 kết luận 𝜇𝑖 > 𝜇𝑗
Trung bình chung của k mẫu :𝑥̅ = 𝑁 o 𝑥̅𝑖 < 𝑥̅𝑗 kết luận 𝜇𝑖 < 𝜇𝑗
Tính chêch lệch bình phương giữa các nhóm SSB (hay SSG hoặc SSTr)  |𝑥̅𝑖 − 𝑥̅𝑗 | ≤ 𝐿𝑆𝐷𝑖;𝑗 thì không kết luận được có sự khác
𝑘
biệt giữa 𝜇𝑖 , 𝜇𝑗
𝑆𝑆𝐵 = ∑ 𝑛𝑖 (𝑥̅𝑖 − 𝑥̅ )2
Khoảng ước lượng LSD với độ tin cậy 1-𝜶
𝑖=1
̅̅̅1 − 𝑥̅ )2 + 𝑛2 (𝑥
= 𝑛1 (𝑥 ̅̅̅2 − 𝑥̅ )2 + ⋯ + 𝑛𝑘 (𝑥
̅̅̅𝑘 − 𝑥̅ )2 Ta phải kiểm tra từng cặp mẫu theo quy trình sau (𝐶𝑘2 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝)
Tính tổng chêch lệch bình phương trong nội bộ mẫu SSW (hay SSE) Xác định khoảng ước lượng LSD cho độ chênh lệch (𝜇𝑖 − 𝜇𝑗 ):
Mẫu 1 … Mẫu k (𝑥̅𝑖 − 𝑥̅𝑗 ) ± 𝐿𝑆𝐷𝑖;𝑗
𝑘 … 𝑘 2𝑀𝑆𝑊
2 2 Với giá trị thống kê kiểm định 𝐿𝑆𝐷𝑖;𝑗 = 𝑡𝛼;(𝑁−𝑘) ∗ √
𝑆𝑆1 = ∑(𝑥1𝑗 − ̅̅̅)𝑥1 𝑆𝑆𝑘 = ∑(𝑥𝑘𝑗 − ̅̅̅) 𝑥𝑘 2 𝑛
𝑖=1 𝑖=1 Kết luận
Bấm máy: 𝑆𝑆1 = 𝑠12 . (𝑛1 − Bấm máy: 𝑆𝑆𝑘 = 𝑠𝑘2 . (𝑛𝑘 − 1)  Nếu khoảng ước lượng chứa số 0 thì không kết luận được
1) có sự khác biệt giữa 𝜇𝑖 , 𝜇𝑗
Tính tổng chêch lệch bình phương toàn bộ SST (biến thiên toàn phần)  Nếu khoảng ước lượng không chứa số 0 thì ta nói có sự
𝑖=𝑘,𝑗=𝑛𝑘 khác biệt giữa hai giá trị trung bình 𝜇𝑖 và 𝜇𝑗
2
𝑆𝑆𝑇 = ∑ (𝑥𝑖𝑗 − 𝑥̅ ) o (𝑥̅𝑖 − 𝑥̅𝑗 ) ± 𝐿𝑆𝐷𝑖;𝑗 < 0: 𝜇𝑖 < 𝜇𝑗
𝑖,𝑗=1 o (𝑥̅𝑖 − 𝑥̅𝑗 ) ± 𝐿𝑆𝐷𝑖;𝑗 > 0: 𝜇𝑖 > 𝜇𝑗
Còn tiếp xem ở bên tay phải nhen
Hồi quy tính tuyến

1.Đặc trưng của mẫu: 2.Ước lượng hệ số đường hồi quy 3.Tìm covarian, hệ số tương quan mẫu, hệ s
1 1
 𝑥̅ = ∑𝑛𝑖=1 𝑥𝑖 , 𝑠𝑥2 = ∑𝑛𝑖=1(𝑥𝑖 − Phương trình hồi quy có dạng 𝑹𝟐
𝑛 𝑛−1 ̂0 + ̂
1 𝑦̂ = 𝛽 𝛽1 𝑥 hoặc 𝑦̂ = 𝑎 + 𝑏𝑥 (tùy thầy cô kí hiệu khác và ý nghĩa
𝑥̅ )2 , 𝑠̂𝑥2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 nhau) a/ Hiệp phương sai covarian
𝑛
1
 𝑦̅ = ∑𝑛𝑖=1 𝑦𝑖 và 𝑠𝑦2 = 𝑛 1 𝑛 𝑛 𝐶𝑜𝑣(𝑥, 𝑦) = 𝑥𝑦 ̅̅̅ − 𝑥̅ . 𝑦̅
𝑛 𝑆𝑥𝑦 𝑥𝑦 ̅̅̅ − 𝑥̅ . 𝑦̅ ∑𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛 ∑𝑖=1 𝑥𝑖 . ∑𝑖=1 𝑦𝑖
b/ Hệ số tương quan mẫu
1
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 , 𝑠̂𝑦2 = ̂
𝛽1 = 𝑏 = = =
𝑛−1 𝑆𝑥𝑥 𝑛 − 1 . 𝑠 2 𝑛 2 (∑𝑛𝑖=1 𝑥𝑖 )2Cho hai biến X, Y để xác định mối quan hệ
1 𝑛 𝑛 𝑥 ∑ 𝑥 −
∑ (𝑦 − 𝑦̅)2 𝑖=1 𝑖 𝑛 giữa X và Y có tuyến tính hay không ta sẽ
𝑛 𝑖=1 𝑖 ̂
̅̅̅ 1 { 𝛽0 = 𝑎 = 𝑦̅ − ̂𝛽1 . 𝑥̅ học một đại lượng để đo mức độ phụ thuộc
 𝑥 2 = ∑𝑛𝑖=1 𝑥𝑖2
𝑛
1
Kết luận: Ta có phương trình hồi quy có 𝑦̂ = ̂
𝛽1 𝑥 + ̂
𝛽0 hoặc tuyến tính giữa X và Y là 𝑟𝑥𝑦
 ̅̅̅ = ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖
𝑥𝑦 𝑦̂ = 𝑏𝑥 + 𝑎 ̅̅̅ − 𝑥̅ 𝑦̅
𝑥𝑦 𝑆𝑥𝑦
𝑛
Lưu ý: ̂
𝛽0 còn được gói là bình phương bé nhất cho hệ số 𝑟𝑥𝑦 = =
 𝑆𝑥𝑥 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = (𝑛 − 𝑠̂𝑥 𝑠̂𝑦 √𝑆𝑥𝑥 . 𝑆𝑦𝑦
(∑𝑛 𝑥 )
2 chặn của đường thẳng hồi quy (hay hỏi) 1 𝑛
 𝑠̂𝑥 = ∑ (𝑥𝑖 − 𝑥̅ ) = ̅̅̅
2 2
1)𝑠𝑥2 = ∑𝑛𝑖=1 𝑥𝑖2 − 𝑖=1𝑛 𝑖 𝑛 𝑖=1 𝑥 2 − (𝑥̅ )2
1
 𝑆𝑦𝑦 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 = (𝑛 −  𝑠̂𝑥 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = ̅̅̅
2
𝑥 2 − (𝑥̅ )2
2
(∑𝑛 𝑦) Chú ý: −1 ≤ 𝑟𝑥𝑦 ≤ 1
1)𝑠𝑦2 = ∑𝑛𝑖=1 𝑦𝑖2 − 𝑖=1𝑛
Kết luận:
 𝑆𝑥𝑦 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = |𝑟𝑥𝑦 | ≤ 0.3: không có mối quan hệ tuyến tính hoặc mối
1
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑦𝑖 quan hệ tuyến tính rất yếu
𝑛 0.3 < |𝑟𝑥𝑦 | ≤ 0.5: X, Y có mối quan hệ tuyến tính rất yếu
0.5 < |𝑟𝑥𝑦 | ≤ 0.8: X, Y có quan hệ tuyến tính trung bình
0.8 < |𝑟𝑥𝑦 |: X, Y có quan hệ tuyến tính mạnh.
Ngoài ra, nếu |𝑟𝑥𝑦 | < 0 hàm nghịch biến, |𝑟𝑥𝑦 | > 0 hàm
đồng biến
4.Ước lượng độ lệch chuẩn 𝝈 ( sai số 5.Hệ số xác định 𝑹𝟐 6.Tìm khoảng tin cậy cho các hệ số 𝟎 , 𝟏củ
chuẩn), phương sai 𝟐 của 𝜷
̂𝟏 Tổng bình phương toàn phần có ý nghĩa đo mức độ biến quy tuyến tính.
  (độ lệch chuẩn) có ước lượng là động các giá trị 𝑦𝑖 xung quang giá trị trung bình 𝑦̅ a/Khoảng tin cậy cho tung độ gốc 0 (hệ
𝑛
𝑆𝑆𝐸 số chặn) là (0 − 𝜀0 ; 0 + 𝜀0 )
𝜎̂ = √𝑛−2 𝑆𝑆𝑇 = 𝑆𝑦𝑦 = ∑(𝑦𝑖 − 𝑦̅)2 = (𝑛 − 1)𝑠𝑦2 Với
  (phương sai) có ước lượng là
2 𝑖=1
𝑛 ̅̅̅
̂2 = 𝑆𝑆𝐸 (∑𝑛𝑖=1 𝑦 )2 𝑛−2 √
𝑥 2 𝑆𝑆𝐸
𝜎 = ∑ 𝑦𝑖2 − 𝜀0 = 𝑡𝛼/2 .
𝑛−2 𝑆𝑥𝑥 𝑛 − 2
Thể hiện sự biến thiên của các giá 𝑛
𝑖=1
trị y quan xác được với giá trị y Tổng bình phương sai số do sự khác biệt giữa đường hồi 1 ̅̅̅
𝑥 2 𝑆𝑆𝐸
ước lượng được quy mẫu và trung bình 𝑦̅ = 𝑡𝛼𝑛−2 . √
𝑛 2 𝑠̂𝑥 𝑛(𝑛 − 2)
𝑆𝑆𝑅 = ∑(𝑦̂𝑖 − 𝑦̅) = ̂ 2
𝛽1 . 𝑆𝑥𝑦 Cách tính:
1
𝑖=1  ̅̅̅
𝑥 2 = 𝑛 ∑𝑛𝑖=1 𝑥𝑖2
Tổng bình phương sai số ước lượng có ý nghĩa đô sự chêch 1
lệch giữa từng giá trị quan sát với giá trị dự đoán  𝑠̂𝑥 2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = ̅̅̅
𝑥 2 − (𝑥̅ )2
𝑆𝑆𝐸 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂)𝑖
2
(xem live để dễ hiểu)  𝑛−2
𝑡𝛼/2 tra bảng Student hàng n-2 cột 𝛼/2
Mối quan hệ: 𝑆𝑆𝑇 = 𝑆𝑆𝑅 + 𝑆𝑆𝐸 b/Khoảng tin cậy cho hệ số góc 1 là
Hệ số xác định 𝑅2 (1 − 𝜀1 ; 1 + 𝜀1 )
𝑆𝑆𝑅 𝑆𝑆𝐸 Với
𝑅2 = . 100% = (1 − ) . 100% = 𝑟𝑥𝑦 2
. 100%
𝑆𝑆𝑇 𝑆𝑆𝑇
2
Hệ số 𝑅 giải thích trong 100% sự biến động của Y so với 𝑛−2
𝑆𝑆𝐸
𝜀1 = 𝑡𝛼/2 √
trung bình của nó thì có bao nhiêu % là do biến X gây ra. (𝑛 − 2)𝑆𝑥𝑥

1 𝑆𝑆𝐸
= 𝑡𝛼𝑛−2 . √
2 𝑠̂𝑥 𝑛(𝑛 − 2)
Cách Casio:
Casio 570, Vinacal Casio 580
Step1: Mở tần số: Shift → Mode → ∇→ 4→ ON Step 1: Mở tần số
Step2: Nhập bảng: Mode → Thống kê (3) → 2 Shift → Menu → ∇→ 3→ 1
Nhập giá trị X và cột X , giá trị Y và cột Y và nhập xác Step2: Nhập bảng: Menu → Thống kê(6) →2(a+bx)
suất của biến đó vào cột Freq, xong rôi ấn AC Nhập giá trị X và cột X, giá trị Y và cột Y và nhập xác suất của biến đó vào cột Freq,
Step 3: Xem các đặc trưng của mẫu: Shift →1→ 4 xong rôi ấn AC
Step 4: Hồi quy tuyến tính: Xem hồi quy: AC→ 5 Step 3:Xem các đặc trưng của mẫu: Option (OPTN) → ∇→ 2
Step 4: Hồi quy tuyến tính: Xem hồi quy: Option
Tính giá trị y dự đoán tại x=a (OPTN) → ∇→ 3
AC→ 5 (ℎồ𝑖 𝑞𝑢𝑦) Tính giá trị y dự đoán tại x=a
Nhập a𝑦̂ rồi bấm bằng Option (OPTN) → ∇→ ∇→ 4 → 5 (ℎồ𝑖 𝑞𝑢𝑦)
Nhập a𝑦̂ rồi bấm bằng

Sai số chuẩn trong bài toán kiểm định chính là mẫu số trong công thức tính 𝑻𝒕𝒆𝒔𝒕 , 𝒁𝒕𝒆𝒔𝒕

You might also like