Download as pdf or txt
Download as pdf or txt
You are on page 1of 9

Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy

Thống kê toán Anh Huy

TỔNG KẾT KIẾN THỨC XÁC SUẤT THỐNG KÊ

BÀI 1: THỐNG KÊ MÔ TẢ
Tính các tham số đặc trưng mẫu: trung bình, trung vị, mốt phương sai, độ lệch chuẩn, hệ số bất đối
xứng, hệ số nhọn, hệ số biến thiên (CV),…

KIẾN THỨC CẦN NHỚ:


Tham số
Công thức Nhận xét
đặc trưng
Kích
thước n = n1 + n2 + ⋯ + nk
mẫu
Trung x1 + x2 + + ⋯ + xn x1 . n1 + x2 . n2 + ⋯ + xk . nk Trung bình, trung vị và
x̅ = hoặc
bình mẫu n n mốt là các tham số chủ
n+1 yếu đặc trung cho xu
giá trị thứ nếu n lẻ hướng trung tâm mẫu,
Trung vị xd = { 2
n n nhưng trung vị và mốt
mẫu TB cộng của giá trị thứ và ( + 1) nếu n chẵn
2 2 không san bằng, bù trừ
* Lưu ý: Khi tìm trung vị dãy số phải được sắp xếp tăng dần. chênh lệch giữa các giá trị
của mẫu, do đó nó bổ
sung hoặc thay thế trung
Mốt mẫu x0 là giá trị có tần số/ xác suất lớn nhất bình mẫu khi việc tính
trung bình mẫu gặp khó
khắn
Phương 2
x1 2 . n1 + x2 2 . n2 + ⋯ + xk 2 . nk − n. x̅ 2 Bài yêu cầu tính Độ phân
sai mẫu s = tán, độ biến động, độ dao
n−1
động, độ rủi ro cũng chính
là tính phương sai (hoặc
độ lệch chuẩn). Nếu đơn
Độ lệch
vị không có ^2 thì tính độ
chuẩn s = √s 2 lệch chuẩn, có ^2 thì tính
mẫu
phương sai. Nếu không có
đơn vị thì tính 1 trong 2
đều được.
Hệ số biến thiên được đo
bằng % và dùng để nhận
xét về độ thuần nhất của
phân phối mẫu và qua đó
Hệ số s đo mức độ đại diện của
biến thiên cv = | | . 100(%)
x̅ trung bình mẫu cho xu
mẫu
hướng trung tâm của phân
phối. Nếu CV<15% thì
mẫu được xem là khá
thuần nhất
Khoảng Khoảng tứ phân vị tuy đã
biến thiên R = xmax − xmin nhạy cảm hơn đối với số
mẫu liệu mẫu so với khoảng
Khoảng Q là giá trị nằm ở vị trí n biến thiên song nó chỉ có
1
tứ phân 4 nhiều ý nghĩa khi so sánh
vị mẫu Q 2 là trung vị hai mẫu, còn với từng
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

3n mẫu thì cũng không có


Q3 là giá trị nằm ở vị trí 4
nhiều ý nghĩa đặc trưng
* Lưu ý: Khi tìm khoảng tứ phân vị dãy số phải được sắp xếp
tăng dần.
Còn được ký hiệu là Sk
(Skewness)
Giá trị của hệ số bất đối
xứng càng gần 0 thì phân
phối thực nghiệm của các
giá trị của mẫu càng đối
xứng qua giá trị trung
bình mẫu
Hệ số bất (xi − x̅)3 a3 < 0 => Phân phối lệch
đối xứng ∑ni=1
a 3 = Sk = n trái (lệch âm) và trung
mẫu s3 bình<trung vị<mốt
a3 > 0 => Phân phối lệch
phải (lệch dương) và trung
bình>trung vị>mốt
a3 = 0 => Phân phối
chuẩn (Đối xứng, hình
chuông) và trung
bình=trung vị=mốt
Nếu bài cho là K
(Kurtosis) thì đây gọi là
Hệ số (xi − x̅)4 hệ số nhọn hiệu chỉnh = a4
nhọn ∑ni=1 -3
a4 = n
mẫu s 4 Khi mẫu gần phân phối
chuẩn thì a4 ≈ 3 (hay K ≈
0)
r < 0 => x, y tương quan
âm (ngược chiều)
r > 0 => x, y tương quan
dương (cùng chiều)
Hệ số r = 0 => x, y không tương
tương ∑ni=1(xi − x̅)(yi − y̅) quan
r=
quan √∑ni=1(xi − x̅)2 √∑ni=1(yi − y̅)2 |r| > 0,5 => x, y tương
mẫu quan chặt chẽ
|r| < 0,5 => x, y tương
quan không chặt
|r| = 0,5 => x, y có mức
độ tương quantrung bình
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

BÀI 2: BIẾN CỐ VÀ XÁC SUẤT


Các dạng bài: Tính xác suất bằng Công thức trực tiếp; Định lý Bernoulli; Định lý Cộng nhân; Công thức
đầy đủ và định lý Bayes
KIẾN THỨC CẦN NHỚ:
1. Công thức trực tiếp
𝐦 𝐒ố 𝐤ế𝐭 𝐜ụ𝐜 𝐭𝐡𝐮ậ𝐧 𝐥ợ𝐢
𝐏= =
𝐧 𝐊𝐡ô𝐧𝐠 𝐠𝐢𝐚𝐧 𝐦ẫ𝐮
* Thường dùng trong trường hợp bài toán cho SỐ LƯỢNG cụ thể.
2. Định lý Bernoulli
P = pk (1 − p)n−k Cnk
* Thường dùng trong trường hợp bài toán cho làm 1 công việc NHIỀU LẦN, xác suất không đổi.
3. Định lý Cộng nhân
P(A + B) = P(A) + P(B) P(A/B) + P(A ̅/B) = P(B/A) + P(B
̅/A)
P(A ̅) = 1 − P(A)
− P(AB) =1
P(AB) = P(A). P(B/A) ̅. B) + P(A. B) = P(B) P(AB
̅̅̅̅) = P(A
̅+B ̅)
P(A
= P(B). P(A/B)
P(AB)
P(A/B) = P(A. B ̅) + P(A. B) = P(A) P(A
̅̅̅̅̅̅̅ ̅. B
+ B) = P(A ̅)
P(B)
Đặc biệt: A, B xung khắc => P(A + B) = P(A) + P(B); P(AB) = 0; A. B = ϕ
A, B độc lập => P(A/B) = P(A); P(B/A) = P(B); P(AB) = P(A). P(B)
* Thường dùng trong trường hợp bài toán cho 2 biến cố A, B
4. Công thức đây đủ và định lý Bayes
Công thức đầy đủ: P(A) = P(H1 ). P(A/H1 ) + P(H2 ). P(A/H2 ) + ⋯
P(H1 ).P(A/H1 )
Định lý Bayes: P(H1 /A) =
P(A)
* Thường dùng cho bài toán làm lần lượt từng công việc.

BÀI 3: BIẾN NGẪU NHIÊN RỜI RẠC VÀ PHÂN PHỐI XÁC SUẤT
Các dạng bài: Lập bảng phân phối xác suất hoặc cho bảng sẵn; cho hàm mật độ xác suất hoặc tính xác
suất bằng diện tích hình học
KIẾN THỨC CẦN NHỚ:
1. Bảng phân phối xác suất
Bảng phân phối xác suất Kỳ vọng, trung bình: E(X) = x1 p1 + x2 p2 + ⋯
X x1 X2 … Phương sai V(X) = x12 p1 + x22 p2 + ⋯ − E(X)2
P p1 p2 … Độ lệch chuẩn σ(X) = √V(X)
Lưu ý: p1 + p2 + … =1
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

√V(X)
Hệ số biến thiên CV(X) = | E(X) | . 100(%)
Mốt là giá trị X có xác suất lớn nhất
* Chú ý: Bài yêu cầu tính Độ phân tán, độ biến động, độ dao động, độ rủi
ro cũng chính là tính phương sai (hoặc độ lệch chuẩn). Nếu đơn vị không
có ^2 thì tính độ lệch chuẩn, có ^2 thì tính phương sai. Nếu không có đơn
vị thì tính 1 trong 2 đều được.
2. Quy luật nhị: X~B(n; p)
Xác suất (P) Theo công thức Bernoulli P = pk (1 − p)n−k Cnk
Trung bình, kỳ vọng (E(X) = n.p)
Phương sai (V(X) = n.p(1-p))
Mốt: np + p − 1 ≤ mốt ≤ np + p
3. Quy luật Poisson: 𝐗~𝐏(𝛌)
e−λ λa
P(X = a) =
a!
4. Biến ngẫu nhiên 2 chiều: Lập bảng phân phối xác suất có điều kiện, tính E, V, COV, 𝛒,…
Lập bảng phân phối xác suất biên, bảng phân phối xác suất có điều kiện và các công thức
• E(aX ± bY ± c) = aE(X) ± bE(Y) ± c
• V(aX ± bY ± c) = V(aX ± bY) = a2 V(X) + b2 V(Y) ± 2abCOV(X, Y)
• Hiệp phương sai COV(X, Y) = E(XY) − E(X). E(Y)
Nhận xét: >0: X, Y tương quan dương (cùng chiều), <0: X, Y tương quan âm (ngược chiều), =0: X, Y độc lập
COV(X,Y)
• Hệ số tương quan ρ(X, Y) =
√V(X).√V(Y)
Nhận xét: >0: X, Y tương quan dương (cùng chiều), <0: X, Y tương quan âm (ngược chiều), =0: X, Y độc
lập.
|ρ(X, Y)| > 0,5: tương quan chặt chẽ, |ρ(X, Y)| < 0,5: tương quan không chặt chẽ)

BÀI 4: BIẾN NGẪU NHIÊN LIÊN TỤC VÀ PHÂN PHỐI XÁC SUẤT
Các dạng bài: Quy luật chuẩn; Quy luật chuẩn đặc biệt; Quy luật nhị thức; Quy luật Poisson và Mối
quan hệ giữa các quy luật
KIẾN THỨC CẦN NHỚ:
1. Hàm mật độ xác suất
Xác suất: P = ∫ f(x)dx (Cận lấy theo câu hỏi); Nếu lấy cận theo đề bài thì ∫ f(x)dx = 1
Trung bình: E(X) = ∫ xf(x)dx (Cận lấy theo đề bài)
Phương sai: V(X) = ∫ x 2 f(x)dx − E 2 (X) (Cận lấy theo đề bài)
2. Quy luật chuẩn: X~N(𝛍, 𝛔𝟐 )
b−μ a−μ
P(a < X < b) = ∅ ( ) − ∅( )
σ σ
a−μ
P(a < X) = 1 − ∅ ( )
σ
1. Quy luật chuẩn b−μ
P(X < b) = ∅ ( )
σ
a
P(|X − μ| < a) = 2∅ (σ) − 1
“Sai lệch so với trung bình không quá a”
1. Chuẩn hóa X~N(μ = 0, σ2 = 1)
2. Tổng của các biến phân phối chuẩn
2. Quy luật chuẩn đặc biệt Xi ~N(μ, σ2 ) => X1 + X2 ~N(2μ, 2σ2 )
σ2
3. Trung bình mẫu phân phối chuẩn ̅ X~N (μX̅ = μX , σ2 X̅ = X )
n
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

p.(1−p)
3. Tần suất mẫu phân phối chuẩn p̂~N (μp̂ = p, σ2 p̂ = )
n
3. Mối quan hệ giữa Nhị thức-Poisson-Chuẩn
1. Quy luật nhị thức có n ≥ 20 và p ≤ 0,1 xấp xỉ Quy luật Poisson với λ = np
p 1−p 1
2. Quy luật nhị thức có n>5 và |√1−p − √ | < 0,3
p √n
xấp xỉ Quy luật Chuẩn với μ = np, σ2 = np(1 − p)
3. Quy luật Poisson có λ > 20 xấp xỉ Quy luật Chuẩn với μ = σ2 = λ

BÀI 5: MẪU NGẪU NHIÊN


Suy diễn thống kê về trung bình mẫu hoặc tỉ lệ mẫu (Suy diễn về số lượng đưa về suy diễn tỉ lệ)
KIẾN THỨC CẦN NHỚ:
Suy diễn
Đối xứng Tối đa Tối thiểu
thống kê
σ σ σ
P (μ − zα/2 < ̅
X<μ+ zα/2 ) σ P (μ − zα < ̅
X)
Trung √n √n ̅<μ+
P (X zα ) = 1 − α √n
bình mẫu =1−α √n =1−α

√p(1 − p)
P (p − zα/2 < p̂
√n √p(1 − p) √p(1 − p)
P (p̂ < p + zα ) P (p − zα < p̂)
Tỷ lệ mẫu √p(1 − p) √n √n
<p+ zα/2 ) =1−α
√n =1−α
=1−α
Mối quan hệ giữa Z và 𝛂: Nếu có giá trị tương ứng trong bảng thì tra bảng (Bảng z là dòng
cuối cùng của bảng Quy luật Student). Nếu không có thì dùng công thức: α = 1 − ∅(z)

BÀI 6: ƯỚC LƯỢNG THAM SỐ


Dạng 1: Ước lượng không chệch, hiệu quả
KIẾN THỨC CẦN NHỚ:
E V • Bài hỏi ước lượng chệch hay không chệch, đi tính
m hoặc μ (nếu bài E
X cho tổng thể phân σ 2
• Bài hỏi ước lượng hiệu quả hay không, ước lượng
phối chuẩn) nào tốt hơn, hiệu quả hơn, đi tính V. V càng nhỏ thì càng
̅ m hoặc μ (nếu bài tốt (hiệu quả).
X (trung σ2
cho tổng thể phân
bình mẫu) n
phối chuẩn)
p̂ (tần suất p. (1 − p)
p
mẫu) n
Dạng 2: Ước lượng khoảng cho phương sai, độ lệch chuẩn, độ dao động, độ phân tán,…, Ước lượng số
lượng đưa về ước lượng tỷ lệ; Bài toán tìm kích thước mẫu mới
KIẾN THỨC CẦN NHỚ: 03 công thức Ước lượng trung bình (μ), phương sai (σ2 ), tỉ lệ (p)
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

MỘT SỐ LƯU Ý:
• Nếu bài yêu cầu ước lượng một bên tối đa/ tối thiểu thì chỉ chép công thức bên phải hoặc trái và thay
α/2 trong công thức thành α
• Nếu bài yêu cầu ước lượng độ lệch chuẩn thì đi ước lượng phương sai rồi căn bậc 2 ra.
• Nếu bài yêu cầu ước lượng Độ phân tán, độ biến động, độ dao động, độ rủi ro cũng chính là ước
lượng phương sai (hoặc độ lệch chuẩn). Nếu đơn vị không có ^2 thì ước lượng độ lệch chuẩn, có ^2
thì ước lượng phương sai. Nếu không có đơn vị thì ước lượng 1 trong 2 đều được.
02 DẠNG BÀI ĐẶC BIỆT:
• Ước lượng số lượng: Ta tìm cách chuyển về ước lượng tỉ lệ
• Tìm kích thước mẫu mới: Ta dựa vào công thức
Dạng Độ chính xác (Sai số) Kích thước mẫu mới
Ước lượng trung s (n−1) s (n−1) 2
ε= tα n ≥ ( tα )
bình (𝛍) √n 2 ε0 2
2
√p̂(1 − p̂) √p̂(1 − p̂)
Ước lượng tỉ lệ 𝐩 ε= zα n≥( zα )
√n 2 ε0 2

Độ dài khoảng tin cậy: I = 2 𝛆

BÀI 7: KIỂM ĐỊNH THAM SỐ


Dạng 1: Kiểm định 1, 2 tham số hoặc chuyển kiểm định 2 tham số về 1 tham số
KIẾN THỨC CẦN NHỚ: 06 dạng kiểm định 1 tham số và 2 tham số cho trung bình (μ), phương sai (σ2 ), tỉ
lệ (p)
Bước 1: Xác định loại kiểm định, viết cặp giả thuyết
Bước 2: Tính tiêu chuẩn kiểm định và Miền bác bỏ dựa vào bảng công thức mang vào phòng thi
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

(n −1,n2 −1)
1 1 ̂+n
n1 p1 ̂2
2p
Chú ý: f1−α = (n −1,n1 −1) và p̅ =
fα 2 n1 +n2
Nếu kiểm định độ đồng đều thì ngược dấu với phương sai (Tức độ đồng đều lớn hơn thì phương sai nhỏ hơn)
Bước 3: Kết luận
• Nếu tiêu chuẩn thỏa mãn miền bác bỏ thì kết luận là Bác bỏ H0 chấp nhận H1
• Nếu tiêu chuẩn không thỏa mãn miền bác bỏ thì kết luận là Chưa đủ cơ sở bác bỏ H0
DẠNG BÀI ĐẶC BIỆT:
• Cho 2 tham số nhưng chỉ có 1 mẫu n thì đưa về kiểm định 1 tham số
• Kiểm định về 2 trung bình tổng thể μ1 và μ2 song (n1 và n2 chưa đủ > hơn 30 để áp dụng công thức
trong tờ công thức thống kê). Ta làm như sau:
s2
1
n1 (n1 −1).(n2 −1)
Tính C = s2 2 rồi tìm ra số bậc tự do k = (n 2 +(1−C)2 (n . Sau đó trong công thức miền bác bỏ thay
1 + s2 2 −1).C 1 −1)
n1 n2
(k) (k)
zα/2 thành t α/2 và zα thành t α
Dạng 2: Đọc giá trị từ bảng EXCEL
KIẾN THỨC CẦN NHỚ:
QUY TẮC ĐỌC BẢNG EXCEL
• F-test Two-Sample for Variances có nghĩa là kiểm định 2 phương sai
F critical one-tail kết hợp với Variance để viết H1 là > hay <
• T-test Two-Sample có nghĩa là kiểm định 2 trung bình
t Critical one-tail kết hợp với Mean để viết H1 là > hay <
TUY NHIÊN nếu bài yêu cầu kiểm định không tuân thủ đúng quy tắc như trên (VD: Bảng Excel là kiểm định
phương sai nhưng bài yêu cầu kiểm định trung bình, hoặc Bảng Excel là kiểm định H1: > ,< bài yêu cầu kiểm
định H1: # THÌ ta chỉ không được dùng Pvalue bài cho, còn vẫn dùng các giá trị Mean là xngang, Variance là
s^2, Observation là n để thay vào công thức kiểm định trong tờ công thức như 1 bài bình thường.
LƯU Ý nữa là bài cho Ponetail dùng để kiểm định H1: > hoặc <, ta có thể tính Ptwotail=2.Ponetail để kiểm
định trường hợp H1: #.
Dạng 3: Tính Pvalue, Sai lầm loại 1, 2
KIẾN THỨC CẦN NHỚ:
Pvalue
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

Bước 1: Xác định loại kiểm định, viết cặp giả thuyết
Bước 2: Tính Pvalue
Kiểm định T (Kiểm định trung bình 1,2 Kiểm định Z (Kiểm định tỷ lệ 1,2 tham số)
H1
tham số)
= 2P(T n−1 > |Tqs |
≠ = 2P(Z > |Zqs |) = 2 (1 − ∅(|Zqs |))
tra bảng Quy luật Student
= P(T n−1 > |Tqs |)
> hoặc
tra bảng Quy luật Student = P(Z > |Zqs | = 1 − ∅(|Zqs |)
<
Khi n > 30 => T ≈ Z
Kiểm định 𝛘𝟐 (Kiểm định phương sai 1 Kiểm định F (Kiểm định phương sai 2
tham số) tham số)
2(n−1) 2 (n1 −1,n2 −1
= 2P(χ > χqs ) = 2P(F > Fqs )

tra bảng Quy luật Khi bình phương tra bảng Quy luật Fisher
2(n−1) 2
= P(χ > χqs ) = P(F (n1−1,n2−1 > Fqs )
>
tra bảng Quy luật Khi bình phương tra bảng Quy luật Fisher
2(n−1) 2
= P(χ < χqs ) = P(F (n1−1,n2−1 < Fqs )
<
tra bảng Quy luật Khi bình phương tra bảng Quy luật Fisher
Bước 3: So sánh Pvalue với α
Nếu Pvalue > α => Chưa đủ cơ sở bác bỏ H0
Nếu Pvalue < α => Bác bỏ H0, chấp nhận H1
Sai lầm loại I và sai lầm loại II
Sai lầm loại I là sai lầm bác bỏ H0 khi H0 đúng (Xác suất mắc sai lầm loại I chính bằng α)
Sai lầm loại II là sai lầm chưa bác bỏ H0 khi H0 sai

BÀI 8: KIỂM ĐỊNH PHI THAM SỐ


Kiểm định phân phối chuẩn, tính độc lập
KIẾN THỨC CẦN NHỚ:
Bước 1: Xác định loại kiểm định, viết cặp giả thuyết
H0: Có phân phối chuẩn / Có độc lập (không phụ thuộc)
H1: Không phân phối chuẩn / Không độc lập (có phụ thuộc)
Bước 2: Tính tiêu chuẩn kiểm định và Miền bác bỏ dựa vào bảng công thức mang vào phòng thi

Bước 3: Kết luận


• Nếu tiêu chuẩn thỏa mãn miền bác bỏ thì kết luận là Bác bỏ H0 chấp nhận H1
• Nếu tiêu chuẩn không thỏa mãn miền bác bỏ thì kết luận là Chưa đủ cơ sở bác bỏ H0

CHƯƠNG 9: PHÂN TÍCH PHƯƠNG SAI


Dạng 1: Phân tích phương sai 1 nhân tố
Bước 1: Viết cặp giả thuyết
H0: Nhân tố F không tác động đến trung bình của biến 𝑋
H1: Nhân tố F có tác động đến trung bình của biến 𝑋
Bước 2: Lập bảng phân tích phương sai để tính giá trị Fqs
Nguồn gốc SS df MS Fqs
Nhân tố F SSB 𝑘-1 𝑀𝑆𝐵 = 𝑆𝑆𝐵/(𝑘 – 1) 𝐹 = 𝑀𝑆𝐵/𝑀𝑆𝑊
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy

Yếu tố khác SSW 𝑛-𝑘 𝑀𝑆𝑊 = 𝑆𝑆𝑊/(𝑛 – 𝑘)


Tổng SST 𝑛-1

Bước 3: Kết luận:


• Nếu 𝐹qs > 𝑓𝛼(𝑘-1,𝑛-𝑘) thì kết luận là bác bỏ 𝐻0, chấp nhận H1.
• Ngược lại thì kết luận là Chưa đủ cơ sở bác bỏ H0
Dạng 2: Phân tích phương sai 2 nhân tố
Coi như 2 bài toán của dạng 1, viết 2 cặp giả thuyết tương ứng với mỗi nhân tố, tính 2 Fqs như bảng bên dưới
rồi cho ra 2 kết luận ứng với mỗi nhân tố.
Nguồn SS df MS Fqs
Nhân tố A 𝑆𝑆𝐴 ℎ-1 𝑀𝑆𝐴 = 𝑆𝑆𝐴/𝑑𝑓𝐴 𝐹𝐴 = 𝑀𝑆𝐴/𝑀𝑆𝑊
Nhân tố B 𝑆𝑆𝐵 𝑘-1 𝑀𝑆𝐵 = 𝑆𝑆𝐵/𝑑𝑓𝐵 𝐹B = 𝑀𝑆𝐵/𝑀𝑆𝑊
Khác 𝑆𝑆𝑊 n – h – k +1 𝑀𝑆𝑊 = 𝑆𝑆𝑊/𝑑𝑓𝑊
Tổng 𝑆𝑆𝑇 𝑛-1

You might also like