Professional Documents
Culture Documents
Tổng Kết Kiến Thức XSTK
Tổng Kết Kiến Thức XSTK
BÀI 1: THỐNG KÊ MÔ TẢ
Tính các tham số đặc trưng mẫu: trung bình, trung vị, mốt phương sai, độ lệch chuẩn, hệ số bất đối
xứng, hệ số nhọn, hệ số biến thiên (CV),…
BÀI 3: BIẾN NGẪU NHIÊN RỜI RẠC VÀ PHÂN PHỐI XÁC SUẤT
Các dạng bài: Lập bảng phân phối xác suất hoặc cho bảng sẵn; cho hàm mật độ xác suất hoặc tính xác
suất bằng diện tích hình học
KIẾN THỨC CẦN NHỚ:
1. Bảng phân phối xác suất
Bảng phân phối xác suất Kỳ vọng, trung bình: E(X) = x1 p1 + x2 p2 + ⋯
X x1 X2 … Phương sai V(X) = x12 p1 + x22 p2 + ⋯ − E(X)2
P p1 p2 … Độ lệch chuẩn σ(X) = √V(X)
Lưu ý: p1 + p2 + … =1
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy
√V(X)
Hệ số biến thiên CV(X) = | E(X) | . 100(%)
Mốt là giá trị X có xác suất lớn nhất
* Chú ý: Bài yêu cầu tính Độ phân tán, độ biến động, độ dao động, độ rủi
ro cũng chính là tính phương sai (hoặc độ lệch chuẩn). Nếu đơn vị không
có ^2 thì tính độ lệch chuẩn, có ^2 thì tính phương sai. Nếu không có đơn
vị thì tính 1 trong 2 đều được.
2. Quy luật nhị: X~B(n; p)
Xác suất (P) Theo công thức Bernoulli P = pk (1 − p)n−k Cnk
Trung bình, kỳ vọng (E(X) = n.p)
Phương sai (V(X) = n.p(1-p))
Mốt: np + p − 1 ≤ mốt ≤ np + p
3. Quy luật Poisson: 𝐗~𝐏(𝛌)
e−λ λa
P(X = a) =
a!
4. Biến ngẫu nhiên 2 chiều: Lập bảng phân phối xác suất có điều kiện, tính E, V, COV, 𝛒,…
Lập bảng phân phối xác suất biên, bảng phân phối xác suất có điều kiện và các công thức
• E(aX ± bY ± c) = aE(X) ± bE(Y) ± c
• V(aX ± bY ± c) = V(aX ± bY) = a2 V(X) + b2 V(Y) ± 2abCOV(X, Y)
• Hiệp phương sai COV(X, Y) = E(XY) − E(X). E(Y)
Nhận xét: >0: X, Y tương quan dương (cùng chiều), <0: X, Y tương quan âm (ngược chiều), =0: X, Y độc lập
COV(X,Y)
• Hệ số tương quan ρ(X, Y) =
√V(X).√V(Y)
Nhận xét: >0: X, Y tương quan dương (cùng chiều), <0: X, Y tương quan âm (ngược chiều), =0: X, Y độc
lập.
|ρ(X, Y)| > 0,5: tương quan chặt chẽ, |ρ(X, Y)| < 0,5: tương quan không chặt chẽ)
BÀI 4: BIẾN NGẪU NHIÊN LIÊN TỤC VÀ PHÂN PHỐI XÁC SUẤT
Các dạng bài: Quy luật chuẩn; Quy luật chuẩn đặc biệt; Quy luật nhị thức; Quy luật Poisson và Mối
quan hệ giữa các quy luật
KIẾN THỨC CẦN NHỚ:
1. Hàm mật độ xác suất
Xác suất: P = ∫ f(x)dx (Cận lấy theo câu hỏi); Nếu lấy cận theo đề bài thì ∫ f(x)dx = 1
Trung bình: E(X) = ∫ xf(x)dx (Cận lấy theo đề bài)
Phương sai: V(X) = ∫ x 2 f(x)dx − E 2 (X) (Cận lấy theo đề bài)
2. Quy luật chuẩn: X~N(𝛍, 𝛔𝟐 )
b−μ a−μ
P(a < X < b) = ∅ ( ) − ∅( )
σ σ
a−μ
P(a < X) = 1 − ∅ ( )
σ
1. Quy luật chuẩn b−μ
P(X < b) = ∅ ( )
σ
a
P(|X − μ| < a) = 2∅ (σ) − 1
“Sai lệch so với trung bình không quá a”
1. Chuẩn hóa X~N(μ = 0, σ2 = 1)
2. Tổng của các biến phân phối chuẩn
2. Quy luật chuẩn đặc biệt Xi ~N(μ, σ2 ) => X1 + X2 ~N(2μ, 2σ2 )
σ2
3. Trung bình mẫu phân phối chuẩn ̅ X~N (μX̅ = μX , σ2 X̅ = X )
n
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy
p.(1−p)
3. Tần suất mẫu phân phối chuẩn p̂~N (μp̂ = p, σ2 p̂ = )
n
3. Mối quan hệ giữa Nhị thức-Poisson-Chuẩn
1. Quy luật nhị thức có n ≥ 20 và p ≤ 0,1 xấp xỉ Quy luật Poisson với λ = np
p 1−p 1
2. Quy luật nhị thức có n>5 và |√1−p − √ | < 0,3
p √n
xấp xỉ Quy luật Chuẩn với μ = np, σ2 = np(1 − p)
3. Quy luật Poisson có λ > 20 xấp xỉ Quy luật Chuẩn với μ = σ2 = λ
√p(1 − p)
P (p − zα/2 < p̂
√n √p(1 − p) √p(1 − p)
P (p̂ < p + zα ) P (p − zα < p̂)
Tỷ lệ mẫu √p(1 − p) √n √n
<p+ zα/2 ) =1−α
√n =1−α
=1−α
Mối quan hệ giữa Z và 𝛂: Nếu có giá trị tương ứng trong bảng thì tra bảng (Bảng z là dòng
cuối cùng của bảng Quy luật Student). Nếu không có thì dùng công thức: α = 1 − ∅(z)
MỘT SỐ LƯU Ý:
• Nếu bài yêu cầu ước lượng một bên tối đa/ tối thiểu thì chỉ chép công thức bên phải hoặc trái và thay
α/2 trong công thức thành α
• Nếu bài yêu cầu ước lượng độ lệch chuẩn thì đi ước lượng phương sai rồi căn bậc 2 ra.
• Nếu bài yêu cầu ước lượng Độ phân tán, độ biến động, độ dao động, độ rủi ro cũng chính là ước
lượng phương sai (hoặc độ lệch chuẩn). Nếu đơn vị không có ^2 thì ước lượng độ lệch chuẩn, có ^2
thì ước lượng phương sai. Nếu không có đơn vị thì ước lượng 1 trong 2 đều được.
02 DẠNG BÀI ĐẶC BIỆT:
• Ước lượng số lượng: Ta tìm cách chuyển về ước lượng tỉ lệ
• Tìm kích thước mẫu mới: Ta dựa vào công thức
Dạng Độ chính xác (Sai số) Kích thước mẫu mới
Ước lượng trung s (n−1) s (n−1) 2
ε= tα n ≥ ( tα )
bình (𝛍) √n 2 ε0 2
2
√p̂(1 − p̂) √p̂(1 − p̂)
Ước lượng tỉ lệ 𝐩 ε= zα n≥( zα )
√n 2 ε0 2
(n −1,n2 −1)
1 1 ̂+n
n1 p1 ̂2
2p
Chú ý: f1−α = (n −1,n1 −1) và p̅ =
fα 2 n1 +n2
Nếu kiểm định độ đồng đều thì ngược dấu với phương sai (Tức độ đồng đều lớn hơn thì phương sai nhỏ hơn)
Bước 3: Kết luận
• Nếu tiêu chuẩn thỏa mãn miền bác bỏ thì kết luận là Bác bỏ H0 chấp nhận H1
• Nếu tiêu chuẩn không thỏa mãn miền bác bỏ thì kết luận là Chưa đủ cơ sở bác bỏ H0
DẠNG BÀI ĐẶC BIỆT:
• Cho 2 tham số nhưng chỉ có 1 mẫu n thì đưa về kiểm định 1 tham số
• Kiểm định về 2 trung bình tổng thể μ1 và μ2 song (n1 và n2 chưa đủ > hơn 30 để áp dụng công thức
trong tờ công thức thống kê). Ta làm như sau:
s2
1
n1 (n1 −1).(n2 −1)
Tính C = s2 2 rồi tìm ra số bậc tự do k = (n 2 +(1−C)2 (n . Sau đó trong công thức miền bác bỏ thay
1 + s2 2 −1).C 1 −1)
n1 n2
(k) (k)
zα/2 thành t α/2 và zα thành t α
Dạng 2: Đọc giá trị từ bảng EXCEL
KIẾN THỨC CẦN NHỚ:
QUY TẮC ĐỌC BẢNG EXCEL
• F-test Two-Sample for Variances có nghĩa là kiểm định 2 phương sai
F critical one-tail kết hợp với Variance để viết H1 là > hay <
• T-test Two-Sample có nghĩa là kiểm định 2 trung bình
t Critical one-tail kết hợp với Mean để viết H1 là > hay <
TUY NHIÊN nếu bài yêu cầu kiểm định không tuân thủ đúng quy tắc như trên (VD: Bảng Excel là kiểm định
phương sai nhưng bài yêu cầu kiểm định trung bình, hoặc Bảng Excel là kiểm định H1: > ,< bài yêu cầu kiểm
định H1: # THÌ ta chỉ không được dùng Pvalue bài cho, còn vẫn dùng các giá trị Mean là xngang, Variance là
s^2, Observation là n để thay vào công thức kiểm định trong tờ công thức như 1 bài bình thường.
LƯU Ý nữa là bài cho Ponetail dùng để kiểm định H1: > hoặc <, ta có thể tính Ptwotail=2.Ponetail để kiểm
định trường hợp H1: #.
Dạng 3: Tính Pvalue, Sai lầm loại 1, 2
KIẾN THỨC CẦN NHỚ:
Pvalue
Group: Nhóm Lý thuyết Xác suất và Thạc sỹ: Trương Đức Huy
Thống kê toán Anh Huy
Bước 1: Xác định loại kiểm định, viết cặp giả thuyết
Bước 2: Tính Pvalue
Kiểm định T (Kiểm định trung bình 1,2 Kiểm định Z (Kiểm định tỷ lệ 1,2 tham số)
H1
tham số)
= 2P(T n−1 > |Tqs |
≠ = 2P(Z > |Zqs |) = 2 (1 − ∅(|Zqs |))
tra bảng Quy luật Student
= P(T n−1 > |Tqs |)
> hoặc
tra bảng Quy luật Student = P(Z > |Zqs | = 1 − ∅(|Zqs |)
<
Khi n > 30 => T ≈ Z
Kiểm định 𝛘𝟐 (Kiểm định phương sai 1 Kiểm định F (Kiểm định phương sai 2
tham số) tham số)
2(n−1) 2 (n1 −1,n2 −1
= 2P(χ > χqs ) = 2P(F > Fqs )
≠
tra bảng Quy luật Khi bình phương tra bảng Quy luật Fisher
2(n−1) 2
= P(χ > χqs ) = P(F (n1−1,n2−1 > Fqs )
>
tra bảng Quy luật Khi bình phương tra bảng Quy luật Fisher
2(n−1) 2
= P(χ < χqs ) = P(F (n1−1,n2−1 < Fqs )
<
tra bảng Quy luật Khi bình phương tra bảng Quy luật Fisher
Bước 3: So sánh Pvalue với α
Nếu Pvalue > α => Chưa đủ cơ sở bác bỏ H0
Nếu Pvalue < α => Bác bỏ H0, chấp nhận H1
Sai lầm loại I và sai lầm loại II
Sai lầm loại I là sai lầm bác bỏ H0 khi H0 đúng (Xác suất mắc sai lầm loại I chính bằng α)
Sai lầm loại II là sai lầm chưa bác bỏ H0 khi H0 sai