Download as pdf or txt
Download as pdf or txt
You are on page 1of 16

ĐỀ CƯƠNG

THỐNG KÊ Y DƯỢC

Năm 2021
PHẦN MỘT: LÝ THUYẾT XÁC SUẤT
CHƯƠNG 1: CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT
I. Giải tích tổ hợp
1. Hoán vị
Tập hợp A có n phần tử Pn = n(n-1)(n-2)…2.1 = n!

2. Chỉnh hợp
Chỉnh hợp chập k (chỉnh hợp không lặp) của n phần tử (k, n nguyên dương và 0 ≤ k ≤ n) của tập hợp A

𝑛!
𝐴𝑘𝑛 = (𝑛−𝑘)!

3. Tổ hợp
Tổ hợp chập k của n phần tử (k nguyên, n nguyên dương và 0≤ k ≤n) của tập hợp A

𝑛!
𝐶𝑛𝑘 =
𝑘!(𝑛−𝑘)!

II. Định nghĩa xác suất


1. Một số quan hệ giữa các biến cố

Biến cố A được gọi là kéo theo biến cố B nếu AB


Quan hệ kéo theo
biến cố A xảy ra thì biến cố B xảy ra.
Hai biến cố A và B được gọi là tương đương A=B
Quan hệ tương đương
nhau nếu A kéo theo B và B kéo theo A
Biến cố AUB xảy ra  ít nhất 1 trong 2 biến AUB
Tổng 2 biến cố A và B cố A&B xảy ra trong 1phép thử.
Biến cố AB xảy ra  A và B đồng thời
Tích của 2 biến cố A và B AB (hay A∩B)
xảy ra trong một phép thử
Biến cố A/B xảy ra biến cố A xảy ra và
Hiệu của 2 biến cố A và B A/B
biến cố B không xảy ra
Hai biến cố A và B được gọi là xung khắc với AB=Φ
Biến cố xung khắc nhau nếu chúng không đồng thời xảy ra trong
cùng một phép thử
Biến cố đối lập với biến cố A kí hiệu là Ā
Biến cố đối lập A.Ā=Φ và A U Ā = Ω
Biến cố Ā xảy ra  biến cố A không xảy ra

Các biến cố A1, A2, …, An (n ≥ 2) được gọi là một nhóm đầy đủ các biến cố nếu chúng đôi một xung khắc
với nhau và tổng là một biến cố chắc chắn

VITAMIN DƯỢC - TEAM HỌC TẬP TND 2


AiAj = Φ (với i ≠ j) và ⋃𝑛𝑖=1 𝐴𝑖 = Ω

2. Xác suất biến cố

Là khả năng một biến cố xảy ra P(A)


0 ≤ P(A) ≤ 1 với mọi biến cố A

• Định nghĩa theo quan điểm cổ điển

|A| Số khả năng thỏa mãn điều kiện A


P(A) = =
|Ω| Tổng số khả năng trên không gian mẫu

• Định nghĩa theo quan điểm thống kê

Xét phép thử ngẫu nhiên có không gian mẫu Ω và A  Ω. Thực hiện phép thử độc lập n lần. Biến cố A
xuất hiện m lần
 Tần suất xuất hiện biến cố A là:
f(A)=m/n
Khi n thay đổi thì f(A) thay đổi nhưng dao động xung quanh một hằng số, đó là xác suất của biến cố A:
P(A) = f(A)
Tính chất cơ bản của xác suất:
o Với mọi A  Ω thì 0 ≤ P(A) ≤1

o Xét A  Ω, ωi là các biến cố sơ cấp thì P(A)=∑A (ωi )

o P(Ω)=1; P(Φ)=0

o P(A)=1- P(Ā)

III. Các định lý cơ bản về xác suất


1. Công thức cộng xác suất
P(AUB) = P(A) + P(B) – P(AB)

Nếu A và B xung khắc thì: P(A) + P(B) = P(A+B)

Nếu A và B đối lập thì: P(A) + P(B) = 1

Mở rộng:
• Với n biến cố A1, A2, … An có
P(A1UA2….UAn) = ∑𝑛𝑖=1 𝑃(𝐴𝑖 ) – ∑𝑛𝑖<𝑗 𝑃(𝐴𝑖 𝐴𝑗 ) + ∑𝑛𝑖<𝑗<𝑘 𝑃(𝐴𝑖 𝐴𝑗 𝐴𝑘 ) - … + (-1)n P(A1A2…An)

• Nếu n biến cố A1, A2, … An xung khắc nhau từng đôi

VITAMIN DƯỢC - TEAM HỌC TẬP TND 3


P(A1UA2….UAn) = P(A1) + P(A2) + … P(An)

2. Định lý nhân xác suất


2.1. Hai biến cố độc lập
Hai biến cố A và B được gọi là độc lập với nhau nếu: P(A∣B) = P(A) hoặc P(B∣A)=P(B)
Khi đó: P(AB)=P(A).P(B)

2.2. Công thức nhân xác suất P(AB)=P(B∣A).P(A)


P(AB)=P(A∣B).P(B)

Mở rộng:
Cho n biến cố A1, A2, …An: P(A1A2…An ) = P(A1)P(A2∣A1)P(A3∣A1A2)….P(An∣ A1A2…An)
Nếu A1, A2, …An là n biến cố độc lập thì:
P(A1A2…An) = P(A1)P(A2)…P(An)

2.3. Công thức xác suất đầy đủ và công thức Bayes


Tổng quát: A1, A2, A3, …, An là nhóm đầy đủ các biến cố.
B là b/c xảy ra chỉ khi một trong các b/c A1, A2, A3, …, An xảy ra.
 Công thức xác suất đầy đủ
P(B)=∑𝑛𝑖 𝑃(𝐴i)P(B∣Ai)

 Công thức Bayes


𝑃(𝐴𝑖 )𝑃(𝐵∣𝐴𝑖 )
P(Ai∣B)= với i=1,…n
𝑃(𝐵)

2.4. Công thức Bernoulli


Điều kiện xảy ra phép thử Bernoulli
- n phép thử độc lập
- mỗi phép thử chỉ có 2 kết quả: b/c A xảy ra hoặc không xảy ra.
- P(A)=p, P(Ā)=1-p

Xác suất bc A xuất hiện k lần trong n phép thử:

Pn(k;p)=𝐶𝑝𝑘 𝑝𝑘 (1 − 𝑝)𝑘 k=1;2…n

VITAMIN DƯỢC - TEAM HỌC TẬP TND 4


5. Số đo khả năng nhất
Số tự nhiên mo là số có khả năng nhất nếu Pn(mo;p) max

(n+1)p-1 ≤ mo ≤ (n+1)p

VITAMIN DƯỢC - TEAM HỌC TẬP TND 5


CHƯƠNG 2: BIẾN NGẪU NHIÊN VÀ QUY LUẬT PHÂN PHỐI
XÁC SUẤT CỦA BIẾN NGẪU NHIÊN
I. Biến ngẫu nhiên và quy luật phân phối
1. Bảng phân phối xác suất:
Biến ngẫu nhiên rời rạc X nhận các giá trị x1, x2, …, xn với các xác suất tương ứng p1, p2, ..., pn.
X x1 x2 x3 x4 ……..xn ……..
P p1 p2 p3 p4 …….pn ……

2. Hàm phân phối xác suất:

F(x) = P(X<x) với x là số thực

Tính chất:
o 0 ≤ F(x) ≤ 1
o x1 < x2 thì F(x1) ≤ F(x2).
o Xác suất để BNN X nhận giá trị trong [a;b) là:

P (a ≤ X < b) = F(b) - F(a)

Hệ quả: Nếu X là BNN liên tục thì


o P(X = xo) = 0.
o P(a ≤ X ≤ b) = P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b)

3. Hàm mật độ xác suất:

f(x) = F’(x) với x là số thực

Để f(x) là hàm mật độ xác suất của BNN liên tục nào đó thì:
f(x) ≥ 0
+


−
f ( x)dx = 1

Các tính chất:


o f(x) ≥ 0 với x là số thực
x
o F ( x) = 
−
f ( x)dx

Giá trị F(x) tại điểm a là diện tích hình giới hạn bởi trục Ox, đường cong f(x) và đường thẳng x = a

VITAMIN DƯỢC - TEAM HỌC TẬP TND 6


b
o P(a  X  b) =  f ( x)dx
a
+
o 
−
f ( x)dx = 1

Nhắc lại kiến thức toán cao cấp (tích phân suy rộng):
+ a +


−
f ( x)dx = 
−
f ( x)dx + 
a
f ( x )dx

+ b


a
f ( x)dx = lim
b →+  f ( x)dx
a
với a < b < +∞

a a


−
f ( x)dx = lim
c →−  f ( x)dx
c
với -∞ < c < a

II. Các đặc trưng của BNN:


1. Kỳ vọng EX:
• Nếu X là BNN rời rạc nhận các giá trị x1, x2, x3, ..., xn, … với các xác suất tương ứng là p1, p2, ..., pn, …
Thì:
+
EX = x1p1 + x2p2 + …. + xnpn = x p
i =1
i i

• Nếu X là BNN liên tục trên R có hàm mật độ xác suất f(x) thì:

+
EX =  xf ( x)dx
−

Tính chất:
o EC = C với C là hằng biến ngẫu
o E(CX) = C. EX với C là hằng số
o E(X+Y) = EX + EY
o E(XY) = (EX)(EY)
o E(X-EX) = 0

2. Mốt (M0):
• Nếu là BNN rời rạc thì mốt là giá trị của BNN mà tại đó nó có xác suất lớn nhất
• Nếu là BNN liên tục thì mốt là giá trị của BNN mà tại đó hàm mật độ xác suất của nó đạt cực đại

VITAMIN DƯỢC - TEAM HỌC TẬP TND 7


3. Trung vị (Me)
P(X ≥ Me) ≥ 0.5
P(X ≤ Me) ≥ 0.5

hay P(X < Me) = F(Me) ≤ 0.5


P(X ≤ Me) = F(Me + 0) ≥ 0.5
Với F(x) = P(X<x) là hàm phân phối xác suất của BNN X.
- Nếu F(x) liên tục thì hệ thức tương đương với F(Me) = 0.5 → 1 trung vị.
- Nếu hệ thức có nhiều nghiệm → nhiều trung vị.

4. Phương sai và độ lệch chuẩn

Phương sai (DX)

DX = E(X-EX)2 = E(X2) – (EX)2

• Nếu X là BNN rời rạc nhận các giá trị x1, x2, … với các xác suất tương ứng là p1, p2, … thì phương sai

n n n
DX =  ( x − EX) 2 pi hoặc DX =  x 2 pi − ( xi pi ) 2
i =1 i =1 i =1

• Nếu X là BNN liên tục có hàm mật độ xác suất f(x) thì phương sai:

+ + +

DX =  ( x − EX) f ( x)dx hoặc DX = x f ( x)dx − (  xf ( x)dx) 2


2 2

− − −

Tính chất:
o DC = 0 với C là hằng biến ngẫu nhiên
o D(CX) = C2.DX với C là hằng số
o D(X ± Y) = DX +DY với X, Y độc lập với nhau.

Độ lệch chuẩn (  X )

 X = DX

VITAMIN DƯỢC - TEAM HỌC TẬP TND 8


III. Một số quy luật phân phối xác suất thông dụng
1. Phân phối nhị thức B(n;p)
Xét n phép thử Bernoulli
- p là xác suất biến cố A xảy ra trong mỗi phép thử
- Gọi X là số lần xuất hiện biến cố A trong n phép thử
→ X là BNN rời rạc nhận các giá trị 0,1,2, .., n

P( X = k ) = Cnk . p k .(1 − p)n −k với k = 0,1,2,…,n

Các số đặc trưng:


Kì vọng: EX = np
Phương sai: DX = n.p(1-p)

2. Phân phối Poisson P( )


Biến ngẫu nhiên rời rạc X nhận các giá trị có thể có với các xác suất tương ứng được tính theo công thức:

k với k = 0,1,2, …
P( X = k ) = .e −  e =2,7182818284…
k!

Điều kiện để áp dụng công thức: n lớn


p nhỏ
np =  không đổi.

Các số đặc trưng: Kì vọng EX = 

3. Phân phối chuẩn N (  ; 2 )


BNN liên tục X nhận giá trị trong khoảng (−; +) là BNN có phân phối chuẩn nếu hàm mật độ xác suất có
dạng:
− ( x −  )2
1
f ( x) = .e 2 2
với   0
 2

Kí hiệu: X  N (; 2 )

Nếu 𝑋 𝜖 𝑁(0,1) thì hàm mật độ XS của X:


- Nếu X  N (0,1) thì hàm mật độ XS của X:
1 −2x
2

 ( x) = e
2
VITAMIN DƯỢC - TEAM HỌC TẬP TND 9
Các tham số đặc trưng: Kì vọng: EX=
Phương sai: DX =  2

❖ Xác suất để BNN tuân theo quy luật phân phối chuẩn nhận giá trị trong 1 khoảng:
Với X là BNN có phân phối chuẩn N (  ; 2 )
Khi đó xác suất để BNN X nhận giá trị trong khoảng (a;b) là:

b− a−
P ( a  X  b) =  ( ) −( )
 
❖ Quy tắc 3 :
BNN có phân phối chuẩn N (  ; 2 ) sẽ nhận gt hầu hết trong khoảng (  − 3 ;  + 3 )


P(| X −  |  ) = 2 ( ) − 1

Lưu ý:  (− x) = 1 −  ( x)

VITAMIN DƯỢC - TEAM HỌC TẬP TND 10


PHẦN HAI: THỐNG KÊ TOÁN HỌC
CHƯƠNG 1: LÝ THUYẾT MẪU
Các số đặc trưng của mẫu
1. Trung bình mẫu
1 n
X= X
n i =1 i

2. Mốt mẫu
Xo: giá trị của mẫu mà ứng với nó là tần suất lớn nhất.

3. Trung vị mẫu
Xc: giá trị nằm ở giữa của mẫu, tức chia các số liệu mấu thành 2 phần bằng nhau.

• Nếu n lẻ (n = 2k+1) thì 𝑥𝑒 = 𝑥𝑘+1


𝑥𝑘 + 𝑥𝑘+1
• Nếu n chẵn (n = 2k) thì 𝑥𝑒 =
2

4. Khoảng biến thiên


R= xmax − xmin

5. Phương sai mẫu và độ lệch chuẩn


Cách tính trung bình mẫu và phương sai mẫu cụ thể:

n ≥ 30 n ≤ 30

Mẫu 1 n 2 1 n   1  n 2 1 n  
2 2
1 k
đơn x =  ni xi s =   xi −   xi  
2
s = /2
  xi −   xi  
giản
n i =1 n  i =1 n  i =1   n − 1  i =1 n  i =1  

1 k  1  k  
2 2
1 n 1 k  1 k
Mẫu thu x =  ni xi s =   ni xi 2 −   ni xi 
2
 s =
/2
  ni xi −   ni xi  
2
gọn n i =1 n  i =1 n  i =1   n − 1  i =1 n  i =1  

VITAMIN DƯỢC - TEAM HỌC TẬP TND 11


Nếu các xi lớn hoặc
quá lẻ và cách đều
nhau → chuyển gốc:
1 k  1  k  
2 2
x −x 1 k  1 k
yi = i 0 s = h .   ni yi 2 −   ni yi 
2 2
 s =h .
/2 2
  ni yi −   ni yi  
2

h n  i =1 n  i =1   n − 1  i =1 n  i =1  
1 k
x = x0 + h.  ni yi
n i =1

h=αi+1−α
1 k 
2
1 k 
x −x s = h .   ni yi 2 −   ni yi 
2 2

Mẫu yi = i 0 n  i =1 n  i =1  
chia lớp h
1 k h2
x = x0 + h.  ni yi shc 2 = s 2 −
n i =1 12

VITAMIN DƯỢC - TEAM HỌC TẬP TND 12


CHƯƠNG 2: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ

Đã biết phương sai σ2 hoặc kích thước Chưa biết phương sai σ2 và kích thước mẫu
mẫu n ≥ 30: n < 30:

Khoảng tin cậy +) Mẫu cụ thể: +) Mẫu cụ thể:


của kỳ vọng của  s s 
BNN  x − t ; x + t  k=n−1
 2 n 2 n
Độ tin cậy p=1−α  s/ s/ 
+) Mẫu chia lớp:  x − t ;k ; x + t 
 s s   2 n 2
;k n
 x − t ; x + t 
 2 n 2 n

Nếu n khá lớn (n ≥ 100) và p không quá Nếu n lớn và p gần 0 hoặc 1:
gần 0 và 1: Tra bảng 5, tìm đc np1, np2
Khoảng tin cậy => Khoảng tin cậy (p1;p2)
của tỉ lệ hay xác
suất của BNN  m m m m 
 1 −  1 −  
Độ tin cậy p=1−α  m −t n n m n  n   Nếu n bé và p không quá gần 0 hoặc 1:
; + t
 n 2 n n 2 n 
  Tra bảng 6 hoặc 7, khoảng tin cậy (p1;p2)
 

Khoảng tin cậy của trung bình: Khoảng tin cậy tỉ lệ:
Với mẫu điều tra sơ bộ có kích thước f là tần suất mẫu điều tra sơ bộ với kích
Phương pháp m ≥ 2 và độ lệch chuẩn mẫu s/ thước m ≥ 2
xác định kích
thước mẫu cần k = m−1 t 2  f (1 − f )
thiết n 2

t 2  s /2 2
;k
n 2
2

VITAMIN DƯỢC - TEAM HỌC TẬP TND 13


CHƯƠNG 3: KIỂM ĐỊNH CÁC GIẢ THUYẾT THỐNG KÊ
Các loại kiểm
định giả thuyết Công thức
thống kê
X − 0
+ Đã biết 𝜎 2 hoặc n ≥ 30 : t=
s2
n
X − 0
Giả thuyết về giá + Chưa biết 𝜎 2 và n ≤ 30: t=
trị trung bình s '2
n
k=n–1

+ Nếu mẫu phân lớp thì ta tính phương sai Shc

m
− p0
n
t= Đặt giả thiết hiệu = 0 →
p0 (1 − p0 )
Hai đại lượng khác nhau
Giả thuyết về tỉ lệ n không có ý nghĩa thống kê
P0: tỉ lệ ở đề bài
Với độ tin cậy là p = 1 – α
M: số phần tử mang dấu hiệu nghiên cứu
+ Nếu 𝑡 ≥ 𝑡∝:𝑘 thì bác bỏ
2
giả thiết ở mức ≤ α
+ Nếu đã biết 𝜎𝐴2 và 𝜎𝐵2 hoặc mẫu lớn (nA ≥ 30 và nB ≥30):
+ Nếu 𝑡 < 𝑡∝:𝑘 thì chấp
X A − XB 2
t= nhận giả thiết ở mức > α
s A2 sB2
+
nA nB

+ Nếu chưa biết 𝜎𝐴2 và 𝜎𝐵2 và mẫu bé (nA< 30 hoặc nB <30):


So sánh hai giá trị
trung bình của X A − XB
2 mẫu độc lập t=
sC2 sC2
+
nA nB

k = nA + nB - 2

(nA − 1) s ,2A + (nB − 1) sB,2


Với s = 2

nA + nB − 2
C

VITAMIN DƯỢC - TEAM HỌC TẬP TND 14


+ Nếu mẫu phân lớp thì ta tính phương sai Shc

di = xAi - xBi
d̅ = d1 + d2 + d3 + …
+ Nếu n ≥ 30:
d
T=
sd2
n

1 n 1 n Đặt giả thiết hiệu = 0 → Hai


So sánh trung sd2 = [ di2 − ( di ) 2 ] đại lượng khác nhau không có
bình của 2 mẫu n i =1 n i =1
ý nghĩa thống kê
theo cặp
`+ Nếu n < 30: Với độ tin cậy là p = 1 – α
d + Nếu 𝑡 ≥ 𝑡𝛼 thì bác bỏ giả
T= 2
,2
s d thiết ở mức ≤ α
n + Nếu 𝑡 < 𝑡𝛼 thì chấp nhận
2
1 1 n n
giả thiết ở mức > α
s = ,2
[ di2 − ( di ) 2 ]
n − 1 i =1
d
n i =1

mA mB

So sánh hai tỉ lệ nA nB
của hai mẫu t=
 mA + mB   nA + nB − mA − mB 
  
 nA + nB   nA nB 
Giả thiết 𝜎𝐴2 = 𝜎𝐵2 tức là 𝑠𝐴′ và
2
S 𝑠𝐵′ khác nhau không có ý
Nếu n ≥ 30: F = (nếu s A2 > sB2 )
A
2
S B nghĩa thống kê
S A,2 Với độ tin cậy là α
So sánh hai Nếu n<30: F = ( nếu S A,2 > S B,2 )
phương sai S B,2
+ Nếu 𝐹 ≥ 𝐹𝛼: 𝑘𝐴:𝑘𝐵 thì bác
kA = nA – 1 bỏ giả thiết ở mức ≤ α
+ Nếu 𝐹 < 𝐹𝛼: 𝑘𝐴:𝑘𝐵 thì chấp
kB = nB – 1
nhận giả thiết ở mức > α

VITAMIN DƯỢC - TEAM HỌC TẬP TND 15


s
ni =  Qij (là tần số quan sát yi)
j =1
r
mi =  Qij (là tần số quan sát xi)
j =1
r s

Kiểm tra tính độc n =  Qij (cỡ mẫu)


2
lập
i =1 j =1 + Nếu 𝜒 2 ≥ 𝜒(𝑟−1)(𝑠−1) thì
ni .m j bác bỏ giả thiết
Lij = (tần số lí thuyết) 2
n + Nếu 𝜒 2 < 𝜒(𝑟−1)(𝑠−1) thì
(Q − Lij )
2
r s chấp nhận giả thiết
 = 
2 ij

i =1 j =1 Lij
k = (r-1)(s-1)

(Q − Lij )
2
r s
 = 
2 ij
So sánh nhiều tỉ lệ
i =1 j =1 Lij

~ END ~
CHÚC CÁC BẠN THI TỐT!

VITAMIN DƯỢC - TEAM HỌC TẬP TND 16

You might also like