Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 5

CHƯƠNG 1: BẢN CHẤT CỦA XÁC SUẤT THỐNG KÊ

1. Thống kê mô tả và thống kê suy diễn


 Thống kê mô tả được sử dụng để mô tả một nhóm phần tử được quan sát trong thực tế. Thống
kê mô tả bao gồm thu thập, tổ chức, tổng hợp và trình bày dữ liệu.
 Thống kê suy diễn là tổng hợp kết quả từ các mẫu cho tổng thể, thực hiện ước lượng và kiểm
định giả thuyết, xác định các mối quan hệ giữa các biến và đưa ra dự đoán.
2. Các loại biến và các loại dữ liệu
 Biến định tính là những biến mà người ta gán các giá trị để phân biệt hay phân loại quan sát.
Chẳng hạn: giới tính (nam, nữ); tình trạng hôn nhân (độc thân, có gia đình, ly dị, góa chồng
hay vợ), kết quả học tập (yếu, trung bình, khá, giỏi).
 Biến định lượng là những biến mà các giá trị của nó được xác định bằng đo lường. Biến định
lượng được chia thành hai loại: biến định lượng rời rạc và biến địnhlượng liên tục.
Chẳng hạn:
a) Biến định lượng rời rạc như: số con trong một gia đình, số học sinh trong mộtlớp học,. . .
b) Biến định lượng liên tục: chiều cao; cân nặng; thời gian phản ứng; nhiệt độ,. . .
 Các loại thang đo thường được sử dụng:
Thang danh nghĩa Thang thứ hạng Thang đo khoảng Thang tỉ lệ
Là thang đo gán Là thang danh Là thang đo thứ Là thang đo khoảng
các con số cho các nghĩa mà giữa các hạng có khoảng cách với một điểm
quan sát để phân dấu hiệu quan sát cách đều nhau gữa 0 tuyệt đối (điểm
biệt và phân loại đã có quan hệ thứ các bậc. Gán các gốc) để có thể so
chúng, không có ý bậc hơn kém con số cho các sánh được tỉ lệ giữa
so sánh và các phép quan sát phản ánh các trị số đo.
tính với chúng đều một chiều dài cố
vô nghĩa. định giữa các đơn
vị đo lường.
Mã bưu chính, giới Đánh giá, xếp hạng Điểm SAT, chỉ số Chiều cao, cân
tính, màu mắt, quốc các cầu thủ quần IQ, nhiệt độ, thời nặng, lương, tuổi
tịch, tôn giáo vợt gian

CHƯƠNG 2: PHÂN BỐ TẦN SỐ VÀ ĐỒ THỊ


Tổ chức dữ liệu
 Đối với biến định tính
Phân bố tần số phân loại (categorical frequency distribution) được sử dụng cho biến định tính.
o Bước 1: Lập bảng như sau:

Lớp (Class) Ghi dấu (Tally) Tần số (Frequency) Phần trăm (Percent)

o Bước 2: Ghi dấu dữ liệu.


o Bước 3: Tìm tần số và tỉ lệ phần trăm.
● Đối với biến định lượng
Với biến định lượng có hai loại phân bố tần số sau:
o Phân bố tần số ghép lớp (grouped frequency distribution)
▪ Bước 1: Xác định các lớp.

● Tìm giá trị lớn nhất, kí hiệu H (Highest) và giá trị nhỏ nhất, kí hiệu L
(Lowest).
● Tìm phm vi d liu (range): R = H L.

● Chọn số lớp theo mong muốn, kí hiệu NC.


R
● Tìm độ rộng (width): W = +1
NC
● Chọn điểm bắt đầu (giá trị nhỏ hơn hoặc bằng với giá trị nhỏ nhất của dữ
liệu) để làm giới hạn dưới (lower limit), kí hiệu LL, của lớp đầu tiên,
cộng thêm độ rộng để được các giới hạn dưới tiếp theo, tức là: LLi+1 =
LLi + W, trong đó i là chỉ số lớp thứ i.

Tìm các g ii hn trên (upper limit) ca các lp, kí hiu là ULi = LLi+W 1.

● Tìm các lớp cận biên (class boundaries). Cận biên dưới (lower class
boundary) của lớp thứ i, kí hiệu là LCB, cận biên trên (upper class
boundary) của lớp thứ i, kí hiệu là UCB. Công thức xác định các lớp cận
biên:
1
o LCBi=LLi− (đơ n v ị đ o l ườ ng d ữ li ệ u),
2
1
o UCBi=ULi+ (đơ n v ị đ o l ườ ng d ữ li ệ u).
2
▪ Bước 2: Ghi dấu dữ liệu.

▪ Bước 3: Tìm các tần số và phần trăm

▪ Bước 4: Lập bảng


o Phân bố tần số không ghép lớp (ungrouped frequency distribution): Phân bố tần số không
ghép lớp được sử dụng khi phạm vi dữ liệu tương đối nhỏ, mỗi lớp là một dữ liệu đơn.
CHƯƠNG 3: MÔ TẢ DỮ LIỆU
1. Trung bình (mean)
 Trung vị (MD): điểm chính giữa của một dãy số đã cho, nếu có 2 số, cộng lại rồi chia 2
 Trung bình ( X đối với mẫu, μ đối với tổng thể, phân biệt nhưng có công thức giống nhau)
của một tập hợp các giá trị đo lường bằng tổng số các giá trị đo lường này chia cho số
lượng giá trị đo lường. Điều này được biểu thị bằng công thức:

o Trong đó:
∑ ❑: kí hiệu tổng cộng (đọc là sigma), có nghĩa là cộng một dãy các số đo lường. X i : là giá trị của mỗi
dữ liệu trong mẫu. n: là số các số đo lường trong mẫu.
2. Phương sai và độ lệch chuẩn
 Phương sai tổng thể, kí hiệu là σ 2 , là trung bình của các bình phương khoảng cách từ
mỗi giá trị đến trung bình của tổng thể.

 Độ lệch chuẩn tổng thể, kí hiệu là σ hoặc s, là căn bậc hai của phương sai.

Nếu tính toán trên các mẫu cụ thể, vì lý do cỡ mẫu thường nhỏ (ít hơn 30) nên thay vì chia cho N thì
người ta thường chia cho N – 1 (cả phương sai và độ lệch chuẩn)
CHƯƠNG 4: XÁC SUẤT VÀ CÁC QUY TẮC ĐẾM
1. Xác suất cổ điển, công thức cộng, công thức nhân
● XS cổ điển: Cho một phép thử có không gian mẫu Ω có hữu hạn các biến cố sơ cấp đồng
khả năng xảy ra. Khi đó, xác suất của biến cố E, ký hiệu là P(E), được xác định:

● Các quy tắc:


o Công thức cộng xác suất (ký hiệu A + B hoặc A ∪ B): P(A+B)=P(A) + P(B) - P(AB).
o A, B xung khắc: P(A+B)=P(A) + P(B)
o Biến cố xung khắc: Hai biến cố A và B được gọi là xung khắc với nhau nếu A và B
không đồng thời xảy ra khi thực hiện phép thử.
o Với ba biến cố A, B, C bất kỳ thì: P(A + B + C) = P(A) + P(B) + P(C) − P(A.B) −
P(A.C) − P(B.C) + P(A.B.C).
o P( A) = 1- P(A)
o Công thức nhân xác suất (kí hiệu A.B hoặc A ∩ B):
P(AB)=P(A).P(B/A)=P(B).P(A/B).
o Với ba biến cố A, B, C ta có: P(ABC) = P(A).P(B|A).P(C|AB).
o A, B độc lập: P(AB)=P(A).P(B)
o Xác suất có điều kiện của biến cố A đối với điều kiện B được xác định như sau: P(A|
B) = P(AB)/P(B) .
o Phép hiệu biến cố: Hiệu của hai biến cố A và B là một biến cố xảy ra khi biến cố A
xảy ra nhưng B không xảy ra, kí hiệu A\B.
2. Biến cố đối
 Biến cố đối (hay phần bù) của một biến cố E là tập hợp các
kết quả của không gian mẫu mà không chứa trong E. Biến
cố đối của biến cố E được ký hiệu là E . (ngược với E)
CHƯƠNG 5: PHÂN PHỐI XÁC SUẤT RỜI RẠC
1. Kỳ vọng
Hay còn gọi là giá trị mong đợi của một biến ngẫu nhiên rời rạc của một phân bố xác suất, là trung bình
theo lý thuyết của biến ngẫu nhiên rời rạc đó. Kí hiệu là E(X), được xác định bởi:

2. Phân phối nhị thức


 Phép thử nhị thức: là một dãy n phép thử xác suất thỏa mãn bốn yêu cầu sau:

đ
 Các kết quả của phép thử nhị thức và xác suất tương ứng của các kết quả này được gọi là
phân phối nhị thức (binomial distribution). Kí hiệu: B(n, p).

 Phương sai và độ lệch chuẩn của một biến ngẫu nhiên X tuân theo phân bố nhị thức được
xác định bằng các công thức sau:

3. Phân phối Poisson


Gọi X là biến ngẫu nhiên chỉ số lần một biến cố A xuất hiện trên một miền hay một vùng nào đó trong
một khoảng thời gian định trước, biết số lần A xuất hiện trung bình trong khoảng thời gian đó là λ. Khi đó
ta có công thức tính xác xuất:

CHƯƠNG 6: PHÂN PHỐI CHUẨN


1. Định nghĩa
Biến ngẫu nhiên X được gọi là tuân theo luật phân phối chuẩn, kí hiệu N(µ, σ), nếu hàm mật độ xác suất
của X có dạng:

2. Tính chất
 Đồ thị của phân phối chuẩn có dạng hình chuông.
 Trung bình, trung vị và mode đều bằng nhau và nằm ở trung tâm của phân bố.
 Phân phối chuẩn là một đường cong chỉ có một mode duy nhất.
 Đồ thị là một đường cong đối xứng qua đường thẳng đứng đi qua trung bình.
 Là một đường cong liên tục. 6. Là đường cong nhận trục Ox làm tiệm cận ngang.
 Tổng diện tích phần phía dưới đường cong phân phối chuẩn luôn bằng 1.
 Diện tích nằm dưới đường cong phân phối chuẩn
nằm trong khoảng 1 độ lệch chuẩn là xấp xỉ 0.68;
trong khoảng 2 độ lệch chuẩn khoảng 0.95 và trong
khoảng 3 độ lệch chuẩn khoảng 0.997

3. Ứng dụng
 Để giải quyết các vấn đề bằng cách sử dụng phân phối chuẩn
tắc thì ta biến đổi biến ban đầu thành một biến phân bố chuẩn hóa bằng cách sử dụng công thức:

 Tra bảng z-score tìm z

 Độ lệch có thể được kiểm tra bằng cách sử dụng chỉ số Pearson PI (-1,1). Công thức được xác
định:

Trong đó: X là trung bình, MD là trung vị, s là độ lệch chuẩn


 Định lý giới hạn trung tâm: Khi cỡ mẫu n dần đến vô cùng thì hình dáng của phân phối các trung
bình mẫu lấy có hoàn lại từ một tổng thể với trung bình µ và độ lệch chuẩn σ sẽ tiệm cận phân
phối chuẩn có trung bình cũng là µ và độ lệch chuẩn là σ/√ n.
Nếu cỡ mẫu đủ lớn thì định lý giới hạn trung tâm có thể được sử dụng để trả lời các câu hỏi về
các trung bình mẫu như việc sử dụng một phân phối chuẩn để trả lời các câu hỏi về một giá trị cụ
thể. Sự khác biệt duy nhất là phải sử dụng một công thức cho giá trị z như sau:

o Tính chất:
 Khi biến ban đầu sử dụng tuân theo phân phối chuẩn thì phân phối các trung bình
mẫu cũng tuân theo phân phối chuẩn với bất kì cỡ mẫu n nào.
 Khi phân phối của biến ban đầu không phải là phân phối chuẩn thì cần phải có cỡ
mẫu đủ lớn (từ 30 trở lên) để sử dụng phân phối chuẩn tương đương với sự phân
phối của các trung bình mẫu. Cỡ mẫu càng lớn thì phép tiệm cận phân phối
chuẩn càng tốt

You might also like