Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

Một Hypothesis là một khẳng định về giá trị của tham số tổng thể được phát triển cho

mục đích kiểm định một giả thuyết hoặc tiên đề. Hypothesis được được trình bày dưới
dạng tham số tổng thể được kiểm định.
Các bước kiểm định hypothesis, dựa trên thống kê mẫu và lý thuyết xác suất được dùng
để xác định liệu một hypothesis là một statement hợp lý và không bị phủ định hay nó là
một statement không hợp lý và nên phủ định. Các bước này gồm:
1. State the hypothesis
2. Chọn thống kê kiểm định phù hợp
3. Xác định mức ý nghĩa
4. State cách thức quyết định độc lập với hypothesis
5. Thu thập mẫu và tính toán các thống kê mẫu
6. Đưa ra quyết định độc lập với hypothesis
7. Đưa ra quyết định dựa trên kết quả của kiểm định

Giả thiết không_Null hypopthesis H 0 là giả thiết được đặt ra để phủ định. Vì không thể
khằng định điều gì từ thống kê, nên ta sẽ đặt một giả thiết đối của giả thiết cần khẳng.
Nếu thành công phủ định giả thiết không, ta có cơ sở để khẳng định Giả thiết thay thế
H a.

Giả thiết thay thế có thể là một phía hay hai phía. Trên thực tế, những kiểm định được
lập là kiểm định hai phía. Một kiểm định hai phía cho population mean như sau:
H 0 : μ=μ 0 vesus H a : μ ≠ μ 0

Bởi vì giả thiết thay thế cho phép các giá trị phía dưới và phía trên tham số giả định, một
kiểm định hai phía sử dụng hai critical value (rejection point)
Quy tắc chung của kiểm định hai phía là Phủ định H 0 nếu:
Thống kê kiểm định > Giá trị tới hạn, hoặc, Thống kê kiểm định < Giá trị tới hạn

Với kiểm định một phía cho population mean, giả thiết không và thay thể đều có thể là:
Upper tail: H 0 : μ ≤ μ0 vesus H a : μ> μ0 , hoặc
Lower tail: H 0 : μ ≥ μ0 vesus H a : μ< μ0
Kiểm định giả thiết gồm 2 thống kê: thống kê kiểm định được tính từ data mẫu và giá trị
tới hạn của thông kê kiểm định. Giá trị của thống kê kiểm định liên quan tới critical value
và là bước quan trọng nhất để đánh giá độ chính xác của giả thiết.
Một thống kê kiểm định được tính bằng cách so sánh Ước lượng điểm của tham số tổng
thể với giá trị giả định của tham số (giá trị trong giả thiết không).
Thống kê kiểm định là chênh lệch giữa thống kê mẫu và giá trị giả định, được đo bằng
standard error (sai số chuẩn) của thống kê mẫu:
sample statistic−hypothesized value
test statistic=
standard error of sample statistic

Nhớ rằng kiểm định giả thiết được dùng để lập suy diễn về những tham số của một tổng
thể được chọn dựa trên những thống kê cơ bản được tính cho một mẫu được rút ra từ
tổng thể đó. Chúng ta phải lường trước rằng có khả năng mà mẫu, bằng cách nào đó,
không đại diện cho tổng thể, và bất cứ một kết luận nào dựa trên mẫu đó về tổng thể là
sai lầm.
Khi đưa ra suy diễn từ kiểm định giả thiết, sẽ có 2 loại errors:
Sai lầm loại 1: phủ định giả thiết không khi thực sự nó đúng
Sai lầm loại 2: không thể phủ định giá thiết không khi nó thực sự sai
Mức ý nghĩa (significance level) là xác suất xuất hiện sai lầm loại 1. Giảm mức ý nghĩa sẽ
làm tăng khả năng thất bại trong việc phủ định giả thiết không. Ngược lại, nếu chấp
nhận khả năng mắc sai lầm loại 1 tăng, ta sẽ giảm được khả năng mắc sai lầm loại 2. Với
mức ý nghĩa không đổi, ta chỉ có thể giảm khả năng mắc sai lầm loại 2 bằng cách tăng
kích thước mẫu.
p−value là xác suất có được một thống kê kiểm định sẽ dẫn tới phủ định của giả thiết
không, với tiên định giả thiết không là đúng. Nó là mức ý nghĩa nhỏ nhất mà giả thiết
không có thể được phủ định.

Khả năng sai lầm loại 1 là khả năng mà giả thiết không bị phủ định trong khi nó thực sự
là đúng. Các nhà làm thống kê gọi phủ định không chính xác này là false positives. Với
một kiểm định giả thiết mà return trung bình của một chiến lược đầu tư bằng không, với
mức ý nghĩa 5%, chúng ta sẽ có false positives 5% số lần trên trung bình. Lúc này,
p−value sẽ bé hơn 0.05. Với một kiểm định đơn, kết luận này là đúng. Nhưng với đa
kiểm định, p−value sẽ được điều chỉnh lại.

Xác định thống kê kiểm định phù hợp và diễn giải kết quả cho một kiểm định giả thiết
liên quan đến độ tương khớp của các trung bình tổng thể của ít nhất hai tổng thể có
phân phối chuẩn dựa trên mẫu ngẫu nhiên độc lập với phương sai bằng nhau không biết
trước.

Parametric tests dựa trên những giả định bỏ qua phân phối của tổng thể và tập trung
đến những tham số của tổng thể.
Nonparametric tests không quan tâm đến một tham số tổng thể hay có những giả định
về các mẫu được lấy từ tổng thể. Nonparametric tests được dùng khi ta quan tâm đến
quantities hơn là các tham số của một phân phối hay các giả định của tham số là không
hợp lý. Nó cũng được dùng khi data không phù hợp để kiểm định tham số.
Những trường hợp kiểm định phi tham số được dùng đến:
1. Các giả định về phân phối của biến ngẫu nhiên để sử dụng kiểm định tham số
không thỏa mãn.
2. Khi data là ordinal data mà không phải là giá trị.
3. Giả thiết không liên quan đến tham số của phân phối, như là kiểm định biến có
được phân phối chuẩn không. Chúng ta có thể sử dụng kiểm định phi tham số,
được gọi là runs test, để xác định data có phải là ngẫu nhiên. Một runs test cho
một ước lượng về xác suất một chuỗi các chênh lệch có phải là ngẫu nhiên.
Độ tương quan đo lường mức liên hệ giữa hai biến. Nếu tương quan giữa hai biến bằng
không, không có quan hệ tuyến tính giữa chúng. Khi hệ số tương quan mẫu của hai biến
khác không, chúng ta nên đặt câu hỏi rằng hệ số tương quan của tổng thể có bằng
không. Kiểm định phù hợp cho giả thiết rằng tương quan tổng thể bằng không, khi hai
biến có phân phối chuẩn là …

Spearman rank correlation test, một kiểm định phi tham số khác, được dùng để kiểm
định hai set of ranks có tương quan.

Một contingency table chỉ ra số các quan sát từ một mẫu mà có kết hợp của hai đặc tính.
Với kiểm định dưới đây, chúng ta sẽ so sánh giá trị bảng thực tế với giá trị khi hai đặc
tính là độc lập. Chúng ta sẽ sử dụng thống kê chi-square.

You might also like