Professional Documents
Culture Documents
10 Xu Ly So Lieu Thong Ke
10 Xu Ly So Lieu Thong Ke
1
Thiết lập giả thuyết H0 và đối thuyết
Chọn kích thước mẫu (chọn mức rủi ro β hoặc độ tin cậy
nếu cần)
So sánh đại lượng thống kê với các giá trị tới hạn hoặc với
xác xuất theo α
Loại bỏ giải thuyết H0: Không loại bỏ hoặc chấp nhận ( tùy
theo độ tin cậy)
2
Lựa chọn phương pháp xử lý số liệu
Cách 1:
• Tra bảng “số lượng câu trả lời đúng tối thiểu cần thiết”.
• Áp dụng:
• Phép thử tam giác
• Phép thử 2-3
• Phép thử cặp đôi
• Phép thử 2-5
3
Lựa chọn phương pháp xử lý số liệu
• Tra bảng ứng với cột so sánh hai phía (two tailed)
• Tra bảng ứng với cột so sánh một phía (one tailed)
4
Lựa chọn phương pháp xử lý số liệu
1. Trắc nghiệm t
2. Trắc nghiệm F
3. Trắc nghiệm phi tham số
5
1. Trắc nghiệm t
• Dùng để so sánh sự khác biệt giữa 2 số trung
bình: và
b) Tính giá trị tTN (Tra bảng phân phối t tìm giá trị
tα ứng với độ tự do (df).
c) So sánh tTN và tα
6
1. Trắc nghiệm t
• So sánh tTN và tα
1. Nếu tTN < t0,05:
→ Hai số trung bình khác nhau không rõ rệt (P>0,05)
8
Bài giải
1. Giả thuyết Ho
Ho = P(A) = P(B) = ½
Ha = P(A) ≠ P(B) ≠ ½
Hoặc
Ho: Độ ngọt của 2 mẫu là như nhau
Ha: Độ ngọt của 2 mẫu là khác nhau
Hoặc: ???
9
2. Tra bảng
• Từ Bảng T12: nếu n = 60 với α = 0,05, thì giá trị tới hạn là
39.
10
2. Tính chi bình phương
• Áp dụng công thức:
E1 = n(1/2) = 60(1/2) = 30
E2 = n(1/2) = 60(1/2) = 30
12
2. Trắc nghiệm F
• Dùng để so sánh giá trị trung bình của ba nhóm mẫu trở
lên.
• Các bước tiến hành phân tích phương sai:
1. Đặt giả thuyết tương đồng Ho
2. Tính toán các đặc số CF, SS, MS (tuỳ theo trường hợp)
3. Tính mức ý nghĩa (FTN và Fα) để quyết định chấp nhận
hay bát bỏ giả thuyết.
4. Khi FTN của nghiệm thực có ý nghĩa, so sách các cặp số
trung bình.
→ Trắc nghiệm LSD hoặc trắc nghiệm Duncan
5. Kết luận
13
3. Trắc nghiệm phi tham số
Áp dụng:
• Khi các chỉ tiêu quan sát là những tính trạng định
tính dưới dạng liệt kê, số đếm (tần số) … nhưng
được yêu cầu so sánh dưới dạng tỷ lệ phần trăm.
• Khi các chỉ tiêu quan sát là tính trạng định lượng
nhưng yêu cầu so sánh theo chiều hướng tăng
giảm hay thứ tự xếp hạng.
14
Trắc nghiệm χ2
15
Trắc nghiệm χ2
• Độ tự do df = k – 1 (k là số nghiệm thức)
16
Ví dụ
• Ảnh hưởng của trình độ học vấn đến mức độ yêu thích
sản phẩm nước giải khát (điều tra trên 800 người).
Trình độ học vấn Không thích Không thích Thích
không ghét
Trung học (n=430) 91 104 235
17
Lý thuyết
• Hai biến độc lập khi hoàn toàn không có mối liên
quan với nhau
18
Giá trị thực tế
Trình độ Không Không thích Thích Tổng số Xác suất
học vấn thích không ghét
Trung học 0.537
91 104 235 430
(n=430) =430/800
Cao đẳng 0.200
39 73 48 160
(n=160) =160/800
Đại học 0.263
18 31 161 210
(n=210) =210/800
Tổng số 148 208 444 800 1.000
Xác suất 0.185 0.260 0.555
1.000
=148/800 =208/800 =444/800
19
x 800
Trình độ học Không thích Không thích Thích Xác suất
vấn không ghét
Trung học
(n=430) 0.185*0.537 0.260*0.537 0.555*0.537 0.537
Cao đẳng
(n=160) 0.185*0.200 0.260*0.200 0.555*0.200 0.200
Đại học
(n=210) 0.185*0.263 0.260*0.263 0.555*0.263 0.263
20
Tính giá trị kỳ vọng
Trình độ Không Không thích Thích Xác suất
học vấn thích không ghét
Trung học
(n=430) 79 112 238 0.537
Cao đẳng
(n=160) 30 42 89 0.200
Đại học
(n=210) 39 55 117 0.263
0.537*0.185*800 = 79
0.555*0.263*800 = 117
21
Giá trị kỳ vọng và giá trị quan sát
Trung học
(n=430) 79 (91) 112 (104) 238 (235)
Cao đẳng
(n=160) 30 (39) 42 (73) 89 (48)
22
So sánh
23
Trình độ học Không thích Không thích Thích
vấn không ghét
Trung học
(n=430) 79 (91) 112 (104) 238 (235)
Cao đẳng
(n=160) 30 (39) 42 (73) 89 (48)
24
Tính p value bằng cách tra Bảng hoặc sử dụng excel.
25
Kết quả
• Tra bảng và so sánh χ2t trong phép so sánh.
• Kết luận: Trình độ học vấn có ảnh hưởng đến mức độ yêu
thích sản phẩm nước giải khát (điều tra trên 800 người), p<
0,01.
26
Tóm lại
27
Sử dụng phần mềm SPSS để tính
28
29
Trắc nghiệm Friedman
• Tính chuẩn X2 theo công thức:
• Trong đó:
• n là số người thử (số lần lặp lại)
• p là số sản phẩm (nghiệm thức)
• Tp là tổng cột sản phẩm (nghiệm thực) thứ p.
• Độ tự do cho =p-1
• So sánh và (tra bảng) ➔ chấp nhận hay bác bỏ.
30
Friedman test for ranked data
• Để đánh giá sự khác nhau giữa các mẫu thử, cần tính sự
khác nhau nhỏ nhất giữa hai giá trị tổng cột của các
mẫu:
32
Phân biệt – Tổng thể Phân biệt – Thuộc tính Mô tả Thị hiếu
Phép thử tam giác Phép thử cặp đôi có Cặp đôi thị
(Triangle test) định hướng (Directional hiếu
pair comparison test)
Phép thử 2-3 (Duo-Trio Phép thử so hàng đơn So hàng thị
test) giản (Ranking test) hiếu
Phép thử 2-5 (Two out Phép thử cho điểm chất Cho điểm thị
of Five) lượng (TCVN 3215-79) hiếu
33
Nhóm Phép thử Cách xử lý số liệu Công thức/ Bảng tra cần lưu ý
- Tra bảng “Số câu trả lời đúng tới - Bảng T14
hạn/ tối thiểu dành cho 2-5”
Cặp đôi - Χ2 - → Tra bảng T5
- Chuyển điểm (Bảng Ficher và - Chuyển thứ hạng sang điểm dựa
Yates, 1942) vào Bảng Ficher và Yates → Xử lý
Anova → LSD
Cho điểm Dựa số Điểm chung, theo quy Lưu ý: Yêu cầu về điểm trung bình
chất lượng định của từng TCVN chưa có trọng lượng đối với các chỉ tiêu
35
CQV A B C
1 1 2 3
2 1 3 2
3 2 3 1
4 2 3 1
5 1 2 3
6 1 3 2
7 1 3 2
8 2 1 3
9 3 2 1
10 1 2 3
11 2 1 3
Tổng điểm 17 25 24
36
Nhóm Phép thử Cách xử lý số liệu Công thức/ Bảng tra cần lưu ý
Phép thử - Ma trận thuật ngữ cho
mô tả sản phẩm
37
Tam giác
Một công ty sản xuất rượu vang đang dự định thay đổi nhà cung
cấp nho mới. Công ty quyết định tiến hành một phép thử tam giác
với mục đích xác định liệu có sự khác biệt nào giữa rượu vang
được sản xuất từ nho của nhà cung cấp cũ và nhà cung cấp mới
hay không. Công ty chọn mức ý nghĩa cho sự khác biệt có thể tìm
thấy là 5%. 36 người thử không qua huấn luyện tham gia phép
thử, trong đó có 19 người thử tìm ra đúng mẫu khác.
Yêu cầu:
2. Với kết quả thu được, chúng ta có thể đưa ra kết luận gì?
38
2-3
STT Trật tự mẫu Mã hóa mẫu Lựa chọn Kết quả
39
So sánh cặp đôi
Một sơ sở sản xuất cải tiến công thức bằng cách bổ sung
đường vào bánh ngọt. Công ty thực hiện đánh giá cảm quan
nhằm so sánh 2 mẫu bánh A (bổ sung đường) và B (đối
chứng) xem 20 cảm quan viên có nhận thấy được sự khác biệt
của hai mẫu bánh hay không. Kết quả cho thấy có 12 CQV
nói mẫu bánh A ngọt hơn mẫu bánh B.
Liệu chúng ta có thể kết luận mẫu A ngọt hơn mẫu B hay
không?
40
So hàng
Giả sử có 8 người thử tham gia vào phép thử so hàng mùi tinh dầu
chanh của 4 mẫu nước chanh hòa tan, kết quả được tập hợp trong
bảng:
CQV A B C D
1 4 2 1 3
2 4 3 1 2
3 3 1 2 4
4 3 2 1 4
5 4 1 2 3
6 4 3 1 2
7 4 2 1 3
8 4 1 2 3
Tổng điểm
41
A – not A
Một nhà nghiên cứu chất tạo ngọt thay thế cho sản phẩm nước giải
khát có sử dụng 5% đường sucrose trong công thức hiện tại. Các
phép thử nếm sơ bộ đã xác lập 0,1% chất tạo ngọt mới tương
đương với 5% sucrose nhưng nếu phải nếm nhiều mẫu thì tạo sai
lệch trong phép thử do dư vị ngọt và các yếu tố mùi vị khác tác
động. Nhà nghiên cứu muốn biết liệu có thể phân biệt được vị của
hai loại nước giải khát này không.
Người thử Người thử nhận mẫu
Tổng
trả lời A Không A
A 60 35 95
Không A 40 65 105
Tổng 100 42 100 200
Giá trị này lớn hơn giá trị của Phụ lục 11 (độ tự do df =
1, α = 0,05, χ2 = 3,84)
43
A – not A
Cơ sở sản xuất cá hộp muốn thay đổi lon. Họ muốn kiểm tra xem
sản phẩm cá hộp với lon mới (mẫu “không A”) có giống với sản
phẩm cũ (mẫu “A”) đang được tiêu thụ hay không.
21 cảm quan viên được mời tham gia phép thử. Mỗi cảm quan viên
sẽ được nhận 12 mẫu khác nhau, trong đó có 6 mẫu “A” và 6 mẫu
“không A”. Kết quả được trình bày trong bảng.
Giá trị này lớn hơn giá trị của Phụ lục 11 (độ tự do df =
1, α = 0,05, χ2 = 3,84)
45
Cho điểm theo TCVN
Phân loại chất lượng của 2 mẫu nước ngọt có gas theo TCVN 3215-79
Loại trung bình 11,2 – 15,1 Mỗi chỉ tiêu lớn hơn hoặc bằng 2,8
Loại kém: không đạt mức chất lượng quy định trong
7,2 – 11,1 Mỗi chỉ tiêu lớn hơn hoặc bằng 1,8
tiêu chuẩn nhưng còn khả năng bán được.
47
Rượu Bia Nước giải khát Nước quả Quả nước
có gas đường
Độ trong 0,8 Bọt 0,8 Độ trong 0,6 Màu 1,2 Màu sắc 0,8
và màu sắc cái
Mùi 1,2 Độ trong, 0,4 Màu 0,4 Mùi – vị 2 Hình thái 1,2
màu
Vị 2 Mùi 0,8 Mùi 1,2 Hình thái 0,8 Mùi – vị 1,6
Vị 2 Vị 1,8 Nước 0,4
48
Hướng dẫn sử dụng phần mềm JMP
49