Download as pdf or txt
Download as pdf or txt
You are on page 1of 14

9/16/2016

TỔNG QUAN CÁC GIAI ĐOẠN


CHƯƠNG 6 XỬ LÝ DỮ LIỆU
1. Giá trị hóa dữ liệu (Phê chuẩn dữ liệu).
2. Hiệu chỉnh lại các câu trả lời có thể
QUÁ TRÌNH XỬ LÝ chấp nhận (Sửa lại sai sót do ghi chép).
3. Mã hóa dữ liệu.
DỮ LIỆU 4. Nhập dữ liệu.
5. Lọc dữ liệu.
6. Lưu trữ dữ liệu.
7. Phân tích dữ liệu.

GIÁ TRỊ HÓA dữ liệu CÁC BƯỚC HIỆU CHỈNH Dữ Liệu


(⑴)Tại hiện trường (Hiệu chỉnh sơ bộ):
• Xem xét dữ liệu đã thu thập có Mục tiêu:
- Đảm bảo thủ tục phỏng vấn phù hợp.
thực sự có gía trị? Nếu không - Sửa chữa các sai sót khi lấy số liệu thực địa.
thì bỏ; Các sai sót thường gặp:
- Người được phỏng vấn có phù hợp không?
Cần xem xét: - Trả lời có đầy đủ không?
- Câu trả lời có rõ không hay có đúng không (quan
1. Dữ liệu thu thập có đúng đối trọng đối với những câu hỏi mở)?
tượng? • Phỏng vấn viên hiệu chỉnh ngay sau khi kết thúc
phỏng vấn:
2. Các biện pháp thu thập có Phỏng vấn lại các câu hỏi bỏ sót;
Chỉnh các phần viết tắt, ký hiệu, viết chưa kịp.
đúng yêu cầu?

CÁC BƯỚC HIỆU CHỈNH DỮ LIỆU


• Giám sát viên hiệu chỉnh khi các phỏng vấn (2) Tại trung tâm (Hiệu chỉnh cuối
viên nộp bảng câu hỏi đã hiệu chỉnh xong.
cùng):
Giám sát viên sẽ kiểm tra:
• Do bộ phận xử lý thực hiện trước
• Hoàn tất? khi nhập dữ liệu; kiểm tra toàn bộ
• Phỏng vấn nghiêm túc? các lỗi & nhất là tính hợp lý giữa n
• Rõ ràng? bảng câu hỏi.
• Hợp lý? NOTE:
• Việc hiệu chỉnh phải rất thận trọng

Marketing Research 1
9/16/2016

MÃ HÓA DỮ LIỆU MÃ HÓA DỮ LIỆU


• Với các câu hỏi đóng việc mã hóa
• Là quá trình chuyển đổi các câu trả thực hiện 1 lần trước khi tiến hành
lời thành dạng mã số để thuận lợi thu thập thông tin.
cho việc nhập & xử lý dữ liệu. • Với câu hỏi mở phải mã hóa 2 lần:
• Mã hóa trước : Chọn các mã số từ (1) Tạo mã trước khi phỏng vấn thông
khi thiết kế bảng câu hỏi, in các mã qua việc dự đoán trước các trả lời
số lên ngay bảng câu hỏi để giảm sẽ xuất hiện.
thời gian chuẩn bị xử lý dữ liệu. (2) Hiệu chỉnh mã nếu có sai lệch khi
phỏng vấn xong.

CÁCH THỨC ĐỂ TẠO LẬP MÃ


Cho từng câu hỏi, ấn định trước bao • A/c đã từng mua những nhãn hiệu dầu
nhiêu người có thể trả lời như vậy nhớt nào sau đây? (có thể chọn nhiều
người nghiên cứu chỉ đơn giản ghi mã hơn 1)
lên bảng câu hỏi. (1)Castrol(2)BP(3)Shell
• A/C có mua dầu nhớt Castrol không? (4)Total(5)Mobil(6)Catex(7)Khác
Q1 (1)Có(2)Không
• A/C có mua dầu nhớt BP không?
Q2(2)Có(2)Không

CÁC NGUYÊN TẮC MÃ HÓA NGUYÊN TẮC MÃ HÓA dữ liệu

• A/c vui lòng phân hạng 3 nhãn hiệu


thường mua nhất (1:mua thường nhất; • Số kiểu mã hóa phải đủ lớn để bao
2:mua thường nhì; 3:mua thường thứ 3) quát hết các sự kiện trong dữ liệu,
( )Castrol( ) BP ( ) Shell()Total ( ) Mobil đảm bảo tất cả tình huống trả lời
• A/c vui lòng đánh dấu 1 nhãn hiệu thường đều được mã hóa.
mua nhất
CastrolBPShellTotalMobil
(1) (2) (3) (4) (5)

Marketing Research 2
9/16/2016

NGUYÊN TẮC MÃ HÓA dữ liệu NGUYÊN TẮC MÃ HÓA dữ liệu


• Việc mã hóa không được chồng chéo
nhau (Bất kỳ tình huống trả lời nào chỉ • Không được để mở khoảng cách
có 1 mã mà thôi (Xếp loại này thì không lớp của mã hóa:
xếp vào loại khác)). VD: 1- 2 triệu>2 tr> 3 triệu
Vd: Doanh nghiệp a/c thuộc loại hình nào?
(⑴)Sản xuất (2) Kinh doanh
(3) Dịch vụ - thương mại. • Nếu có thể được thì khoảng cách
các lớp nên tương đương nhau.

NHẬP dữ liệu NHẬP dữ liệu


• Mỗi câu hỏi chỉ có 1 trả lời  Mỗi • A/c có mua dầu nhớt Castrol không?
câu hỏi chứa đựng 1 biến số. (⑴)Có(2) Không

• Nếu câu hỏi có nhiều trả lời, mỗi • A/c đã từng mua các nhãn hiệu dầu
nhớt nào sau đây? (có thể chọn nhiều
trả lời phải có nhiều biến tách biệt.
hơn 1)
CastrolBPShellTotalMobil
(1)(2)(3)(4)(5)

NHẬP dữ liệu NHẬP DỮ LIỆU


• A/c vui lòng phân hạng 3 nhãn hiệu
thường mua nhất (1:mua thường nhất; • Bảng tính đơn là bảng tính để tính
2:mua thường nhì; 3:mua thường t.3) toán 1 biến số.
()Castrol ()BP ()Shell ()Total ()Mobil
• Bảng tính phức tạp là bảng tính thể
hiện quan hệ giữa 2 biến số hay
• A/c vui lòng đánh dấu 1 nhãn hiệu
thường mua nhất giữa nhiều biến số với nhau.
Castrol BPShell TotalMobil
(1)(2)(3) (4)(5)

Marketing Research 3
9/16/2016

LỌC DỮ LIỆU PHÂN TÍCH DỮ LIỆU


• Phân tích không phải là việc chạy máy,
• Cần phải kiểm tra độ chính xác của in ra kết quả thống kê;
việc nhập dữ liệu • MR: không phải là những con số, bảng
• Bốc ngẫu nhiên 1 số bảng câu hỏi biểu (kỹ thuật thống kê, máy tính);
& kiểm tra với số liệu nhập trong • Nội dung phân tích dữ liệu dựa trên
máy. danh mục nhu cầu thông tin (Việc Phân
tích phải được xác định từ trước khi
• Rửa dữ liệu: chạy 1 số bảng tần số tiến hành công tác thu thập, không bao
cho từng biến  để phát hiện giờ chờ đến khi dữ liệu đã thu thập rồi
những trị số bất hợp lý. mới bắt đầu suy nghĩ về cách phân tích
là quá muộn).

Các bước phân tích dữ liệu NOTE: PHÂN TÍCH dữ liệu


1. Xác định loại dữ liệu thu thập được.
• Để viết 1 bảng phân tích tốt, phải bắt
2. Xác định những nội dung cần phân tích đầu từ những thông tin tổng quát &
để mô tả kết quả xử lý dữ liệu. đơn giản (Mức độ đơn giản nhất là
3. Chọn kỹ thuật phân tích tương thích với phân tích từng biến số hay từng câu
yêu cầu của từng nội dung. hỏi 1).
4. Xử lý kết quả. • Sau đó mới xem xét các mối liên hệ
5. Đọc kết quả xử lý, phát hiện ra những đặc biệt & phức tạp.
mô hình có tính qui luật, chọn lựa phép
thống kê đủ tin cậy để kiểm nghiệm kết • Phải trung thực: Không phóng đại/ bóp
quả. méo;
6. Viết phần diễn giải. • Mẫu nhỏ có thể giới hạn thông tin.

NOTE: PHÂN TÍCH DỮ LIỆU


• Từ kết quả của mẫu nghiên cứu phải rút ra
kết luận về tổng thể nghiên cứu.
PHÂN TÍCH SƠ BỘ
• 2 vấn đề cần làm rõ:
– Trị thống kê của mẫu có thực sự đúng với
tổng thể?
– Nếu có sai lệch thì sai lệch đó là bao
nhiêu có thể chấp nhận được để vận dụng
vào thực tế?
 Thông tin từ mẫu sẽ ước lượng thông tin
cho toàn bộ thị trường. Vấn đề này đòi hỏi
ước lượng khoảng, ước lượng điểm. 24

Marketing Research 4
9/16/2016

Thang đo ĐỊNH DANH NOTE khi PHÂN TÍCH dữ liệu


• Mô tả: TẦN SỐ, %; • Tường trình không nên tập trung
• Khi thuyết trình kết quả: ĐỒ THỊ vào từng con số mà nhằm vào việc
TRÒN, hoặc CỘT. nhận ra các qui luật của dữ liệu,
• Kiểm định Chi-square: chỉ cần viết về những con số thể
Kiểm tra xem phân phối quan sát hiện được các ý chính.
được có khác đáng kể so với phân
phối kỳ vọng không?
25

Kiểm định Chi-square Kiểm định Chi-square


• Thang đo định danh.
• Oj : Số quan sát thực tế của
• Dữ liệu thu thập được xếp theo 1
tiêu chí/ yếu tố.
từng hạng mục (Oj ≥ 5).
• Mỗi quan sát phải và chỉ thuộc về 1 • Ej : Số quan sát của từng hạng
nhóm mà thôi. mục theo giả thuyết H0.
• H0: Xác suất quan sát rơi vào từng X = Ʃ (Oj - E j )2
2

mục như nhau. (Quan sát thực tế Ej


có khác biệt đáng kể so với phân
phối kì vọng).

Kiểm định Chi-square Vd1: 1 công ty kinh doanh nước giải


khát muốn kiểm định kích thước chai
Hạng mục 1 2 j k Tổng bằng cách chọn ngẫu nhiên 500 người
tiêu dùng hỏi xem họ thích mua loại
Số quan O1 O2 Oj Ok n
sát thực tế nào trong 4 cỡ chai 200ml, 300ml,
800ml, 1250ml.
Xác suất p1 p2 pj pk 1
Kiểm nghiệm của công ty về các
(H0 )
khách hàng của mình là 30% - 200ml,
Số quan E1 = E2 = Ej = Ek = n 30% - 300ml, 20% - 800ml, 20% -1250ml.
sát H0 np1 np2 npj npk

Marketing Research 5
9/16/2016

VD2: Kiểm nghiệm tại sao công ty đa quốc gia


Độ tin cậy 95% chọn hình thức xâm nhập thị trường quốc tế
Df = k -1, k: số hạng mục lựa chọn là xuất khẩu bằng cách phỏng vấn 35 công
t y c h o t h ấ y :
Cỡ chai 200ml 300ml 800ml 1250ml
1. Đối phó với thị trường trong nước đang bị
c o d ầ n ( P O A P ) .
Số quan 140 130 110 120 2. Tích cực mở rộng thị trường để phát triển
sát thực (IOAP). Độ tin cậy 95%.
tế
Loại chiến lược POAP IOAP
Ho
Số quan sát 11 24
thực tế
Số quan E1 = np1 HO
sát Ho Số quan sát HO

Kiểm định TỶ LỆ ĐƠN p Kiểm định TỶ LỆ ĐƠN p


Biến ngẫu nhiên phân phối theo Biến ngẫu nhiên phân phối
qui luật 0 - 1 theo qui luật 0 - 1
• Kiểm nghiệm giả thiết so sánh
• n ≥ 40 và np, nq ≥ 5
giữa tỉ lệ của tổng thể với 1 giá
trị định trước. • pS: tỉ lệ thành công trong mẫu.
Vd: Có phải tỉ lệ số hộ ở TP.HCM • p0: tỉ lệ thành công trong tổng
có tivi lớn hơn đáng kể so với thể.
50%? • Ztt = (pS –p0 )/ (p0 q0 /n)1/2

Kiểm định TỶ LỆ ĐƠN p Vd1: Trong 1 nghiên cứu khám phá, công
Biến ngẫu nhiên phân phối ty mỹ phẩm Sài Gòn thấy rằng đa số
người tiêu dùng TP.HCM đều biết thương
theo qui luật 0 - 1 hiệu “Miss Saigon”. Công ty lập giả
• H0 : p = p0 Bác bỏ H0 nếu IZI > Z α/2 thuyết là mức độ nhận biết thương hiệu
H1 : p ≠ p0 “Miss Saigon” ở TP là rất cao, có thể đạt
• H0 : p ≤ p0 Bác bỏ H0 nếu Z > Z α được từ 80% trở lên. Để kiểm định giả
thuyết trên. Chọn mẫu ngẫu nhiên, 300
H1 : p > p0 người với câu hỏi. “Trong các thương
hiệu sau đây bạn đã biết đến nhãn hiệu
• H0 : p ≥ p0 Bác bỏ H0 nếu Z < - Z α loại nào?.....”. Kết quả 70% người tiêu
dùng biết thương hiệu “MissSG”. Độ tin
H1 : p < p0
cậy là 95%.

Marketing Research 6
9/16/2016

Vd2: Hiện tại cứ trong 10 người uống bia Vd3: 1 công ty sản xuất vỏ xe
thì chỉ có 1 người thích bia nhãn hiệu hơi chiếm 42% thị trường
A. Sau chiến dịch quảng cáo cho loại
(trước đây). Hiện tại, trước sự
bia A, công ty khảo sát 1 mẫu ngẫu
nhiên 200 người uống bia để kiểm tra
cạnh tranh của đối thủ, công ty
hiệu quả của quảng cáo, thì thấy có 26 muốn kiểm tra thị phần của
người thích loại bia A trong 200 người công ty có còn 42% ? Chọn
này. Thông tin này có đủ để kết luận có ngẫu nhiên 550 xe hơi trên
sự gia tăng tỷ lệ những người thích đường, kết quả có 219 xe sử
uống bia hiệu A? Chọn độ tin cậy là dụng vỏ xe của công ty. Kết
90%. luận gì? Với α = 5%.

Ước lượng XÁC ĐỊNH KHOẢNG TIN CẬY

p = ps + Zα/2 (ps * qs )1/2 • Ta có 25% phần tử trong mẫu


(n =100) ưa thích nhãn hiệu A.
Độ tin cậy là 90%. Vậy có
ps : Xác suất xuất hiện khoảng bao nhiêu % phần tử
hiện tượng ở mẫu. trong tổng thể ưa thích nhãn
hiệu A?

THANG ĐO THỨ TỰ Kiểm định Kolmogorov–Smirnov


• Kiểm nghiệm tần số với thang
• Trình bày bằng: TẦN SỐ, TỶ LỆ %, đo thứ tự.
% TÍCH LŨY. • H0: Không có sự phân biệt giữa
• Kiểm định: Kolmogorov – Smirnov. các xử lý.
Kiểm tra xem phân phối quan sát • D = Max I F(O) – F(H0 ) I
được có khác đáng kể so với phân
phối kỳ vọng không? • Dα = λα / (n)1/2
• D > Dα  Từ chối H0.

Marketing Research 7
9/16/2016

α 0,5 0,4 0,3 0,2 0,1 0,05 0,02 0,01 0,001 Màu Tần % % tích % tích I F(O) -
số luỹ luỹ H0 F(H0)I
λα ,828 ,895 ,974 1,073 1,224 1,358 1,520 1,627 1,950 F(O) F(H0 )

A 80

• Vd: Để kiểm nghiệm màu sắc của 1 B 60


dạng POP (A: rất nhạt, B: nhạt, C:
đậm, D: rất đậm) chọn 200 người C 40
tiêu dùng, trình bày 4 dạng POP’s
này và cho họ chọn dạng họ thích D 20
nhất. α = 5%

CHỈ SỐ THỐNG KÊ
Thang đo khoảng & thang đo tỷ lệ
(1) ĐO LƯỜNG MỨC ĐỘ TRUNG TÂM
• Mô tả vị trí trung tâm, độ phân tán • Số Trung Bình (Dùng để đại diện cho tập
và hình dáng của hàm phân phối dữ liệu): rất nhạy với Giá trị cực biên 
đám đông. Sử dụng khi hàm phân phối đối xứng.
• Trung Vị: Không chịu ảnh hưởng của các
• Kiểm nghiệm một giá trị trung bình Giá trị ở cực biên ie Giá trị quá lớn /quá
Kiểm nghiệm giả thiết so sánh giữa nhỏ của tập hợp dữ liệu đó  Số trung vị
giá trị trung bình của tổng thể với được dùng để đại diện cho tập dữ liệu có
giá trị định trước. nhiều Giá trị đặc biệt quá lớn /quá nhỏ.

CHỈ SỐ THỐNG KÊ CHỈ SỐ THỐNG KÊ


(1) ĐO LƯỜNG MỨC ĐỘ TRUNG TÂM (2) ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN
• MODE: Gía trị xuất hiện nhiều nhất trong • ĐỘ BIẾN THIÊN: Khoảng biến thiên
tập hợp dữ liệu; dùng để đại diện cho tập
càng lớn thì các gía trị trong tập hợp
hợp dữ liệu khi mà các gía trị trong tập
dữ liệu càng phân tán.
hợp này chênh lệch quá nhiều.
NOTE: • PHƯƠNG SAI (Đo lường mức độ phân
tán của 1 tập số xung quanh Trung
• Nếu Mean & Median xấp xỉ bằng nhau 
Bình của nó): Phương sai càng lớn thì
sử dụng Mean.
tập hợp dữ liệu đó có sự chênh lệch về
• Nếu Mean & Median khác nhau  sử
gía trị giữa các phần tử càng lớn.
dụng Median

Marketing Research 8
9/16/2016

Kiểm nghiệm Kiểm nghiệm


GIÁ TRỊ TRUNG BÌNH ĐƠN GIÁ TRỊ TRUNG BÌNH ĐƠN
• Kiểm nghiệm giả thiết so sánh giữa giá trị • H0 : μ = a0 Bác bỏ H0 nếu ItI > tn – 1,α/2
trung bình của tổng thể với giá trị định
trước. Vd: Kiểm nghiệm trung bình thời H1 : μ ≠ a0
gian chờ để được tính tiền ở siêu thị có
lâu hơn đáng kể so với 10 phút không?
• H0 : μ ≤ a0 Bác bỏ H0 nếu t > tn – 1, α
• Thang đo khoảng hoặc tỉ lệ.
H1 : μ > a0
• n ≥ 30 Ztính toán = (X – μ )* (n)1/2 /Ϭ
• Không biết Ϭ Ztính toán = (X – μ )* (n)1/2 /S
• n < 30 ttính toán = (X – μ )* (n)1/2 /S • H0 : μ ≥ a0 Bác bỏ H0 nếu t < - tn – 1, α
Bậc tự do (n – 1) H1 : μ < a0

• Vd1: 1 nghiên cứu khám phá, công ty A


• Vd2: Cán bộ sở du lịch TP A cho rằng
thấy rằng người tiêu dùng Hà Nội rất ưa giá phòng khách sạn mini trong mùa
thích thương hiệu nước hoa “Miss Sài thấp điểm trung bình không quá
Gòn”. Do vậy công ty thiết lập giả thiết: 168.000 đồng/ngày đêm, một mẫu ngẫu
Nếu tung “Miss Sài Gòn” thì sẽ được thị
trường chấp nhận. Để kiểm định giả thiết
nhiên 25 phòng khách sạn trong thành
này, công ty A nhờ công ty nghiên cứu thị phố được chọn và người ta tính được
trường thực hiện với 1 mẫu ngẫu nhiên xtrung bình = 172.500 đồng/ngày đêm, độ
n= 300 ở Hà Nội, hỏi họ lệch chuẩn tính được từ mẫu này là s =
Nếu “Miss Sài Gòn” được tung ra bạn có 15.400 đồng/ngày đêm. Hãy kiểm định
mua dùng ngay hay không?
câu phát biểu của vị lãnh đạo này đúng
(1)= Chắc chắn không, (5) = Chắc chắn mua
hay không? Mức ý nghĩa của bài toán
Độ tin cậy = 95%, Trung bình = 3,98, Độ lệch
chuẩn = 0,4 là 5%.

Kiểm nghiệm 2 TRỊ TRUNG BÌNH Kiểm nghiệm 2 TRỊ TRUNG BÌNH
của 2 tổng thể độc lập của 2 tổng thể độc lập
• Kiểm nghiệm giả thiết so sánh giá • n ≥ 30
trị trung bình tổng thể của 2 tổng Ztt = [(X1 – X2 ) – (μ1 – μ2 )] / [(Ϭ12
thể độc lập. /n1) + (Ϭ22 /n2 )] 1/2.
• Vd: Có phải chi phí cho thuốc men
bình quân đầu người ở TP.HCM • Không biết Ϭ
cao hơn đáng kể so với Hà Nội
không? Ztt = [(X1 – X2 ) – (μ1 – μ2 )] / [(S12
/n1) + (S22 /n2 )] 1/2.
• Thang đo khoảng hoặc tỉ lệ.

Marketing Research 9
9/16/2016

Kiểm nghiệm 2 TRỊ TRUNG BÌNH


• Vd1: Một hãng viễn thông tiến
của 2 tổng thể độc lập
hành kiểm định có hay không có
• H0 : μ1 = μ2 Bác bỏ H0 nếu IZI > Zα/2
sự khác biệt trong thu nhập trung
H1 : μ1 ≠ μ2 bình của các khách hàng nam và
nữ. Họ chọn mẫu ngẫu nhiên 200
• H0 : μ1 ≤ μ2 Bác bỏ H0 nếu Z > Zα nam khách hàng và 100 nữ khách
H1 : μ1 > μ2 hàng. Thu nhập trung bình của các
khách hàng nam là 43.390 $, của
nữ là 42.400 $, SNAM = 7.300 $, SNỮ
• H0 : μ1 ≥ μ2 Bác bỏ H0 nếu Z < - Zα = 8.200$. MứC Ý NGHĨA CủA KIểM
H1 : μ1 < μ2 ĐịNH LÀ 0,05.

Kiểm nghiệm 2 TRỊ TRUNG khi Kiểm nghiệm 2 TRỊ TRUNG khi
các mẫu PHỤ THUỘC các mẫu PHỤ THUỘC
• Kiểm nghiệm giả thiết so sánh 2 trị trung • n ≥ 30
bình tổng thể của cùng 1 tập đơn vị Ztính toán = (d – μd ) * (n)1/2 / Ϭd
mẫu.
• Vd: Trên cơ sở dữ liệu thu thập được từ
• Không biết Ϭd
1 nhóm các hộ gia đình trước và sau 1
chiến dịch quảng cáo sản phẩm ABC. Ztính toán = (d – μd ) * (n)1/2 / Sd
Có phải lượng mua bình quân thay đổi
đáng kể trước và sau khi quảng cáo?

Kiểm nghiệm 2 TRỊ TRUNG khi Kiểm nghiệm 2 TRỊ TRUNG khi
các mẫu PHỤ THUỘC các mẫu PHỤ THUỘC
• H0 : μd = 0 Bác bỏ H0 nếu IZI > Z α/2
Sd : Độ lệch chuẩn chung.
H1 : μd ≠ 0
Ϭd : Độ lệch chuẩn tổng thể của các
chênh lệch.
• H0 : μd ≤ 0 Bác bỏ H0 nếu Z > Zα
n: cỡ mẫu.
H1 : μd > 0

• H0 : μd ≥ 0 Bác bỏ H0 nếu Z < - Zα


H1 : μd < 0

Marketing Research 10
9/16/2016

Kiểm nghiệm 2 TỈ LỆ Kiểm nghiệm 2 TỈ LỆ


(Biến ngẫu nhiên phân phối • Z = [(ps1 – ps2 ) - (p1 – p2 )]/ {ps*qs *
theo qui luật 0 -1, đo trên 2 mẫu [(1/n1) + (1/n2 )]}1/2
khác nhau) • Ước lượng chung cho tỉ lệ của
mẫu kết hợp
• Kiểm nghiệm so sánh tỉ lệ tổng thể ps = (n1*ps1 + n2*ps2 ) / (n1 + n2)
của 1 biến trong 2 tổng thể khác
• Sai số chuẩn (p1 - p2 )
nhau.
Sp1 –p2 = {ps *qs *[(1/n1) + (1/n2 )]}1/2
Vd: Có phải tỉ lệ số hộ có 2 người đi
làm ở TP.HCM thấp hơn ở Hà Nội? Điều kiện: n1 *ps1 , n2 *ps2 ≥ 5

Vd1: Nhà nghiên cứu muốn biết


Kiểm nghiệm 2 TỈ LỆ liệu tỉ lệ thường đọc 1 tờ báo
• H0 : p1 = p2 Bác bỏ H0 nếu IZI > Z α/2 nhất định vào năm 2010 có
H1 : p1 ≠ p2 khác biệt nhiều so với năm
2008, dựa vào 2 mẫu ngẫu
• H0 : p1 ≤ p2 Bác bỏ H0 nếu Z > Z α nhiên
H1 : p1 > p2
• n1 = 400 năm 2008 , pS1 = 42,5%.
• H0 : p1 ≥ p2 Bác bỏ H0 nếu Z < - Z α • n2 = 200 năm 2010 , pS2 = 35%.
H1 : p1 < p2 α = 5 %. Liệu sự chênh lệch có
đáng kể hay không?

• Vd2: Giả sử một công ty muốn so


Vd3: Một khu nghỉ dưỡng tiến hành một
sánh mức độ nhận biết nhãn hiệu cuộc khảo sát sự hài lòng của khách
X của người tiêu dùng Hà Nội và hàng sau khi họ nghỉ tại đây, trong bảng
TP.HCM, α = 10%. Kết quả như câu hỏi có một câu hỏi về việc khách
sau: hàng có dự định quay lại đây không?
Hà Nội n1 = 200, Số người nhận biết Có bằng chứng về sự khác biệt trong
X là 100 người. mức độ hài lòng của khách hàng ở khu
A và B hay không? α = 10%. Kết quả
TP.HCM n2 = 250, Số người nhận
như sau:
biết X là 110 người.
Khu A n1 = 227, số người dự định quay lại
Liệu sự chênh lệch có đáng kể hay là 163 người. Khu B n2 = 262, số người
không? dự định quay lại là 154 người.

Marketing Research 11
9/16/2016

Kiểm nghiệm CHI-SQUARE Kiểm nghiệm CHI-SQUARE


• Mục đích: xác định sự tồn tại mối • Hạn chế của kiểm định
quan hệ giữa 2 biến định danh/ thứ Chi–square:
tự. - Chỉ xác định có quan hệ hay
• Yêu cầu: không, không cho biết mức độ
- Không có ô nào có số lần xuất hiện tương quan.
kì vọng < 1. - Không thích hợp cho kiểm tra dữ
- Không quá 1/5 tổng số ô có số lần liệu cùng 1 biến nhưng được thu
xuất hiện < 5. thập ở thời điểm khác nhau.

Kiểm nghiệm CHI-SQUARE Kiểm nghiệm CHI-SQUARE


• Hệ số Contingency: Hệ số bổ sung
vào kiểm nghiệm Chi –Square để • Thường dùng hệ số thống kê
biết mức độ quan hệ giữa 2 biến. Cramer:
C = [ X2 / (n + X2 )]1/2 v = [ X2 / n(df - 1 )]1/2
C = 0: KHÔNG CÓ QUAN HỆ GIữA v = 0: Không có quan hệ.
CÁC BIếN. v = 1: Có quan hệ hoàn hảo.
C KHÔNG CÓ CHẶN TRÊN  KHÓ
DIỄN DỊCH.

Vd1: Có 2 sản phẩm A, B. Kiểm nghiệm


mối liên hệ giữa việc chọn sản phẩm và
Kiểm nghiệm CHI-SQUARE độ tuổi của người tiêu dùng, mẫu ngẫu
• H0 : Không có mối liên hệ giữa nhiên n = 1.140, độ tin cậy: 95% kết quả
2 biến (định tính – định tính). như sau:
• df = (r - 1) (c – 1) Độ tuổi Sp A Sp B Tổng
• X2 = ƩƩ(Oij – Eij )2 ≤ 25 92 172 264
Eij 26 - 35 166 211 377
Điều kiện Eij ≥ 5 36 - 45 114 97 211
Eij = Ri * Cj / n ≥ 46 188 100 288
Oij : số quan sát thực tế. Tổng 560 580 1.140

Marketing Research 12
9/16/2016

• Vd2: Một nhà nghiên cứu thị Loại Hãng Hãng Hãng Hãng Tổng
trường muốn xác định mối tương xe A B C D
quan có thể có giữa kích cỡ xe hơi Nhỏ 157 65 181 10 413
và hãng sản xuất đối với các xe
mới được mua trong thời gian gần Trung 126 82 142 46 396
đây. Một mẫu 1000 xe mới mua bình
trong nước đã chọn ngẫu nhiên và
phân loại theo kích cỡ và hãng sản Lớn 58 45 60 28 191
xuất. Độ tin cậy: 95% Dữ liệu thu
được: Tổng 341 192 383 84 1000

PHÂN TÍCH TƯƠNG QUAN • r = 0  Không tương quan (Biết X


sẽ không biết Y).
• Để quan sát sự liên kết giữa 2 hay
nhiều biến số học. • r = 0,2  Tương quan rất yếu,
không đáng kể.
• Hệ số tương quan Pearson
(Pearson’s correlation coefficient - • r = 0,2 – 0,4  Tương quan yếu,
r): Để phát hiện ra mức độ tương thấp.
quan giữa 2 biến định lượng • r = 0,4 -0,7  Tương quan vừa
(Không có giả thuyết về nhân quả). phải.
• Hệ số tương quan cho biết biên độ • r = 0,7 – 0,9  Tương quan mạnh.
và chiều hướng biến thiên của 2 • r > 0,9  Tương quan rất mạnh.
biến tương quan với nhau. • r = 1  Tương quan hoàn hảo
(Cực kì hiếm), (Biết X sẽ biết Y).

PHÂN TÍCH TƯƠNG QUAN

• Tương quan dương: X tăng  Y tăng. Kiểm nghiệm t, để xét xem hệ số


• Tương quan âm: X tăng  Y giảm.
tương quan đó có thật sự là biểu
hiện của một mối tương quan nào
• Tương quan dương hay âm thừa nhận
mối quan hệ tuyến tính. đó.
• Nhiều khi, biến X, Y có tương quan cong. • t = r / [(1- r2) / (n - 2)]1/2
(Sử dụng hệ số Eta để đo lường không n: cỡ mẫu
phải r)
Bậc tự do df = n – 2;
r: hệ số tương quan mẫu.
77

Marketing Research 13
9/16/2016

NHỮNG GỈA ĐỊNH KHI SỬ DỤNG


PHÂN TÍCH TƯƠNG QUAN
HỆ SỐ TƯƠNG QUAN PEARSON
• H0 : ƿ (rho) = 0 (Không có biểu 1. Mối quan hệ tuyến tính.
hiện tương quan). 2. Dữ liệu khoảng.
3. Mẫu ngẫu nhiên.
• H1 : ƿ ≠ 0
4. Phân phối chuẩn.

Bác bỏ H0 nếu ItI > tn-2, α/2


hoặc p-value < α
80

Các mối tương quan giữa số vật dụng sở hữu và


mức độ đồng ý đối với các ý kiến về quảng cáo
trên truyền hình. Hệ số tin cậy 90%
• Ý kiếnrMức ý nghĩa
Cần nêu rõ lợi ích của sp -0,00200,980
Cần nêu rõ nhãn hiệu sp 0,00030,997
Cần nêu rõ chức năng của sp -0,02340,773
Cần nêu rõ tên nước sản xuất-0,01710,833
Cần nêu rõ nơi bán sp-0,4860,550
Cần có tính hài hước0,07050,385
1 thiếu nữ xinh đẹp sẽ hấp dẫn.. 0,00370,963
So sánh trực tiếp 2 sp với nhau0,01510,852
Sức thuyết phục của một ngôi sao-0,15090,062

Marketing Research 14

You might also like