Download as pdf or txt
Download as pdf or txt
You are on page 1of 79

Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

HƯỚNG DẪN PHÂN TÍCH


(SPSS & AMOS)
Chào bạn,

Tôi là Lê Minh (Hellen3000 amosleminh.com)

Tôi thật sự rất vui khi bạn đọc được cuốn tài liệu nhỏ này. Hi vọng nó sẽ giúp
ích được nhiều cho anh chị trong quá trình thực hiện nghiên cứu của mình.
Tài liệu này sẽ luôn được cập nhật thường xuyên về những chủ đề mới trong
phân tích số liệu. Nó được viết theo văn phong đơn giản, thực hành nên rất
dễ hiểu.

Tài liệu này được viết dựa trên kiến thức giới hạn của tôi, kèm theo những
cốp nhặt từ các bậc tiền bối, nên cũng khó tránh sai sót, mong bạn bỏ qua,
hoặc có góp ý xin hãy cho tôi biết để điều chỉnh sớm nhé!

Trong tương lai gần, tôi sẽ cập nhật thêm Hướng dẫn sử dụng phần mềm
Stata, PLS Smart và các cách để đọc phân tích số liệu từ các phần mềm này.

Nếu anh chị nào quan tâm thì hãy send/repply email
(phantichamos@gmail.com) lại cho tôi để lần cập nhật tới tôi sẽ gửi cho các
anh chị bản đầy đủ nhất.

Kính chúc bạn sức khỏe, thành công trong cuộc sống và cố gắng để hoàn thành
tốt nghiên cứu của mình!

Lê Minh

Tài liệu tặng miễn phí

Trang: 1
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Mục lục
Mục lục ....................................................................................................................... 2
CHƯƠNG 1: HƯỚNG DẪN PHÂN TÍCH SPSS ........................................................ 4
1.1. Cách mã hóa và nhập dữ liệu trong SPSS ....................................................... 4
1.2. Thống kê mô tả ............................................................................................... 5
1.3. Phân tích tương quan ...................................................................................... 7
1.3.1. Phân tích tương quan tuyến tính Pearson .................................................. 7
1.3.2. Kiểm định bảng chéo (crosstable) .......................................................... 10
1.4. Phân tích độ tin cậy Cronbach’s alpha .......................................................... 13
1.5. Phân tích nhân tố khám phá EFA .................................................................. 17
1.6. Phân tích hồi qui tuyến tính .......................................................................... 23
1.7. Kiểm định phần dư ....................................................................................... 28
1.7.1. Biểu đồ tần số phần dư chuẩn hóa Histogram ......................................... 29
1.7.2. Biểu đồ phần dư chuẩn hóa Normal P-P Plot.......................................... 29
1.7.3. Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính ........................ 30
1.8. Kiểm định T-Test (Independent Samples Test) ............................................. 31
1.9. Kiểm định One-Way ANOVA ...................................................................... 34
1.10. Phân tích hồi qui Binary Logistic .............................................................. 36
1.10.1. Lý thuyết cơ bản ................................................................................. 36
1.10.2. Các bước phân tích trong SPSS........................................................... 37
1.10.3. Đánh giá độ phù hợp của mô hình....................................................... 39
1.10.4. Kiểm định độ phù hợp tổng quát ......................................................... 39
1.10.5. Kiểm định ý nghĩa các hệ số hồi qui ................................................... 40
1.10.6. Vận dụng mô hình hồi qui nhị phân cho mục đích dự báo ................... 41
CHƯƠNG 2: HƯỚNG DẪN PHÂN TÍCH SEM BẰNG AMOS .............................. 43
2.1. Giới thiệu chung ........................................................................................... 43
2.2. Trình tự phân tích một bài toán SEM ............................................................ 44
2.3. Phân tích EFA cho bài toán SEM.................................................................. 45
2.4. Phân tích nhân tố khẳng định CFA ............................................................... 47
2.5. Phân tích mô hình SEM ................................................................................ 51
2.6. Kiểm định Bootstrap ..................................................................................... 51

Trang: 2
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

2.7. Phân tích cấu trúc đa nhóm ........................................................................... 53


CHƯƠNG 3: HƯỚNG DẪN PHÂN TÍCH STATA .................................................. 55
3.1. Giới thiệu về STATA ................................................................................... 55
3.2. Hướng dẫn cài đặt các hàm không có sẵn trong STATA ............................... 55
3.3. Một số câu lệnh thường dùng trong STATA ................................................. 57
3.3.1. Tạo biến giả (dummy) ............................................................................ 57
3.4. Thống kê mô tả ............................................................................................. 58
3.5. Phân tích tương quan Pearson ....................................................................... 59
3.6. Kiểm định độ tin cậy của thang đo bằng hệ số Cronbach’s alpha .................. 61
3.7. Phân tích nhân tố khám phá (EFA) ............................................................... 63
3.8. Giới thiệu về mô hình GMM ........................................................................ 64
3.9. Giới thiệu về mô hình Blinder-Oaxaca (B-O) ............................................... 64
3.10. Cách chỉnh format file word cho giống với màn hình STATA ................... 64
CHƯƠNG 4: MỘT SỐ VẤN ĐỀ LÝ THUYẾT CẦN QUAN TÂM ......................... 66
4.1. Biến định tính – định lượng .......................................................................... 66
4.2. Kích thước mẫu ............................................................................................ 66
4.3. Bàn sơ về một số phương pháp chọn mẫu nhé .............................................. 67
4.3.1. Phương pháp chọn mẫu xác suất (ngẫu nhiên) ........................................ 67
4.3.2. Phương pháp chọn mẫu phi xác suất ...................................................... 68
4.4. Hướng dẫn xây dựng thang đo ...................................................................... 70
4.5. Một số lưu ý khi làm Bảng câu hỏi khảo sát.................................................. 70
4.6. Các biến trong mô hình nghiên cứu .............................................................. 71
4.6.1. Biến độc lập ........................................................................................... 71
4.6.2. Biến phụ thuộc ....................................................................................... 71
4.6.3. Biến trung gian (mediating variable) ...................................................... 71
4.6.4. Biến điều tiết (moderating variable) ....................................................... 71
4.6.5. Biến kiểm soát (Control variable)........................................................... 72
4.7. Một số rắc rối có thể sẽ gặp phải khi phân tích số liệu .................................. 72
Tài liệu tham khảo ..................................................................................................... 77

Trang: 3
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

CHƯƠNG 1: HƯỚNG DẪN PHÂN TÍCH SPSS

1.1. Cách mã hóa và nhập dữ liệu trong SPSS

Sau khi chúng ta thu thập dữ liệu như Hình 1 bên dưới. Chúng ta tiến hành mã hóa
dữ liệu. Vì SPSS chỉ đọc được dữ liệu là các con số (kiểu number), nên với các câu
hỏi khảo sát có câu trả lời dạng chuỗi (kiểu string) thì chúng ta phải chuyển qua
dạng ký hiệu số. Ngoài ra, tên biến cần phải đặt gọn và rõ ràng. Tên biến trong SPSS
qui định chỉ chứa các ký tự alpha, một vài ký hiệu đặc biệt và số, không chứa khoảng
cách. Quá trình này được gọi chung là mã hóa dữ liệu.

Hình 1 – Dữ liệu thu thập từ google docs

Số liệu sau khi được mã hóa như Hình 2 dưới đây sẽ được đưa vào phần mềm SPSS.

Hình 2 – Dữ liệu đã được mã hóa

Để đưa dữ liệu vào SPSS, chúng ta mở SPSS lên, vào cửa sổ variable view để định
nghĩa biến như Hình 3. Chúng ta gõ tên biến và để mặc định ở hầu hết các cột, chỉ
có cột định nghĩa kiểu thang đo (Measure) là phải chỉ định rõ. Ở đây có 3 kiểu dữ

Trang: 4
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

liệu là scale (thang đo tỷ lệ, như là thang đo likert), ordinal (thang đo thứ tự), và
nominal (thang đo định danh). Kiểu mã hóa cụ thể như bảng sau.
SỐ MÃ HÓA
CÂU HỎI KÝ HIỆU
1 2 3 4
Anh chị thường mua thịt tươi
Nhom_mua Chợ Cửa hàng tiện lợi Co.op Food
sống của Co.op Food ở đâu?
Giới tính Gioi_tinh nam nữ
Tuổi Tuoi Nhỏ hơn 18 tuổi Từ 18 tuổi đến 30 tuổi Từ 31 tuổi đến 45 tuổi Lớn hơn 45 tuổi
Nghề nghiệp Nghe_nghiep Học sinh/Sinh viên Nhân viên văn phòng Nội trợ Khác

Hình 3 – Định nghĩa biến trong SPSS

Sau khi định nghĩa xong biến trong cửa sổ variable view, chúng ta chuyển qua cửa
sổ Data view, và copy dữ liệu từ excel và paste vào đây là OK. Bạn cần lưu ý là sau
khi paste số liệu cần kéo xuống phía dưới cửa sổ để kiểm tra xem dữ liệu vừa dán
có bị lỗi gì hay không nhé.

1.2. Thống kê mô tả

Mean: trung bình cộng


Sum: tổng cộng (cộng tất cả các giá tị trong tập dữ liệu quan sát)
Std. Deviation: độ lệch chuẩn (là căn bậc hai của phương sai)
Variance: (2) phương sai (là bình phương độ lệch chuẩn)
Minimum: giá trị nhỏ nhất
Maximum: giá trị lớn nhất
S.E. mean: sai số chuẩn khi ước lượng trị trung bình

Thống kê mô tả (descriptive statistics) là một phương pháp được sử dụng để mô tả


những đặc tính cơ bản của tập dữ liệu thu thập được từ quá trình khảo sát qua các

Trang: 5
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

cách thức khác nhau. Để thực hiện thống kê trong SPSS, chúng ta thực hiện theo các
bước:

Bước 1: Analyze/Descriptive Statistics/Descroptives…

Bước 2: Chuyển hết các biến cần thống kê qua ô bên phải Variable(s).

Bước 3: Vào Option và lựa chọn các trích xuất thống kê mong muốn

Trang: 6
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bước 4: Nhấn OK và xem kết quả

Cột N thể hiện số lượng quan sát (tương ứng là số bảng hỏi các bạn đã thu về sau
khi gạn lọc dữ liệu). Cột Minimum và Maximum thể hiện giá trị mã hóa nhỏ nhất và
lớn nhất của biến. Cột Mean là giá trị trung bình của N quan sát. Cột Std. Deviation
và Variance là độ lệch chuẩn và phương sai của biến khảo sát. Trong tính toán, độ
lệch chuẩn là căn bậc hai của phương sai, nó cho biết mức độ phân tán của tập dữ
liệu so với giá trị trung bình, độ lệch chuẩn càng cao thì mức độ phân tán của dữ
liệu so với điểm trung bình càng lớn.

1.3. Phân tích tương quan

1.3.1. Phân tích tương quan tuyến tính Pearson

Correlations : Các mối tương quan


N : Số quan sát

Trang: 7
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Pearson Correlation : Hệ số tương quan Pearson


Sig. (2-tailed) : Giá trị sig

Phân tích này sử dụng cho các biến định lượng. Đối với các biến định tính, để kiểm
định mối tương quan giữa chúng, chúng ta sử dụng kiểm định bảng chéo
(crosstables) thông qua kiểm đỉnh chi-square, tìm hiểu ở mục tiếp theo.

Mục đích của việc chạy tương quan tuyến tính Pearson là để kiểm tra giữa biến phụ
thuộc với các biến độc lập có mối tương quan tuyến tính chặt chẽ hay không, nếu
có thì OK, nếu không có thì số liệu của bạn đang gặp vấn đề. Nếu giữa biến phụ
thuộc và biến độc lập không tồn tại tương quan hoặc tương quan kém thì không thể
nào hình thành được phương trình hồi qui tuyến tính. Nên đây là điều kiện bắt
buộc. Ngoài ra, phương pháp này còn cho biết mức độ tương quan giữa các biến
độc lập với nhau. Nếu hệ số tương quan giữa các biến độc lập trong mô hình cao (>
0.8) thì khả năng mô hình xảy ra hiện tượng đa cộng tuyến. Tuy nhiên khi phân tích
tương quan Pearson vẫn chưa chắn chắn kết luận giữa chúng có thật sự tương quan
hay không? Mà phải xem thêm hệ số VIF trong kết quả Phân tích Hồi qui tuyến tính
mới có thể kết luận được. Nếu VIF  10 thì kết luận không xuất hiện hiện tượng đa
cộng tuyến (Hair và cộng sự, 1998; Miles, 2014).

Để phân tích tương quan tuyến tính pearson, chúng ta thực hiện theo các bước sau:

Bước 1: Analyze/Correlate/Bivariate…

Bước 2: Chọn các biến cần phân tích tương quan tuyến tính cho vào ô bên phải. Các
bạn lưu ý, đối với các yếu tố có thang đo được đo lường bởi nhiều quan sát thì

Trang: 8
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

thường là lấy giá trị trung bình để kiểm định, và đặt một cái tên mới – đây gọi là
biến đại diện.

Ở mục Options và Bootstrap các bạn có thể bỏ qua, không quan tâm. Các lựa chọn
khác như hình bên trên.

Bước 3: Đọc kết quả

Chúng ta để ý giá trị Sig. nhé. Nếu Sig.  0.05 (5%) thì tồn tại tương quan, muốn biết
chúng tương quan mạnh hay yếu thì xem ở Hệ số tương quan Pearson (Pearson
Correlation), hệ số này càng lớn thì tương quan càng mạnh.

+ Giữa biến phụ thuộc và biến độc lập: yêu cầu phải tồn tại tương quan, điều đó có
nghĩa là giá trị Sig. của chúng phải nhỏ hơn hoặc bằng 0.05 (5%).

+ Ngược lại, giữa các biến độc lập với nhau: yêu cầu chúng không tồn tại tương
quan, điều đó có nghĩa là giá trị Sig. của chúng phải lớn hơn 0.05. Trong trường hợp
giá trị Sig. này nhỏ hơn hoặc bằng 0.05 thì xác suất xảy ra đang cộng tuyến là rất
cao, do đó cần phải có các kiểm định đa cộng tuyến (phần trình bày phía sau) để
khẳng định vấn đề này.

Ví dụ phân tích tương quan pearson từ bộ dữ liệu mẫu Data01. Các biến QP, AW, AS
và LY là các biến độc lập. RI là biến phụ thuộc.

Trang: 9
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Kết quả phân tích tương quan tuyến tính cho trong Bảng 1 cho thấy, giữa các biến
độc lập có tương quan có ý nghĩa thống kê với biến phụ thuộc RI. Ngoài ra, giữa các
biến độc lập cũng có tương quan lẫn nhau (vì sig. < 5%). Tuy nhiên, điều này chưa
chắc chắn lắm.

Bảng 1 – Kết quả phân tích tương quan Pearson

Giải thích thêm:


**. Correlation is significant at the 0.01 level (2-tailed): tương quan đạt mức ý nghĩa
1% (tốt)
*. Correlation is significant at the 0.05 level (2-tailed): tương quan đạt mức ý nghĩa
5% (khá)

1.3.2. Kiểm định bảng chéo (crosstable)

Mục này sử dụng bộ dữ liệu Data03.

Để kiểm định tương quan tuyến tính đối với các biến định lượng ta sử dụng phân
tích tương quan tuyến tính pearson, còn đối với các biến định tính ta sử dụng
phương pháp crosstable. Giả sử, chúng ta có các biến định tính là xếp hạng, có người
yêu, định hướng học tập, và giới tính. Vậy để kiểm tra xem chúng có mối quan hệ
với nhau hay không, chúng ta làm như sau:

Trang: 10
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Đưa các biến vào ô Columns là các biến cần xem xét có tương quan hay không với
các biến ở ô Rows. Trong mục Statistics chọn Chi-square → Continue.

Đọc kết quả, chúng ta xem dòng Sig đầu tiên của chi-square, nếu sig nhỏ hơn  (mức
ý nghĩa thống kê cho phép), có nghĩa là bác bỏ giả thuyết H0, nên kết luận có mối
quan hệ có ý nghĩa thống kê giữa các biến kiểm định.

Trang: 11
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Kết quả kiểm tra cho thấy, chỉ có ảnh hưởng học tập là có mối quan hệ có ý nghĩa
thống kê (với mức ý nghĩa 10%) với xếp hạng học tập. Còn giới tính nam hay nữ, có

Trang: 12
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

người yêu hay không thì kết quả kiểm định chi-square cho thấy giữa chúng không
có mối quan hệ có ý nghĩa thống kê.

Tuy nhiên, việc kiểm định này cũng chỉ mang tính chất tham khảo, quan trọng là
chúng ta phải có thêm các kiểm định khác để khẳng định. Ví dụ, để xem chúng có
mối liên hệ nào không thì ví dụ bên dưới đây sẽ chạy hồi qui với biến độc lập là có
người yêu, giới tính và định hướng học tập, còn biến phụ thuộc là xếp hạng học tập.

Kết quả cho thấy rằng, chỉ có định hướng học tập là có tác động tích cực lên xếp
hạng học tập, còn có người yêu và giới tính không ảnh hưởng lên xếp hạng. Như
vậy có thể thấy, kết quả kiểm định crosstable ở trên là tương đối chính xác trong
tình huống này.

1.4. Phân tích độ tin cậy Cronbach’s alpha

Corrected Item-Total Correlation : Tương quan biến - tổng hiệu chỉnh


Cronbach's Alpha : Giá trị Cronbach Alpha

Trang: 13
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Cronbach's Alpha if Item Deleted : Giá trị Cronbach Alpha nếu biến này bị loại
bỏ
N of Items : Số biến quan sát
Scale Mean if Item Deleted : Trung bình thang đo nếu biến này bị loại
bỏ
Scale Variance if Item Deleted : Phương sai thang đo nếu biến này bị loại
bỏ
Cronbach (1951) đưa ra hệ số tin cậy cho thang đo, hệ số Cronbach’s Alpha chỉ đo
lường độ tin cậy của thang đo bao gồm từ 2 biến quan sát trở lên chứ không tính
được độ tin cậy cho từng biến quan sát riêng lẻ (Nguyễn Đình Thọ, 2014).

Hệ số Cronbach’s Alpha có giá trị từ 0 đến 1. Về lý thuyết, hệ số này càng cao thì
càng tốt, thang đo càng đạt được độ tin cậy cao. Tuy nhiên, với hệ số Cronbach’s
Alpha quá lớn (≥ 0.95) cho thấy có nhiều biến trong thang đo không có khác biệt gì
nhau, hiện tượng này gọi là trùng lắp trong thang đo (Nguyễn Đình Thọ, 2014).

Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), Hệ số Cronbach’s alpha được
đánh giá như sau:

+ Từ 0.8 đến gần bằng 1 : thang đo lường rất tốt.


+ Từ 0.7 đến gần bằng 0.8 : thang đo lường sử dụng tốt.
+ Từ 0.6 trở lên : thang đo lường đủ điều kiện.

Cũng cần nói thêm, chúng ta có nhiều


nghiên cứu chỉ ra các tiêu chí để khẳng
Độ tin cậy là điều cần thiết
định độ tin cậy của thang đo dựa vào hệ nhưng chưa đủ để cho
số Cronbach’s alpha. Tổng hợp lại có thể một đo lường có giá trị!
nói: Cronbach’s alpha tốt nhất khi nó
biến thiên trong khoảng từ 0.75 đến 0.95. Nếu Cronbach’s
alpha ≥ 0.6 là thang đo có thể chấp nhận được về mặt độ tin cậy (Bernstein và
Nunnally, 1994).

Để phân tích độ tin cậy của thang đo bằng SPSS, chúng ta thực hiện các bước tuần
tự như sau:

Bước 1: Analyze/Scale/Reliability Analusis…

Trang: 14
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bước 2: Chọn các biến quan sát đại diện cho từng nhân tố để đưa vào ô bên phải
Items

Lưu ý: khi phân tích Cronbach’s alpha chúng ta cần thực hiện cho từng nhân tố một.

Bước 3: Vào Statistics và tick chọn những nội dung như hình, trong một vài trường
hợp các bạn cần trích xuất thêm dữ liệu để nghiên cứu thì tick chọn các đối tượng
mình cần.

Trang: 15
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bước 4: Đọc kết quả

Độ tin cậy của thang đo QP là 0.784, giá trị này lớn hơn 0.7 nên có thể kết luận
được rằng, thang đo QP có độ tin cậy tốt, đủ điều kiện để tiến hành các phân tích
khác.

Các bạn cần quan tâm 2 cột A và B trong Bảng Item-Total Statistics bên dưới
nhé:

Trang: 16
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

+ Cột đầu tiên là tên biến quan sát

+ Cột thứ hai là cột hệ số tương quan biến tổng (Corrected Item-Total Correlation).
Cột này các giá trị phải lớn hơn hoặc bằng 0.3 thì biến quan sát đó mới đóng góp
xây dựng độ tin cậy của thang đo, nếu biến quan sát nào có giá trị tương quan biến
tổng nhỏ hơn 0.3 thì bạn cần loại bỏ biến đó ra khỏi thang đo, và tiến hành chạy lại
(Bernstein và Nunnally, 1994).

+ Cột thứ ba (Cronbach Alpha if Item Deleted) là giá trị Cronbach Alpha mới của
thang đo trong trường hợp loại bỏ biến quan sát này đi.

Các bạn lưu ý, trong Bảng Item-Total Statistics nếu biến quan sát nào có hệ số
tương quan biến tổng (Corrected Item-Total Correlation) nhỏ hơn 0.3 thì biến đó
không đạt yêu cầu (Bernstein và Nunnally, 1994).

1.5. Phân tích nhân tố khám phá EFA

EFA (Exploratory factor analysis) : Phân tích nhân tố khám phá


% of Variance : Phần trăm của phương sai
Approx. Chi-Square : Giá trị Chi bình phương xấp
xỉ
Bartlett's Test of Sphericity : Kiểm định Barlett
Component : Nhân tố
Component Matrix : Ma trận nhân tố

Trang: 17
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Cumulative % : Phần trăm tích lũy


Initial Eigenvalues : Giá trị riêng ban đầu
Kaiser-Meyer-Olkin Measure of Sampling Adequacy : Hệ số KMO
Rotated Component Matrix : Ma trận xoay nhân tố
Total : Tổng cộng
Total Variance Explained : Tổng phương sai trích

Trong phân tích EFA mục đích là để kiểm tra các quan sát có đạt được giá trị hội tụ
và giá trị phân biệt hay không. Giá trị hội tụ là các quan sát đại diện cho cùng một
nhân tố chúng hội tụ lại trên cùng một cột khi thực hiện phép quay. Giá trí phân
biệt là các quan sát đại diện cho các nhân tố khác nhau sẽ hội tụ ở những cột khác
nhau để đảm bảo tính phân biệt. Trong nhiều trường hợp, quá trình chạy EFA các
quan sát không nhóm theo từng thang đo cụ thể, mà đôi khi chúng bị tách biệt ra
(Hình 4). Việc này giúp chúng ta phát hiện ra thêm những vấn đề về liên quan đến
việc xây dựng thang đo của tác giả. Nguyên nhân của vấn đề này là do bản chất của
các quan sát này đại diện cho một nhân tố hoàn toàn mới, nó giải thích cho một khái
niệm không nằm trong các thang đo tác giả nghiên cứu. Có nhiều nguyên nhân,
nhưng khả năng là do thang đo xây dựng chưa thật sự phù hợp với khái niệm đo
lường trong nghiên cứu (xem thêm trong phần Hướng dẫn xây dựng thang đo).
Trong trường hợp này, chúng ta cần loại bỏ các biến quan sát đó đi, hoặc giữ lại và
phát sinh thêm một thang đo mới trong mô hình nghiên cứu. Vấn đề bỏ đi hay giữ
lại là do tác giả của nghiên cứu cần lập luận dựa trên từng quan sát cụ thể.

Trong phân tích EFA, hệ số tải nhân tố rất quan trọng, như đã thảo luận ở trên, nó
thể hiện về mặt trực quan tính hội tụ và tính phân biệt của các thang đo. Hệ số tải
nhân tố là mối tương quan của từng biến số và nhân tố. Hệ số tải này cho biết mức
độ tương quan giữa biến và yếu tố, với các nhóm hệ số tải cao hơn sẽ tạo ra biến
đại diện cho yếu tố. Trong phân tích nhân tố khám phá, hệ số tải nhân tố là phương
tiện giải thích vai trò của mỗi biến trong việc xác định từng nhân tố.

Hình 4 – Phân tích EFA xuất hiện các biến tách biệt thang đo.

Trang: 18
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Kết quả quay nhân tố như Hình 4 cho thấy có 3 biến QP4, AW4 và LY5 hội tụ lại
thành một nhân tố mới. Chúng ta cần phải đặt tên cho nhân tố mới này sao cho nó
có tính đại diện nhất với 3 phát biểu tương ứng.

Để tiến hành phân tích EFA trong SPSS, chúng ta thực hiện theo các bước sau đây:

Bước 1: Analyze/Dimension Reduction/Factor…

Trang: 19
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bước 2: Chọn hết các biến quan sát của các nhân tố độc lập (hoặc cả phụ thuộc trong
trường hợp mô hình của bạn có nhiều biến phụ thuộc, và biến trung gian) vào ô bên
phải (variables).

Cần phải nói thêm, việc đưa các biến độc lập hay biến trung gian và biến phụ thuộc
vào chạy EFA, hay chỉ đưa các biến độc lập thôi cũng tùy vào quan điểm nghiên cứu
của tác giả. Thông thường đối với các mô hình nghiên cứu phân tích hồi qui đơn

Trang: 20
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

thuần, tức là mô hình chỉ có đúng 1 biến phụ thuộc và không có biến trung gian, thì
EFA chỉ cần thực hiện với các biến độc lập là được.

Bước 3: Thực hiện các lựa chọn theo hình bên dưới nhé

Chọn KMO trong mục Descriptives để show kết quả KMO trong Output.

Chọn phương pháp trích (Extraction): Đối với mô hình hồi qui tuyến tính, việc chạy
EFA chúng ta sử dụng phương pháp trích Principal components kết hợp với phép
quay varimax.

Bước 4: Đọc kết quả

Chúng ta quan tâm các Bảng sau:

Trang: 21
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Hệ số KMO (Kaiser-Meyer-Olkin) là đại lượng dùng để xem xét sự thích hợp của
phân tích nhân tố. Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008) và Kaiser
(1974), hệ số 0.5 ≤ KMO ≤ 1 là điều kiện đủ để phân tích nhân tố khám phá EFA.
Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố khám phá có khả năng không thích
hợp với tập dữ liệu nghiên cứu. Bên cạnh đó, chúng ta cần phải kiểm định giá trị
Sig. của kiểm định Bartlett. Giá trị Sig. phải nhỏ hơn hoặc bằng 0.05 (5%). Điều
đó khẳng định kiểm định Bartlett có ý nghĩa thống kê, hay nói khác hơn, các biến
quan sát có tương quan với nhau trong nhân tố.

Trị số Eigenvalue là một tiêu chí sử dụng phổ biến nhất để xác định số lượng nhân
tố trong phân tích EFA. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue ≥
1 mới được giữ lại trong mô hình phân tích. Hay nói cách khác trị số Eigenvalue tại
điểm hội tụ ≥ 1 thì đạt, và ngược lại thì số liệu của bạn đang có vấn đề cần phải làm
khảo sát lại (tất nhiên là phải rà soát lại các nguyên nhân làm ảnh hưởng đến chất
lượng số liệu nhé) (Gerbing và Anderson, 1988). Trong kết quả mẫu nghiên cứu
trên, eigenvalue là 1.242 lớn hơn 1.

Tổng phương sai trích viết tắt là TVE, (Total Variance Explained) ≥ 50% cho thấy
mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố
được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến
quan sát (J. C. Anderson & Gerbing, 1988).

Trang: 22
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Lưu ý: trong ma trận xoay, một biến quan sát tải lên ở nhiều nhân tố mà giá trị
chênh lệch hệ số tải dưới 0.3 thì biến đó bị loại vì không đảm bảo được tính phân
biệt trong phân tích nhân tố (Jabnoun & Al‐Tamimi, 2003). Trong kết quả trên, biến
LY5 sẽ bị loại vì biến này không đảm bảo tính phân biệt.

1.6. Phân tích hồi qui tuyến tính

Coefficients : Hệ số hồi quy


Collinearity Statistics : Thống kê đa cộng tuyến
Constant : Hằng số
Durbin-Watson : Giá trị Durbin-Watson
Mean Square : Trung bình bình phương
Model : Mô hình
Model Summary : Tóm tắt mô hình
R, R Square, Adjusted R Square : Giá trị R, R bình phương, R bình phương hiệu
chỉnh
Regression : Hồi quy

Trang: 23
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Residual : Phần dư
Standardized Coefficients : Hệ số hồi quy chuẩn hóa
Std. Error : Sai số chuẩn
Std. Error of the Estimate : Sai số chuẩn của ước lượng
Sum of Squares : Tổng các bình phương
Tolerance : Độ chấp nhận
Unstandardized Coefficients : Hệ số hồi quy chưa chuẩn hóa
VIF : Hệ số phóng đại phương sai

Trước khi thực hiện phân tích hồi qui, chúng ta cần chuyển dữ liệu từ các quan sát
đo lường khái niệm thang đo thành các biến đại diện. Bằng cách lấy giá trị trung
bình của các biến quan sát để làm giá trị cho biến đại diện. Trong ví dụ này, chúng
ta có 5 biến độc lập và 1 biến phụ thuộc, cụ thể như sau:

STT Ký hiệu biến đại diện Ký hiệu biến quan sát Cách tính biến đại diện
LY1
LY2 LY =
1 LY
LY3 (LY1+LY2+LY3+LY4)/4
LY4
AW1
AW =
2 AW AW2
(AW1+AW2+AW3)/3
AW3
AS1
3 AS AS2 AS = (AS1+AS2+AS3)/3
AS3
QP1
4 QP QP2 QP = (QP1+QP2+QP3)/3
QP3
AW4
5 New (biến mới) New = (AW4+QP4)/2
QP4

Anh chị tính trong Excel, sau đó chuyển số liệu vào SPSS theo cách giới thiệu trong
phần mã hóa số liệu. Để thực hiện phân tích hồi qui tuyến tính trong SPSS, chúng ta
làm theo trình tự các bước như sau:

Bước 1: Analyze/Regression/Linear…

Trang: 24
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bước 2: chúng ta đưa đại diện biến phụ thuộc vào ô Dependent, đưa đại diện các
biến độc lập vào ô Independent(s).

Chọn phương pháp đưa biến vào ở ô Method là Enter. Đây là phương pháp mà SPSS
sẽ xử lý tất cả các biến độc lập đưa vào cùng lúc trong mô hình.

Trang: 25
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Nhắc lại: đại diện biến phụ thuộc là một biến mới mà ở đó giá trị của biến này là
trung bình cộng của các biến quan sát cho nhân tố đó. Tương tự, đại diện biến độc
lập là các biến mới mà ở đó giá trị của các biến này là trung bình cộng của các biến
quan sát tương ứng cho nhân tố mà nó đại diện.

Các lựa chọn khác để nguyên, chủ yếu Bảng Statistics, chúng ta thực hiện giống hình
bên dưới là OK.

Bước 3: Đọc kết quả

Bảng Model Summary:

Chúng ta quan tâm 2 chỉ số: thứ nhất là R2 hiệu chỉnh (Adjusted R Square), chỉ số
này thể hiện mức độ tương quan giữa các biến độc lập và biến phụ thuộc trong mô
hình, giá trị của nó càng cao thì cho thấy mô hình phù hợp tốt với dữ liệu nghiên
cứu, hay nói cách khác là mô hình khá hoàn hảo, các biến độc lập trong mô hình giải
thích tốt cho biến phụ thuộc. Thứ hai là chỉ số Durbin-Watson, dùng để kiểm định
tự tương quan của các sai số kề nhau (tương quan chuỗi bậc nhất) có giá trị biến

Trang: 26
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

thiên trong khoảng từ 0 đến 4. Trong phần lớn bài viết nghiên cứu, chúng ta chỉ cần
quan tâm tới chỉ số thứ nhất mới đề cập ở trên – R2 hiệu chỉnh là đủ.

Kết quả của ví dụ cho thấy, R2 hiệu chỉnh là rất thấp (24.2%), điều đó có nghĩa rằng,
các yếu tố độc lập trong mô hình giải thích chỉ được 24.2% sự thay đổi của biến phụ
thuộc, hay nói cách khác là mô hình không phù hợp tốt. Thông thường giá trị này
lớn hơn 50% thì mô hình được đánh giá là phù hợp tốt.

Bảng ANOVA:

Như chúng ta đã biết ở trong phương pháp nghiên cứu, lý thuyết về chọn mẫu nói
rằng kích thước mẫu càng lớn thì nghiên cứu càng giá trị, càng tốt, bởi lúc đó số liệu
có tính đại diện cao. Trong điều kiện tài chính không cho phép, hoặc bị giới hạn bởi
những yếu tác khác như thời gian và các yếu tố nguồn lực khác nên chúng ta buộc
phải lấy giới hạn kích thước mẫu (Bollen, 1989). Trong thực tế, dữ liệu thị trường
rất lớn, nên chỉ gói gọn trong kích thước mẫu nghiên cứu là chưa chắc chắn đảm
bảo được tính đại diện cho tổng thể. Do đó, kiểm định F trong Bảng Anova có ý
nghĩa rất quan trọng, nó cho biết mô hình hồi qui tuyến tính này có suy rộng và áp
dụng được cho tổng thể hay không. Điều kiện ở đây là Sig. phải nhỏ hơn hoặc bằng
0.05. Kiểm định này là kiểm định độ phù hợp của mô hình.

Bảng Coefficients:

Trang: 27
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Thứ nhất, bạn cần để ý cột giá trị Sig., nếu nó lớn hơn 0.05 (5%), 0.1 (10%) có nghĩa
là biến độc lập đó không có ý nghĩa thống kê trong phân tích hồi qui tuyến tính với
độ tin cậy tương ứng là 95%, 90%, hay nói cách khác, biến độc lập này không tác
động (tác động không đáng kể) đến biến phụ thuộc, có thể loại bỏ biến này trong
phương trình hồi qui. Thứ hai, bạn cần quan tâm đến cột hệ số Beta đã chuẩn hóa
để đưa vào phương trình hồi qui (một số giảng viên cũng yêu cầu viết phương trình
hồi qui với hệ số Beta chưa chuẩn hóa, cái này tùy nhé, tuy nhiên nó khác nhau đấy).
Ví dụ với kết quả bảng dưới thì phương trình hồi qui được viết theo các hệ số chuẩn
hóa như sau:

RI=0.113  New+0.171 LY+0.130  AS+0.144  AW+0.195  QP

Trường hợp viết phương trình hồi qui theo các hệ số beta chưa chuẩn hóa, bạn phải
lưu ý là có hằng số hồi qui, thì viết như sau:

RI=1.296+0.107  New+0.150  LY+0.122  AS+0.133  AW+0.185  QP

1.7. Kiểm định phần dư

Kiểm định phần dư thực ra là nằm trong mục Phân tích hồi qui tuyến tính, nhưng ở
đây được tách ra để cho bạn nắm rõ hơn. Cơ bản của kiểm định phần dư là xem xét
Giả định phân phối chuẩn của phần dư có bị vi phạm hay không?

Để chạy ra các biểu đồ sau đây, các bạn thực hiện giống như phân tích hồi qui ở
trên, chỉ có điều trong mục Plots chúng ta cần làm theo hình hướng dẫn sau:

Trang: 28
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

1.7.1. Biểu đồ tần số phần dư chuẩn hóa Histogram

Các bạn cần để ý đến giá trị Mean và Std.Dev. (độ lệch chuẩn). Nếu Mean tiệm cận
về 0 và Độ lệch chuẩn tiệm cận về 1 thì kết luận Giả thiết phân phối chuẩn của phần
dư không bị vi phạm.

1.7.2. Biểu đồ phần dư chuẩn hóa Normal P-P Plot

Trang: 29
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Các chấm tròn tập trung theo một đường chéo trong biểu đồ P-P Plots, nên khẳng
định Giả thiết phân phối chuẩn của phần dư không bị vi phạm.

1.7.3. Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính

Kết quả đồ thị xuất ra, nếu các điểm phân bố của phần dư có dạng của đồ thị Parabol,
hay đồ thị Cubic, v.v, hay các dạng đồ thị khác không phải đường thẳng thì dữ liệu
nghiên cứu của bạn đã vi phạm giả thiết liên hệ tuyến tính.

Trang: 30
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Trường hợp kiểm định phần dư bị vi phạm nghĩa là số liệu của bạn đã có vấn đề,
bạn cần rà soát lại từ các khâu thu thập số liệu ban đầu (xem thêm các mục khác).

1.8. Kiểm định T-Test (Independent Samples Test)

Sử dụng đối với các biến định tính chỉ có 2 giá trị, đối với các biến định tính có từ 3
giá trị trở lên thì bạn cần sử dụng phân tích Anova–one–way. Ví dụ biến định tính
có 2 giá trị như giới tính Nam/Nữ, Khả năng mua SP là có/không, v.v.

Lưu ý: đối với các biến kiểm soát là định lượng, bạn cần phân nhóm để chuyển chúng
về dạng định tính (biến giả định tính).

Về mặt ý nghĩa của kiểm định Independent Samples Test là giúp chúng ta xác định
xem giữa biến định tính và biến định lượng có sự khác biệt có ý nghĩa thống kê hay
không. Nói cho dễ hiểu, kiểm định này xác định xem biến định tính (thông thường
là các biến kiểm soát) có ảnh hưởng đến biến định lượng trong quá trình thống kê
hay không. Ví dụ: giữa nam và nữ sẽ có sự lựa chọn khác nhau khi đánh giá một
phát biểu cụ thể nào đó. Chẳng hạn như phát biểu “mẫu mã của sản phẩm X rất
đẹp”, thì nữ thường đồng tình với biểu này, còn với nam thì ít đồng tình hơn. Như
vậy rõ ràng đã có sự khác biệt có ý nghĩa thống kê đối với phát biểu trên.

Bước 1: Vào Analyze/Compare Means/Independent-Samples T Test…

Bước 2: Đưa biến định tính vào ô Grouping Variable, đưa biến định lượng vào ô
Test Variable(s). Đối với biến định tính chỉ phân tích một biến một lần, còn riêng
đối với biến định lượng các bạn có thể phân tích cùng lúc nhiều biến.

Trang: 31
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Trong mục Define Groups… bạn cần định nghĩa lại các giá trị mà bạn đã nhập liệu.
Vd: 1 được mã hóa cho nam, 2 được mã hóa cho nữ thì bạn điền như hình dưới đây:

Như vậy, Group 1 sẽ đại diện cho nhóm giới tính nam, còn Group 2 sẽ đại diện cho
nhóm giới tính nữ.

Các mục khác các bạn để mặc đình, vì mình không quan tâm nhiều.

Bước 3: Đọc kết quả

Chúng ta sẽ có 2 bảng kết quả

Bảng 1 là Group Statistics (Thống kê nhóm).

Trang: 32
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bảng 2 là bảng Independent Samples Test, các bạn cần quan tâm đến các giá trị
sau:

+ Giá trị Sig. của Levene's Test

+ Giá trị Sig. (2-tailed)

Levene's Independent Samples Test


Test for t-test for Equality of Means
95% Confidence
Mean Std. Error
F Sig. t df Sig. (2-tailed) Interval of the
Difference Difference
Lower Upper
RI Equal variances
.694 .406 -20.088 247 .000 -2.43517 .12122 -2.67393 -2.19640
assumed
Equal variances
-27.046 32.228 .000 -2.43517 .09004 -2.61852 -2.25182
not assumed

Các bạn đối chiếu và kết luận theo Bảng dưới đây nhé:

Sig. (2-tailed)
Sig. của
Equal Equal
Levene's Kết luận
variances variances not
Test
assumed. assumed.
Có sự khác biệt có ý nghĩa thống kê
< 0.05 giữa biến định tính và biến định
lượng được phân tích
< 0.05
Không có sự khác biệt có ý nghĩa
≥ 0.05 thống kê giữa biến định tính và biến
định lượng được phân tích
Có sự khác biệt có ý nghĩa thống kê
< 0.05 giữa biến định tính và biến định
lượng được phân tích
≥ 0.05
Không có sự khác biệt có ý nghĩa
≥ 0.05 thống kê giữa biến định tính và biến
định lượng được phân tích

Trang: 33
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Với kết quả của ví dụ trên, có thể thấy biến Giới tính có sự khác biệt có ý nghĩa
thống kê với biến RI.

1.9. Kiểm định One-Way ANOVA

Khi biến định tính có từ 3 giá trị trở lên thì chúng ta khó có thể sử dụng T-Test để
phân tích được vì tốn kếm rất nhiều thời gian, và dài dòng. Cách đơn giản là sử dụng
One-Way ANOVA.

Bước 1: Vào Analyze/Compare Means/One-Way ANOVA…

Bước 2: Các bạn đưa các biến định lượng vào ô Dependent List, các biến định tính
vào ô Factor

Các bạn click vào mục Options và điền các lựa chọn như hình dưới:

Trang: 34
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Các mục khác các bạn cứ để mặc định, vì chúng ta không cần dùng tới nhé.

Bước 3: Đọc kết quả

Các bạn chỉ cần quan tâm tới giá trị Sig. của 3 bảng sau đây:

+ Bảng Test of Hômgeneity of Variances

+ Bảng ANOVA

+ Robust Tests of Equality of Means

Trang: 35
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Sau đó các bạn kết luận theo Bảng sau:

Sig.
Levene Kết luận
ANOVA Welch
Statistic
Không có sự khác biệt có ý nghĩa thống kê
> 0.05
giữa biến định tính và biến định lượng
> 0.05
Có sự khác biệt có ý nghĩa thống kê giữa biến
 0.05
định tính và biến định lượng
Không có sự khác biệt có ý nghĩa thống kê
> 0.05
giữa biến định tính và biến định lượng
 0.05
Có sự khác biệt có ý nghĩa thống kê giữa biến
 0.05
định tính và biến định lượng

Với kết quả phân tích của ví dụ trên, chúng ta có thể kết luận đợc rằng Tuổi có sự
khác biệt có ý nghĩa thống kê với biến RI.

1.10. Phân tích hồi qui Binary Logistic

1.10.1. Lý thuyết cơ bản

Hồi qui binary logistic hay còn gọi là hồi qui nhị phân, là một dạng kỹ thuật thống
kê nhằm xem xét mối tương quan giữa các biến độc lập (định tính hoặc định lượng)
với biến phụ thuộc là biến nhị phân. Biến nhị phân là biến chỉ nhận 2 giá trị thường
là 0 hoặc 1.

Chúng ta cần phải lưu ý rằng, khi biến phụ thuộc là biến nhị phân thì bắt buộc phải
sử dụng hồi qui nhị phân (binary logistic), không thể sử dụng hồi qui tuyến tính
thông thường, vì như vậy sẽ xâm phạm các giả định (Hoàng Trọng và Chu Nguyễn
Mộng Ngọc, 2008). Với hồi qui nhị phân, thông tin thu thập đối với biến phụ thuộc
là một sự kiện nào đó có xảy ra hay không. Biến phụ thuộc Y thường nhận 2 giá trị

Trang: 36
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

là 0 (không có xảy ra sự kiện mà chúng ta quan tâm), và 1 (có xảy ra sự kiện mà


chúng ta quan tâm). Chúng ta sẽ nghiên cứu hàm hồi qui nhị phân trong trường
hợp đơn giản nhất là chỉ có một biến độc lập X. Phương trình hàm hồi qui nhị phân
được viết như sau (Gujarati, Porter, & Gunasekar, 2012):

e(
0 +1X )
Pi = E ( Y=1/X ) =
1 + e(
0 +1X )

Trong công thức này, Pi = E ( Y=1/X )=P ( Y=1 ) gọi là xác suất để sự kiện xảy ra (Y=1)
khi biến độc lập X có giá trị cụ thể là Xi. Phương trình hồi qui nhị phân được viết lại
như sau:

ez
P ( Y=1) =
1 + ez

Trong đó, z = (B0+B1X). Vậy xác suất để sự kiện không xảy ra là 1-P(Y=1), hay:

ez 1
P ( Y=0) =1-P ( Y=1) = 1 − =
1 + ez 1 + ez

Thực hiện phép so sánh giữa xác suất một sự kiện xảy ra với xác suất sự kiện đó
không xảy ra:

ez
P ( Y=1) 1+e z z  P ( Y=1 ) 
= =e → log e   = log e e = z
z

P ( Y=0) 1  P ( Y=0 ) 

z
1+e

Phương trình trên được viết lại như sau:

 P 
log e  i  = 0 + 1X ()
 1-Pi 

Phương trình (*) ở trên là dạng hàm hồi qui nhị phân. Chúng ta có thể mở rộng mô
hình hàm hồi qui nhị phân trong trường hợp có nhiều biến độc lập như sau:

 P  n
log e  i  =  0 +  i X i +ui ( )
 1-Pi  i =1

1.10.2. Các bước phân tích trong SPSS

Trang: 37
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Chúng ta sẽ sử dụng bộ dữ liệu Data02 để làm ví dụ minh họa. Trong ví dụ này


chúng ta sử dụng bộ dữ liệu Data02. Biến phụ thuộc là biến Quyết định mua (ký
hiệu là Decide) sẽ nhận giá trị 0 là quyết định không mua sản phẩm, 1 là quyết định
mua sản phẩm. Các biến độc lập gồm Color (màu sắc sản phẩm), Deco (thiết kế nhãn
mác), Quality (chất lượng của sản phẩm), và Social (ảnh hưởng từ xã hội).

Để phân tích hồi qui nhị phân trong SPSS, chúng ta thực hiện các bước như sau:

Bước 1: Analysis/Regression/Binary Logistic…

Bước 2: Đưa biến phụ thuộc vào mục Dependent và đưa các biến độc lập vào mục
Covariates.

Phải nói thêm, chúng ta có nhiều phương pháp (method) để đưa biến độc lập vào
mô hình nghiên cứu gồm Enter, Forward: Conditional, Forward: LR, Forward:
Wald, Backward: Conditional, Backward: LR, Backward: Wald. Tuy nhiên, chúng ta
chỉ cần quan tâm phương pháp Enter, đây là phương pháp mà các biến độc lập được
đưa vào là bắt buộc và được đưa vào trong một bước.

Các mục khác chúng ta cứ để mặc định. Chọn Ok và đọc kết quả phân tích.

Kết quả sẽ cho ra 2 block, Chúng ta chỉ quan tâm đến block 1 (với method = enter).

Trang: 38
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

1.10.3. Đánh giá độ phù hợp của mô hình

Để đánh giá độ phù hợp của mô hình hồi qui Banary logistic, chúng ta sử dụng chỉ
số -2LL (-2 log likelihood) càng nhỏ càng tốt. Nó ngược lại so với chỉ số R2, R 2 càng
lớn thể hiện mô hình phù hợp càng cao. Còn -2LL thì ngược lại, -2LL càng nhỏ thì
mô hình phù hợp càng cao. Chỉ số -2LL có giá trị nhỏ nhất là 0, khi đó kết luận đuợc
rằng, mô hình có độ phù hợp hoàn hảo (Hoàng Trọng và Chu Nguyễn Mộng Ngọc,
2008).

Ngoài chỉ tiêu -2LL, độ phù hợp của mô hình hồi qui nhị phân còn có thể được đánh
giá bởi chỉ số phần trăm tổng thể (Overall percentage) của Bảng dự đoán
(Classification tablea – Bảng này trong Block 1, phương pháp đưa vào là tất cả các
biến độc lập (Method = Enter)). Phần trăm tổng thể dự đoán càng cao thì mô hình
càng phù hợp tốt.

Bảng 2 – Classification Tablea

Giá trị cột Percentage Correct được tính như sau:

+ Phần trăm dự đoán đúng giá trị 0 của biến Decide là 24/(12+24)=33.3%.
Trong 36 giá trị 0 của biến Decide khảo sát thực tế được mô hình dự đoán đúng 12
trường hợp và 24 trường hợp dự đoán sai.

+ Phần trăm dự đoán đúng giá trị 1 của biến Decide là 304/(10+304)=96.8%.
Trong 314 giá trị 1 của biến Decide khảo sát thực tế được mô hình dự đoán đúng
304 trường hợp và 10 trường hợp dự đoán sai.

+ Tổng thể % dự đoán đúng của mô hình là (24+304)/(12+24+10+304) =


90.3%

1.10.4. Kiểm định độ phù hợp tổng quát

Trang: 39
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Kiểm định độ phù hợp tổng quát là kiểm định xem các hệ số hồi qui trong mô hình
(trừ hằng số) có giải thích được cho sự thay đổi của biến phụ thuộc có ý nghĩa thống
kê hay không. Để làm việc này, với mô hình hồi qui nhị phân chúng ta sử dụng chỉ
số Chi-square trong bảng Omnibus tests of model Coefficients để quyết định bác bỏ
hay chấp nhận H0. Với H0 là giả thuyết rằng 1 = 2 = ... =  k = 0 .

Bảng 3 – Omnibus Tests of Model Coefficients

Nếu giá trị Sig tương ứng với dòng Model mà nhỏ hơn mức ý nghĩa thống kê (5%,
10%) thì xem như kiểm định Chi-square đạt, hay nói cách khác là bác bỏ giả thuyết
H0, và chúng ta kết luận được rằng mô hình nghiên cứu có độ phụ hợp tổng quát
tốt.

1.10.5. Kiểm định ý nghĩa các hệ số hồi qui

Các hệ số hồi qui cho trong bảng Variables in the Equation cần được kiểm định về
mặt độ tin cậy. Việc kiểm định thông qua đại lượng Wald chi-square, đại lượng này
có ý nghĩa thống kê khi giá tị Sig của chúng nhỏ hơn mức ý nghĩa kỳ vọng là 5%,
10%, v.v. Hệ số Wald Chi-square được tính bằng cách bình phương tỷ số giữa hệ số
hồi qui (B) và sai số chuẩn của ước lượng (S.E.).

Kết quả trong Bảng 4 cho thấy, chỉ có hệ số hồi qui của các biến Color, Deco, và
Social là có ý nghĩa thống kê. Còn hệ số hồi qui của biến Quality lại không có ý nghĩa
thống kê với độ tin cậy 95%.

Bảng 4 – Variables in the Equation

Trang: 40
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Từ các hệ số hồi qui trong Bảng 4, chúng ta có thể viết lại phương trình hồi qui như
sau:

 P ( Y=1) 
log e 
 P ( Y=0) 
= −4.871 + 0.754Color + 0.444Deco + 0.632Social ()
 

Diễn giải ý nghĩa của các hệ số hồi qui: Màu sắc (Color), Mẫu mã (Deco) và Ảnh
hưởng xã hội (Social) đều làm tăng khả năng quyết định mua sản phẩm. Với xác
suất ban đầu P0 = 0.5 thì tác động biên của Màu sắc lên Quyết định mua là 0.5*(1-
0.5)*0.754 = 0.1885; tác động biên của Mẫu mã lên Quyết định mua là 0.5*(1-
0.5)*0.444 = 0.111; tác động biên của Ảnh hưởng xã hội lên Quyết định mua là
0.5*(1-0.5)*0.632 = 0.158.

1.10.6. Vận dụng mô hình hồi qui nhị phân cho mục đích dự báo

Dựa vào phương trình hồi qui (**) có thể thấy mức độ tác động đến Quyết định mua
sản phẩm giảm dần từ Màu sắc, Ảnh hưởng của xã hội và đến Thiết kế mẫu mã. Giả
sử có người đến khảo sát mua hàng, bạn cho họ thực hiện khảo sát về Color, Deco,
và Social. Kết quả khảo sát lần lượt là 4.5, 4.0, và 3.5. Bạn thế vào công thức tính xác
suất mua sản phẩm sẽ biết khả năng họ quyết định mua là như thế nào.

e −4.871+0.754*4.5+0.444*4.0+0.632*3.5
E ( Y/X ) = = 0.9248
1 + e −4.871+0.754*4.5+0.444*4.0+0.632*3.5

Mô hình hồi qui Binary logistic cho biết khả năng quyết định mua sản phẩm của
khách hàng này là cao, 92.48%. Cần lưu ý, đây là khả năng mua dự đoán, và dự đoán
này có khả năng đúng là 90.3%.

Có thể với ví dụ này chúng ta chưa thật sự thấy được ý nghĩa của mô hình hồi qui
nhị phân, nhưng có những mô hình cần phải dự báo như lĩnh vực tài chính ngân

Trang: 41
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

hàng lại rất có ý nghĩa thực tế. Chẳng hạn, chúng ta cần dự đoán về khả năng trả
được nợ của khách hàng, khả năng tiếp cận vốn vay, khả năng sinh lợi, v.v. Còn đối
với các bài toán như quyết định mua, thông thường chúng ta chỉ quan tâm tới mức
độ ảnh hưởng của biến độc lập đối với biến phụ thuộc để từ đó có cơ sở cho tác giả
đưa ra các giải pháp khuyến nghị cho hợp lý.

Trang: 42
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

CHƯƠNG 2: HƯỚNG DẪN PHÂN TÍCH SEM BẰNG AMOS

2.1. Giới thiệu chung

SEM là Mô hình cấu trúc tuyến tính (Structural eqaution modeling), cũng có những
tên gọi khác như Analysis of Covariance Structures (Phân tích cấu trúc hiệp phương
sai), hay Causal Modeling (Mô hình nhân quả). Mô hình cấu trúc tuyến tính SEM là
một dạng mô hình được kết hợp giữa những mô hình đường dẫn (path models) với
những mô hình yếu tố xác định (confirmatory factor models). Mô hình SEM kết hợp
cả biến tiềm ẩn (latent variable) với biến quan sát (observed variable, hay còn gọi
là biến chỉ báo).

Từ giữa thập niên 1980 đã có nhiều chương trình phân tích SEM được phát triển,
như LISREL, EQS, AMOS. Hiện nay, AMOS (Analysis of MOment Structures) là tên
một phần mềm được dùng phổ biến trong phân tích mô hình cấu trúc tuyến tính
(SEM – Structural equation modeling). SEM thật sự không quá khó nếu người
nghiên cứu có nền tảng về thống kê cơ bản, tương quan và phân tích hồi qui. Hiểu
một cách cơ bản, SEM sử dụng được cho nhiều loại mô hình để mô tả các mối quan
hệ giữa các biến quan sát, với một mục tiêu cơ bản là cung cấp kiểm định mô hình
định lượng với các giả thuyết nghiên cứu được đưa ra bởi nhà nghiên cứu.

Mục đích của phân tích SEM là xác định mức độ ủng hộ của mô hình lý thuyết bởi
dữ liệu nghiên cứu. Nếu dữ liệu phù hợp tốt với mô hình lý thuyết, thì các mô hình
lý thuyết phức tạp hơn có thể được đưa ra giả thuyết. Nếu dữ liệu không phù hợp
với mô hình lý thuyết, thì mô hình ban đầu có thể được sửa đổi và thử nghiệm hoặc
các mô hình lý thuyết khác cần được phát triển và thử nghiệm. Do đó, SEM kiểm tra
các mô hình lý thuyết bằng cách sử dụng phương pháp khoa học kiểm tra giả thuyết
để nâng cao hiểu biết của chúng ta về các mối quan hệ phức tạp giữa các cấu trúc
(Schumacker & Lomax, 2004).

SEM có thể kiểm định nhiều dạng khác nhau của mô hình lý thuyết, gồm mô hình
hồi qui (regression models), mô hình đường dẫn (path models), và mô hình nhân
tố khẳng định (confirmatory factor models). Để hiểu rõ hơn về các dạng mô hình
này, chúng ta cần phải hiểu rõ một vài thuật ngữ. Có hai dạng chính của biến là biến
tiềm ẩn (latent variables) và biến quan sát (Observed variables). Biến tiềm ẩn
(constructs hoặc factors) là các biến không được khảo sát hoặc đo lường trực tiếp
được, nhưng chúng có thể được đo lường hoặc khảo sát gián tiếp được. Và do đó,

Trang: 43
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

chúng được suy ra từ một tập hợp các biến mà chúng ta đo lường bằng cách sử
dụng các bài kiểm tra, khảo sát, v.v. Ví dụ, niềm tin, sự thông minh, v.v là các biến
tiềm ẩn bởi chúng không thể đo lường một cách trực tiếp được mà sẽ được đo lường
gián tiếp bởi các biến quan sát (indicators).

Đối với các mô hình chỉ có một biến phụ thuộc (mô hình 1) thì thường sử dụng SPSS
đơn thuần để phân tích bài toán hồi qui là đủ, thậm chí đối với những mô hình có
một biến trung gian (mô hình 2) thì vẫn có thể sử dụng SPSS để phân tích theo dạng
bài toán hồi qui. Tuy nhiên phải sử dụng tới hai bước phân tích hồi qui. Và theo
kinh nghiệm cho thấy giá trị ước lượng/hệ số beta từ kết quả xuất ra bằng việc
phân tích hồi qui hai bước trong SPSS không chính xác bằng kết quả phân tích được
từ AMOS.

Để giải thích một cách đơn giản cho sự khác biệt này đó là số liệu khi đưa vào AMOS
đòi hỏi tính chặt chẽ rất cao, chất lượng số liệu phải cực tốt. Do đó, nếu xét về khía
cạnh làm bảng hỏi (questionaires) và khảo sát thì mức độ khó (bởi tính chặt chẽ)
của SPSS chỉ ở 6/10, còn AMOS phải 10/10. Đổi lại, với những nghiên cứu thực hiện
phân tích định lượng bằng AMOS thì kết quả thu được đạt được độ tin cậy trong
nghiên cứu cao hơn.

Đối với những mô hình phức tạp (tồn tại nhiều mối tương quan chéo) thì lúc này
SPSS không còn khả năng phân tích để cho ra kết quả tốt, bắt buộc chúng ta phải sử
dụng các công cụ phân tích khác để thay thế như LISREL, EQS, SAS, R, AMOS, v.v. Sự
lựa chọn tốt nhất đối với hầu hết các bạn hiện nay là AMOS bởi tính trực quan và
dễ sử dụng.

2.2. Trình tự phân tích một bài toán SEM

Đầu vào của SEM đòi hỏi khắc khe về mặt số liệu. Do đó, thang đo trước khi đưa vào
phân tích SEM cần phải được kiểm định thật kỹ về tính hội tụ, tính phân biệt, độ

Trang: 44
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

phù hợp của dữ liệu. Các bước trước khi chạy SEM là phân tích nhân tố khám phá
(EFA), phân tích nhân tố khẳng định (CFA). Để kiểm định các hệ số ước lượng hồi
qui, các nghiên cứu thường sử dụng phương pháp bootstrap.

2.3. Phân tích EFA cho bài toán SEM

Các bước phân tích trong AMOS sẽ được bắt đầu từ bước EFA ở giai đoạn 1 chạy
bằng SPSS. Có hai lưu ý khi chạy EFA trong giai đoạn này:

+ Tất cả các biến, bao gồm biến phụ thuộc và cả biến độc lập đều phải được
đưa vào phân tích nhân tố khám phá.

+ Trong phần Extraction bạn phải chọn phương pháp trích là Principal axis
factoring (PAF); và trong mục Rotation bạn phải chọn phương pháp quay là
Promax (hình bên dưới). Chúng ta sẽ bàn sâu hơn về các phương pháp này ở
phần bên dưới.

Trang: 45
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Trong mục Options,


chúng ta đánh dấu tick
vào mục Suppress
small coefficients và
điền vào 0.5 để kết quả
EFA chỉ xuất hiện trên
bảng phân tích với các
factor loading  0.5.

Theo Anderson và Gerbing (1988), Phương pháp trích Principal Axis Factoring kết
hợp với phép quay Promax (Oblique - xuyên) sẽ phản ánh cấu trúc dữ liệu chính xác
hơn phương pháp trích Principal Components kết hợp với phép quay Varimax
(Orthogonal – trực giao)

Kết quả thu được chúng ta sẽ có hai bảng chính xuất hiện: một là bảng Pattern
matrix (đây là bảng ma trận các trọng số nhân tố), hai là bảng Structure matrix (đây
là bảng ma trận hệ số tương quan giữa biến quan sát với nhân tố mà nó đo lường).
Tuy nhiên, chúng ta chỉ cần quan tâm ở giai đoạn này là Bảng Pattern matrix, nếu
bảng này sắp xếp đảm bảo theo nguyên tắc phân biệt và hội tụ thì quá trình phân
tích EFA xem như thành công ☺. Còn không thì số liệu chúng ta đang có vấn đề.
Chúng ta sẽ nghiên cứu nguyên nhân trong phần tiếp theo.

Sau đây là các tiêu chí đánh giá EFA

Hệ số tải nhân tố factor loading là chỉ tiêu nhằm đảm bảo


cho EFA đạt được mức ý nghĩa thiết thực. Factor loading
chia làm 3 ngưỡng:  0.3 được xem là đạt được mức tối
thiểu,  0.4 được xem là quan trọng, và  0.5 được xem là
có ý nghĩa thực tiến. Trong các nghiên cứu ứng dụng trong
lĩnh vực MBA thì Factor loading  0.5 được xem là phù
hợp.

Trang: 46
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Tại mỗi quan sát, chênh lệch của hệ số tải nhân tố phải lớn
Jabnoun và Al‐
hơn hoặc bằng 0.3, nếu nhỏ hơn phải loại quan sát đó ra
Tamimi (2003)
khỏi thang đo vì không đảm bảo tính phân biệt thang đo.
Anderson và
Tổng phương sai trích  50%
Gerbing (1988)
KMO  0.5, kiểm định Bartlett có ý nghĩa thống kê với Sig.
 5%.

2.4. Phân tích nhân tố khẳng định CFA

Theo Schumacker và Lomax (2004), hầu hết các bài kiểm tra năng khiếu, thành tích
và chẩn đoán, khảo sát và kiểm kê đang được sử dụng ngày nay đều được tạo ra
bằng cách sử dụng các kỹ thuật nhân tố. Thuật ngữ phân tích nhân tố khẳng định
(CFA - Confirmatory factor analysis) được sử dụng ngày nay một phần dựa trên
công trình của Howe (1955), Anderson và Rubin (1956), và Lawley (1958). Phương
pháp CFA được Karl Joreskog phát triển đầy đủ hơn vào những năm 1960 để kiểm
tra xem một tập hợp các biến quan sát có xác định một cấu trúc hay không. Joreskog
hoàn thành luận án của mình vào năm 1963, xuất bản bài báo đầu tiên về CFA vào
năm 1969, và sau đó đã giúp phát triển chương trình phần mềm CFA đầu tiên. Phân
tích nhân tố đã được sử dụng trong hơn 100 năm nay để tạo ra các công cụ đo lường
được sử dụng trong nhiều lĩnh vực nghiên cứu, trong khi ngày nay CFA được sử
dụng để kiểm tra sự tồn tại của các cấu trúc lý thuyết này.

Trước khi chạy CFA, chúng ta cần mở chương trình AMOS Graphics lên, sau đó cài
đặt công cụ có tên là Pattern Matrix Model Builder. Có thể tải công cụ này theo
đường link https://www.mediafire.com/file/m5ituh121jg54zw

Sau khi tải về xong thì dán vào theo đường dẫn này: C:\Program Files
(x86)\IBM\SPSS\Amos\20\Plugins (đường dẫn có thể thay đổi tùy theo máy tính).

Bước 1: Vào Plugins/ Pattern Matrix Model Builder

Trang: 47
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Bước 2: bạn chọn File Name, sau đó tìm đến file data của SPSS → OK

Trong Bảng Pattern Matrix Input xuất hiện, bạn mở SPSS chạy EFA và copy bảng
Pattern matrix trong SPSS vào đây. Xong nhấn Create Diagram và chờ …

Trang: 48
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Kết quả sau bước này là mô hình CFA đã hình thành. Bạn cần thực hiện tính toán
bằng cách nhấn vào nút Calculate estimates

Các bạn cần đưa vào nhãn để hiển thị các kết quả cần kiểm định cho CFA, bằng
cách chọn nút Title và rê chuột thả vào vị trí trống nào đó kế bên mô hình CFA.

Trong bảng Figure Caption, bạn điền vào các dòng lệnh bên dưới và nhấn OK.

Trang: 49
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Chi-square/df=\cmindf ;
P-value=\p;
df=\df ;
RMSEA=\rmsea
GFI=\gfi ;
CFI=\cfi ;
TLI=\tli ;

Thực hiện tính toán lại, và để thể hiện kết quả sau tính toán, bạn chọn nút như hình
dưới

Bước 3: Đọc kết quả và so sánh với các tiêu chí kiểm tra

GFI, CFI, TLI, … có giá trị > 0.9 được xem là mô hình phù hợp tốt. Nếu các giá trị này
tiến gần xác 1 hoặc bằng 1, ta nói mô hình là hoàn hảo (Segar và Grover, 1993; Chin
và Todd, 1995). Giá trị GFI đo độ phù hợp tuyệt đối của mô hình cấu trúc và mô
hình đo lường với số liệu khảo sát. Đôi khi giá trị GFI > 0.8 vẫn được chấp nhận là
mô hình phù hợp tốt. Kinh nghiệm phân tích số liệu cho thấy, thông thường chỉ số
GFI < 0.9, nhưng lại > 0.8.

Trang: 50
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

RMSEA là một tiêu chí quan trọng, dùng để kiểm tra mức độ phù hợp của mô hình
so với tổng thể. Theo Taylor và ctg (1993), giá trị RMSEA < 0.08 thì mô hình được
chấp nhận.

Chỉ số Chi-Square/bậc tự do (df) < 5 đối với nghiên cứu có kích cỡ mẫu lớn hơn
200, và < 3 đối với các nghiên cứu có kích cỡ mẫu nhỏ hơn 200 (Kettinger và ctg,
1995).

P-value <= 0.05 khẳng định mô hình phù hợp tốt, dữ liệu nghiên cứu có ý nghĩa
thống kê với mức tin cậy trên 95%.

2.5. Phân tích mô hình SEM

Phân tích nhân tố khẳng định CFA: Mục đích là để kiểm định lại thang đo trước khi
tiến hành phân tích mô hình cấu trúc tuyến tính SEM. Ngoài hệ số Cronbach’s alpha,
khi phân tích CFA cần phải đánh giá độ tin cậy của thang đo thông qua hệ số tin cậy
tổng hợp (c ≥ 0.7, theo Joreskog (1971)) và tổng phương sai trích (vc ≥ 0.5, theo
Fornell và Larcker (1981)).
2
 p 
  i 
Độ tin cậy tổng hợp: c =  i =1   0.7
2
 p 
  i  +  (1 − i )
p
2

 i =1  i =1

 i
2

Tổng phương sai trích: vc = i =1


 0.5
  +  (1 −  )
p p
2 2
i i
i =1 i =1

Trong đó: i là trọng số chuẩn hóa của biến quan sát thứ i; p là số biến quan sát của
thang đo; 1 - i2 là phương sai của sai số đo lường biến quan sát thứ i.

Ngoài ra còn phải kiểm định tính đơn hướng, giá trị hội tụ, giá trị phân biệt của các
khái niệm đo lường trong mô hình.

2.6. Kiểm định Bootstrap

Kết thúc bước phân tích mô hình SEM, về cơ bản chúng ta đã hoàn thành, tuy nhiên
để biết được các ước lượng (trọng số hồi qui) được trích xuất từ bước phân tích mô

Trang: 51
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

hình SEM trên có độ tin cậy tốt hay không thì bạn cần phải thực hiện thêm bước
kiểm định Bootstrap này. Có thể nói đây là bước đánh giá độ tin cậy của các ước
lượng từ mô hình SEM.

Bước đầu tiên, trong màn hình SEM, bạn nhấn tổ hợp phím Ctr+A (hình dưới)

Thông thường lựa chọn số lượng mẫu bootstrap là khoảng 1000 nhé anh chị
(Preacher, K. J., và Hayes, A. F., 2008), hơn nữa cũng OK, nhưng máy chạy hơi nặng,
1000 là đủ để phép thử hội tụ, lớn hơn cũng được nhưng không cần thiết lắm. Giờ
chương trình sẽ tạo ra 1000 mẫu thử, sau đó phân tích SEM cho 1000 mẫu này, và
trả về giá trị trung bình của các ước lượng trong mỗi mô hình bootstrap.

Trang: 52
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Trong menu kết quả, anh chị click chọn số 1, sau đó click chọn tiếp số 2. Lúc này,
kết quả sẽ xuất hiện như sau:

Anh chị chỉ cần quan tâm đến cột Bias (đây là độ chệch), cột này thể hiện giá trị
chênh lệch giữa ước lượng mô hình SEM và giá trị trung bình của ước lượng
bootstrap. Nếu giá trị này càng nhỏ thì ước lượng trong mô hình SEM cho thấy độ
tin cậy càng tốt.

2.7. Phân tích cấu trúc đa nhóm

Phân tích cấu trúc đa nhóm có mục đích là xác định xem sự ảnh hưởng của các biến
kiểm soát (tuổi, giới tính, trình độ học vấn, v.v) hay các biến điều tiết đến các mối

Trang: 53
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

tương quan trong mô hình nghiên cứu. Việc này sẽ giúp xác định xem các mối tương
quan đó có sự khác biệt nhau hay không giữa các nhóm nhân tố khác nhau. Nó hơi
rối, nhưng ý nghĩa giống như phân tích T-test hay Anova-one-way vậy đó.

Để thực hiện, anh chị làm như sau:

Về cơ bản để phân tích mô hình cấu trúc đa nhóm anh chị cần chuyển về dạng biến
phân nhóm. Biến định tính đều là những biến phân nhóm. Vd: giới tính có 2 nhóm
nam và nữ, trình độ hay tuổi cũng vậy. Biến định lượng bản chất không phải là biến
phân nhóm, nó thuộc thang đo tỷ lệ (scale), chính vì vậy để phân tích cấu trúc đa
nhóm cho biến định lượng, bạn cần chuyển về dạng phân nhóm (biến giả định tính).
Vd: Biến Thái độ khởi nghiệp được sử dụng thang đo likert 7 điểm để đo lường, nó
là biến điều tiết trong mô hình. Anh chị cần chuyển nó về dạng phân nhóm dựa trên
giá trị trung bình (mean) hay vị trí giữa (median). Ví dụ:

Biến thái độ (TD)


Mean Median
TD1 TD2 TD3 TD4 TD5
1 5 7 7 4 4.80 5
Median cần sắp xếp theo thứ tự lại rồi lấy số ở vị trí giữa, nếu số lượng phần tử
chẵn thì median sẽ lấy trung bình của 2 số ở giữa, ví dụ sau:
Biến thái độ (TD)
Median
TD1 TD2 TD3 TD4 TD5 TD6
1 5 7 7 4 3 4.5

Ở đây, biến thái độ mình chia ra thành 2 nhóm dựa trên mean. Nếu mean nhỏ hơn
trung bình của thang đo likert 7 điểm (là 4) thì xếp vào nhóm có thái độ không tích
cực, và ngược lại xếp vào nhóm có thái độ tích cực. Như vậy, anh chị đã chuyển biến
định lượng về dạng biến giả để phân tích đa cấu trúc rồi đấy.

Tiếp theo sử dụng AMOS để tiến hành phân tích cấu trúc đa nhóm…

Updating…….

Trang: 54
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

CHƯƠNG 3: HƯỚNG DẪN PHÂN TÍCH STATA

3.1. Giới thiệu về STATA

STATA là một trong những chương trình được sử dụng phổ biến trong Kinh tế
Lượng và thống kê. Đặc điểm nổi bật của STATA là sử dụng các lệnh trực tiếp, có
thể vào mỗi lệnh ở một thời điểm để thực hiện hoặc có thể soạn thảo thành một
chương trình bao gồm nhiều lệnh cho một nhiệm vụ và thực hiện cùng một lúc. Kết
quả tính toán từ STATA là rất nhanh, có độ chính xác cao, và rất dễ sử dụng. Stata
là một gói phần mềm tích hợp, hoàn chỉnh cung cấp tất cả các nhu cầu về khoa học
dữ liệu của bạn — thao tác dữ liệu, trực quan hóa, thống kê và báo cáo tự động. Như
vậy có thể hình dung được rằng, STATA là một trong những chương trình phân tích
số liệu mạnh nhất hiện nay.

(ảnh từ trang stata.com)

3.2. Hướng dẫn cài đặt các hàm không có sẵn trong STATA

Khi thực hiện các câu lệnh trong STATA thường hay bị các lỗi do chưa cài đặt sẵn
các câu lệnh trong STATA, ví dụ lệnh hồi qui ivreg2 chưa được cài đặt, nên khi chạy
đã xảy ra lỗi như sau:

Trang: 55
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Nguyên nhân là câu lệnh ivreg2 chưa được cài đặt sẵn trong STATA của bạn, để
thực hiện cài đặt lệnh ivreg2 vào STATA, bạn có 2 cách sau:

Cách thứ nhất, sử dụng câu lệnh với cấu trúc là ssc inst [lệnh cần cài đặt]. Trong
trường hợp này, ssc inst ivreg2. Bạn lưu ý là với cách này chúng ta sẽ bị hạn chế
với một số câu lệnh không có sẵn trên hệ thống STATA, và do vậy bạn cần chuyển
qua cách số 2 để thực hiện cài đặt lệnh. Ưu điểm của cách thứ nhất là có thể đưa
câu lệnh vào bảng điều khiển, để khi chuyển qua máy khác chạy (execute/do )
thì người khác không cần phải tự cài đặt lệnh nữa. Trong trường hợp, STATA đã
được cài đặt câu lệnh rồi, thì khi chạy lệnh vẫn được cài đặt lại mà không xảy ra bất
kỳ lỗi gì.

Cách thứ hai, bạn sử dụng câu lệnh findit [lệnh cần cài đặt]. Lúc này, màn hình sẽ
hiện ra các thông tin về gói dữ liệu cài đặt liên quan đến câu lệnh mà bạn cần tìm.
Và thực hiện cài đặt.

Trang: 56
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Lúc này màn hình viewer xuất hiện và đưa ra rất nhiều thông tin mà STATA tìm
được, bạn phải đi tìm đến đúng câu lệnh của mình cần cài đặt, và sau đó click chọn
để tiến hành cài đặt.

Như vậy là chúng ta đã tìm hiểu được 2 cách cài đặt các hàm không có sẵn trong
STATA.

3.3. Một số câu lệnh thường dùng trong STATA

3.3.1. Tạo biến giả (dummy)

Biến giả là gì?

Để bạn tạo ra biến giả trong dữ liệu bảng STATA, chúng ta có hai cách thực hiện
như sau:

Cách thứ nhất, sử dụng excel để tạo, rồi sau đó copy số liệu vào STATA.

Cách thứ hai, sử dụng câu lệnh trong STATA

quietly tab [biến cần tạo], gen([biến cần tạo])

Trang: 57
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Ví dụ, chúng ta có biến ID là tên các tỉnh thành, gồm 5 tỉnh thành như hình dưới.
Vậy số biến giả cần tạo là 5 biến, và có tên lần lượt là ID1, ID2, ID3, ID4 và ID5. Các
biến từ ID1 đến ID5 STATA sẽ tự động điền như hình dưới đây.

Như vậy, chúng ta đã tạo xong biến giả một cách nhanh chóng. Ưu điểm của cách
thứ hai là nhanh hơn rất nhiều so với thực hiện trên excel đơn thuần.

3.4. Thống kê mô tả

Để thực hiện thống kê mô tả các biến trong STATA, bạn sử dụng câu lệnh “sum”, ví
dụ:

Trang: 58
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Hoặc bạn cũng có thể sử dụng menu như sau:

Sau đó, bạn chọn hết các biến cần thống kê vào trong ô Variables, nhấn chọn OK.

3.5. Phân tích tương quan Pearson

Trang: 59
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Về cơ bản, ý nghĩa của phân tích tương quan Pearson là để kiểm tra mối tương quan
giữa các biến trong mô hình. Đại diện cho mối tương quan này là hệ số tương quan
tuyến tính pearson (ký hiệu là r, 0  r  1). Hệ số r càng gần 1 là cho thấy mối tương
quan tuyến tính giữa hai cặp biến này là rất lớn, và ngược lại. Ngoài ra, giá trị sig.
thể hiện mức ý nghĩa về mặt xác suất thống kê. Một mối tương quan được xem là
có ý nghĩa thống kê trong nghiên cứu khi đảm bảo sig.  0.05 (Hoàng Trọng và Chu
Nguyễn Mộng Ngọc, 2008).

Có hai cách thực hiện trong STATA như sau:

▪ Cách thứ nhất là dùng câu lệnh “pwcorr” (viết tắt của chữ pairwise correlations).
Phía sau lệnh này là tên các biến cần phân tích tương quan, thông thường ta nên
sắp xếp biến phụ thuộc trước tiên, sau đó mới tới các biến độc lập phía sau. Lưu ý
rằng, giữa câu lệnh và các biến phải cách nhau bằng một khoảng trống nhé.

▪ Cách thứ hai là sử dụng menu, như sau:

Sau đó, các bạn đưa các biến cần phân tích tương quan tuyến tính vào trong ô
variables. Chọn Print significance level for each entry. Xong chọn OK.

Trang: 60
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Kết quả phân tích tương quan như sau:

3.6. Kiểm định độ tin cậy của thang đo bằng hệ số Cronbach’s alpha

Trang: 61
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Như đã đề cập ở các chương trên, hệ số cronbach’s alpha dùng để đánh giá độ tin
cậy của thang đo. Trong nhiều tài liệu có đề cập chi tiết đến như trong cuốn Phương
pháp nghiên cứu khoa học trong kinh doanh của Nguyễn Đình Thọ (2014). Về cơ
bản, một thang đo được đánh giá là có độ tin cậy tốt khi hệ số Cronbach’s alpha lớn
hơn hoặc bằng 0.7. Tuy nhiên, cũng có nhiều nghiên cứu cho rằng, với các thang đo
có tính mới (có nghĩa là trước giờ ít người sử dụng, hoặc các thuật ngữ sử dụng khó
hiểu, hoặc bối cảnh nghiên cứu làm khó với người được khảo sát, v.v) thì chấp nhận
hệ số Cronbach’s alpha lớn hơn hoặc bằng 0.5 hoặc 0.6, tùy vào mức độ của từng
nghiên cứu mà tác giả có thể so sánh và lựa chọn ngưỡng đánh giá cho phù hợp.

Có hai cách thực hiện trong STATA như sau:

▪ Sử dụng câu lệnh

▪ Sử dụng menu

Statistics > Multivariate analysis > Cronbach's alpha

Trang: 62
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

3.7. Phân tích nhân tố khám phá (EFA)

Trang: 63
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

3.8. Giới thiệu về mô hình GMM

Trong kinh tế lượng và thống kê , phương pháp GMM (Generalized method of


moments) là một phương pháp chung để ước tính các tham số trong các mô hình
thống kê . Thông thường, nó được áp dụng trong ngữ cảnh của các mô hình bán
tổng thể , trong đó tham số quan tâm là hữu hạn, trong khi hình dạng đầy đủ của
hàm phân phối dữ liệu có thể không được biết và do đó ước tính khả năng tối đa
không được áp dụng.

Phương pháp yêu cầu một số điều kiện nhất định được chỉ định cho mô hình. Các
điều kiện thời điểm này là các hàm của các tham số mô hình và dữ liệu, sao cho kỳ
vọng của chúng bằng 0 tại các giá trị thực của tham số. Phương pháp GMM sau đó
tối thiểu hóa một định mức nhất định của trung bình mẫu của các điều kiện thời
điểm.

Các công cụ ước tính GMM được biết là nhất quán, bình thường không có triệu
chứng và hiệu quả trong lớp của tất cả các công cụ ước tính không sử dụng bất kỳ
thông tin bổ sung nào ngoài các điều kiện có trong điều kiện thời điểm.

GMM được phát triển bởi Hansen (1982) và được giới thiệu bởi Pearson (1894).
Hansen đã chia sẻ giải thưởng Nobel về kinh tế năm 2013 một phần cho công việc
này.

3.9. Giới thiệu về mô hình Blinder-Oaxaca (B-O)

3.10. Cách chỉnh format file word cho giống với màn hình STATA

Bạn bôi đen (chọn) vùng cần chuyển qua file word, rồi click chuột phải chọn copy
(Ctrl+C). Chuyển qua cửa sổ file word, paste vào (Ctrl+V). Sau đó, bạn bôi đen toàn
bộ phần vừa copy, đổi lại font chữ thành Courier New, size font là 8. Kết quả như
hình dưới đây.

Trang: 64
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Trang: 65
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

CHƯƠNG 4: MỘT SỐ VẤN ĐỀ LÝ THUYẾT CẦN QUAN TÂM

4.1. Biến định tính – định lượng

Trước tiên, chúng ta cần phải hiểu rõ thế nào là một biến định tính và thế nào là
một biến định lượng.

Biến định tính (qualitative variable) là những biến không đo lường được, nó
thường ở dạng định danh (nominal) hoặc thứ bậc (ordinal). Các biến ở dạng thứ
bậc hay còn gọi là các biến bán định lượng, chẳng hạn như xếp hạng, độ tuổi, v.v.
Các biến định danh như là giới tính (nam/nữ), nghề nghiệp, v.v.

Ngược lại với các biến định tính, biến định lượng là hoàn toàn có thể đo lường được.
Biến định lượng là những biến có giá trị là những con số, hay kiểu dữ liệu dạng số
(numeric), chẳng hạn như doanh thu, doanh số, nhiệt độ, v.v. Trong các biến đo
lường sử dụng thang đo Likert cũng là một kiểu biến định lượng.

4.2. Kích thước mẫu

Trong nghiên cứu, kích thước mẫu phụ thuộc vào nhiều yếu tố như phương pháp
xử lý, độ tin cậy cần thiết, v.v. Theo Hair và ctg (2006), kích thước mẫu càng lớn
càng tốt. Vì các điều kiện về chi phí và thời gian bị hạn chế nên nhiều nghiên cứu đã
cố gắng tìm hiểu để đưa ra phương pháp lựa chọn kích thước mẫu cho hợp lý nhất.
Giới hạn trong file hướng dẫn này, bạn cần quan tâm tới kích thước mẫu cho hai
phân tích chính: thứ nhất, kích thước mẫu cho bài toán hồi qui tuyến tính; thứ hai,
kích thước mẫu cho bài toán SEM.

• Kích thước mẫu cho bài toán Hồi qui tuyến tính: bạn cần dựa vào 2 công thức
kinh nghiệm của Hair và ctg (2006) (lựa chọn kích thước mẫu cho phân tích
EFA) và Green (1991) (lựa chọn kích thước mẫu cho phân tích hồi qui tuyến
tính).
o Hair và ctg (2006): n = max(50,5X), với X là số biến quan sát trong mô
hình nghiên cứu của bạn. Tốt nhất là max(50, 10X).
o Green (1991): n = 50 + 8m, với m là số biến quan sát trong mô hình
• Kích thước mẫu cho bài toán hồi qui binary logistic: Theo Garson (2014),
kích thước mẫu nghiên cứu cho phân tích hồi qui Binary Logistic về nguyên
tắc càng lớn càng tốt, vì với kích thước mẫu nhỏ sẽ làm các ước lượng hồi qui
bị sai lệch.

Trang: 66
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

• Kích thước mẫu cho bài toán SEM: bạn cần dựa vào công thức kinh nghiệm
của Shevlin và Miles (1998) n ≥ 100, tốt nhất là n ≥ 200.

4.3. Bàn sơ về một số phương pháp chọn mẫu nhé

Tùy thuộc vào mục đích cũng như tầm quan trọng của nghiên cứu, đi kèm với các
điều kiện về thời gian, chi phí, kỹ năng của người nghiên cứu, v.v mà đưa ra phương
pháp lựa chọn mẫu sao cho phù hợp nhất. Về cơ bản, chúng ta có 2 phương pháp
chọn mẫu là chọn mẫu xác suất và chọn mẫu phi xác suất. Cụ thể:

4.3.1. Phương pháp chọn mẫu xác suất (ngẫu nhiên)

(Phần này xin được trích nguyên văn từ nguồn google nhé bạn)

4.3.1.1. Chọn mẫu ngẫu nhiên đơn giản

Đối với phương pháp này trước tiên người nghiên cứu cần lập danh sách các đơn
vị của tổng thể chung theo một trật tự nào đó ví dụ như lập theo tên, c theo quy mô
hoặc địa chỉ, v.v, sau đó đánh STT vào trong danh sách; rồi dùng các phương pháp
ngẫu nhiên như rút thăm, dùng bảng số ngẫu nhiên, dùng hàm random của máy
tính để chọn ra từng đơn vị trong tổng thể chung vào mẫu.

Phương pháp này thường vận dụng khi các đơn vị của tổng thể chung nằm ở vị trí
địa lý gần nhau, các đơn vị đồng đều nhau về đặc điểm. Phương pháp này thông
thường được áp dụng trong quá trình kiểm tra chất lượng sản phẩm trong dây
chuyền sản xuất hàng loạt.

4.3.1.2. Chọn mẫu ngẫu nhiên hệ thống

Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự quy ước
nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách. Đầu tiên chọn ngẫu nhiên
1 đơn vị trong danh sách; sau đó cứ cách đều k đơn vị lại chọn ra 1 đơn vị vào mẫu,
v.v, cứ như thế cho đến khi chọn đủ số đơn vị của mẫu. Ví dụ: Dựa vào danh sách
bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của tên chủ hộ, bao gồm
240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy khoảng cách chọn là: k=
240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu.

4.3.1.3. Chọn mẫu cả khối

Trang: 67
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Trước tiên lập danh sách tổng thể chung theo từng khối (như làng, xã, phường,
lượng sản phẩm sản xuất trong 1 khoảng thời gian, v.v). Sau đó, ta chọn ngẫu nhiên
một số khối và điều tra tất cả các đơn vị trong khối đã chọn. Thường dùng phương
pháp này khi không có sẵn danh sách đầy đủ của các đơn vị trong tổng thể cần
nghiên cứu. Ví dụ: Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ
lập danh sách các lớp chứ không lập danh sách sinh viên, sau đó chọn ra các lớp để
điều tra.

4.3.1.4. Chọn mẫu phân tầng

Trước tiên phân chia tổng thể thành các tổ theo 1 tiêu thức hay nhiều tiêu thức có
liên quan đến mục đích nghiên cứu (như phân tổ các DN theo vùng, theo khu vực,
theo loại hình, theo quy mô, v.v). Sau đó trong từng tổ, dùng cách chọn mẫu ngẫu
nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu. Đối với chọn
mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó
chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ. Ví dụ: Một toà soạn báo
muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp trên cả nước về sự
quan tâm của họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo trên báo.
Toà soạn có thể căn cứ vào các tiêu thức: vùng địa lý (miền Bắc, miền Trung, miền
Nam); hình thức sở hữu (quốc doanh, ngoài quốc doanh, công ty 100% vốn nước
ngoài, v.v) để quyết định cơ cấu của mẫu nghiên cứu.

4.3.1.5. Chọn mẫu nhiều giai đoạn

Phương pháp này thường áp dụng đối với tổng thể chung có quy mô quá lớn và địa
bàn nghiên cứu quá rộng. Việc chọn mẫu phải trải qua nhiều giai đoạn (nhiều cấp).
Trước tiên phân chia tổng thể chung thành các đơn vị cấp I, rồi chọn các đơn vị mẫu
cấp I. Tiếp đến phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các
đơn vị mẫu cấp II, v.v. Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên
đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra
các đơn vị mẫu. Ví dụ: Muốn chọn ngẫu nhiên 50 hộ từ một thành phố có 10 khu
phố, mỗi khu phố có 50 hộ. Cách tiến hành như sau: Trước tiên đánh số thứ tự các
khu phố từ 1 đến 10, chọn ngẫu nhiên trong đó 5 khu phố. Đánh số thứ tự các hộ
trong từng khu phố được chọn. Chọn ngẫu nhiên ra 10 hộ trong mỗi khu phố ta sẽ
có đủ mẫu cần thiết.

4.3.2. Phương pháp chọn mẫu phi xác suất

Trang: 68
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

(Phần này xin được trích nguyên văn từ nguồn google nhé bạn)

4.3.2.1. Chọn mẫu thuận tiện

Có nghĩa là lấy mẫu dựa trên sự thuận lợi hay dựa trên tính dễ tiếp cận của đối
tượng, ở những nơi mà nhân viên điều tra có nhiều khả năng gặp được đối tượng.
Chẳng hạn nhân viên điều tra có thể chặn bất cứ người nào mà họ gặp ở trung tâm
thương mại, đường phố, cửa hàng, v.v, để xin thực hiện cuộc phỏng vấn. Nếu người
được phỏng vấn không đồng ý thì họ chuyển sang đối tượng khác. Lấy mẫu thuận
tiện thường được dùng trong nghiên cứu khám phá, để xác định ý nghĩa thực tiễn
của vấn đề nghiên cứu; hoặc để kiểm tra trước bảng câu hỏi nhằm hoàn chỉnh bảng;
hoặc khi muốn ước lượng sơ bộ về vấn đề đang quan tâm mà không muốn mất
nhiều thời gian và chi phí.

4.3.2.2. Chọn mẫu phán đoán

Là phương pháp mà phỏng vấn viên là người tự đưa ra phán đoán về đối tượng cần
chọn vào mẫu. Như vậy tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và
sự hiểu biết của người tổ chức việc điều tra và cả người đi thu thập dữ liệu. Chẳng
hạn, nhân viên phỏng vấn được yêu cầu đến các trung tâm thương mại chọn các
phụ nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có tiêu chuẩn cụ thể “thế
nào là sang trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần phỏng
vấn.

4.3.2.3. Chọn mẫu định ngạch

Đối với phương pháp chọn mẫu này, trước tiên ta tiến hành phân tổ tổng thể theo
một tiêu thức nào đó mà ta đang quan tâm, cũng giống như chọn mẫu ngẫu nhiên
phân tầng, tuy nhiên sau đó ta lại dùng phương pháp chọn mẫu thuận tiện hay chọn
mẫu phán đoán để chọn các đơn vị trong từng tổ để tiến hành điều tra. Sự phân bổ
số đơn vị cần điều tra cho từng tổ được chia hoàn toàn theo kinh nghiệm chủ quan
của người nghiên cứu. Chẳng hạn nhà nghiên cứu yêu cầu các vấn viên đi phỏng
vấn 800 người có tuổi trên 18 tại 1 thành phố. Nếu áp dụng phương pháp chọn mẫu
định ngạch, ta có thể phân tổ theo giới tính và tuổi như sau: chọn 400 người (200
nam và 200 nữ) có tuổi từ 18 đến 40, chọn 400 người (200 nam và 200 nữ) có tuổi
từ 40 trở lên. Sau đó nhân viên điều tra có thể chọn những người gần nhà hay thuận
lợi cho việc điều tra của họ để dễ nhanh chóng hoàn thành công việc.

Trang: 69
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

4.4. Hướng dẫn xây dựng thang đo

4.5. Một số lưu ý khi làm Bảng câu hỏi khảo sát

Bảng câu hỏi (questionaire) cực kỳ quan trọng, bạn cần phải tối giản hóa, nội dung
phải ngắn gọn, đầy đủ, dễ hiểu, nên sử dụng các câu đơn (khuyết danh từ mà người
đọc hiểu thì càng tốt, ví dụ: Tôi cảm thấy chất lượng sản phẩm ở SG Coop rất tốt →
Chất lượng sản phẩm ở SG Coop rất tốt, v.v.) Bảng hỏi nên thiết kế từ 2 trang giấy
A4 trở lại.

Trong một câu hỏi không thể đưa cùng lúc 2 vấn đề tránh người được hỏi không
biết trả lời như thế nào cho hợp lý, ví dụ: Sản phẩm ở SG Coop đẹp và có chất lượng
rất tốt. Đối với một số sản phẩm tuy nhìn đẹp mắt nhưng khi mua về thì chất lượng
SP không như mong đợi, lúc đó bạn vô tình đã làm khó cho người trả lời. Bạn phải
tách ra 2 câu: (1) Sản phẩm ở SG Coop đẹp mắt. (2) Sản phẩm ở SG Coop có chất
lượng rất tốt.

Một câu hỏi trong bảng khảo sát sẽ là một biến quan sát dùng để đo lường cho một
nhân tố bậc nhất nào đó. Do đó, câu hỏi của bạn phải có ý nghĩa đo lường (rất nhiều
trường hợp sử dụng thang đo rất tối nghĩa – có nghĩa là nó không thật sự đo lường
khái niệm cần đo). Chính vì sự quan trọng này, thường hội đồng phản biện hay yêu
cầu tác giả giải thích nguồn gốc của thang đo từ đâu ra? Nên trong phần thiết kế
thang đo, bạn cần đặc biệt đầu tư. Phải nêu rõ nguồn gốc thang đo. Nếu thang đo tự
tạo thì phải bám sát định nghĩa của nhân tố. Ví dụ, có một định nghĩa về Chất lượng
dịch vụ như sau: “Chất lượng dịch vụ là việc các nhà cung cấp dịch vụ đáp ứng mức
độ nhu cầu và sự mong đợi của khách hàng với dịch vụ đó. Vì thế, chất lượng dịch vụ
chủ yếu do khách hàng xác định, mức độ hài lòng của khách hàng càng cao thì chất
lượng dịch vụ càng tốt.” Như vậy, để xây dựng thang đo cho Chất lượng dịch vụ, bạn
có hai cách: thứ nhất, sử dụng thang đo của một nghiên cứu có trước đó; thứ hai,
bạn bám sát định nghĩa để thành lập thang đo. Trong trường hợp này, thang đo
Chất lượng dịch vụ sẽ được đưa ra như sau: (1) Nhà cung cấp đáp ứng tốt các nhu
cầu của khách hàng; (2) Nhà cung cấp đáp ứng tốt sự mong đợi của khách hàng; (3)
Bạn cảm thấy hài lòng khi sử dụng sản phẩm dịch vụ của chúng tôt. Như vậy có thể
thấy các câu hỏi đều bám sát định nghĩa.

Trang: 70
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Một vấn đề rất hay thường gặp, đó là có rất bạn chưa biết cách đặt câu hỏi đối với
các thang đo nghịch (giả thuyết âm). Ví dụ, bạn có giả thuyết H1(-): Rủi ro càng cao
thì sự gắn kết của khách hàng với SP càng thấp. Bạn thường đặt câu hỏi như thế này:
Tôi cảm thấy rất rủi ro khi sử dụng SP ABC. Như vậy với câu hỏi này, bạn sử dụng
thang đo likert 5 điểm, thì mức 1 là hoàn toàn không đồng ý, đến mức 5 là hoàn
toàn đồng ý. Lúc này bạn vô tình làm cho thang đo rủi ro không còn tác động nghịch
với sự gắn kết nữa. Bạn nên sửa lại câu hỏi như sau: Tôi không cảm thấy rủi ro khi
sử dụng SP ABC, hoặc Tôi rất tin tưởng khi sử dụng SP ABC.

Trên đây là một số lưu ý nhỏ để giúp bạn làm một bảng questionaires thật tốt! Anh
chị có thể xem thêm trong bài báo của Schuman và ctg (1981).

4.6. Các biến trong mô hình nghiên cứu

Về cơ bản một mô hình nghiên cứu sẽ có 5 loại biến là biến độc lập, biến phụ thuộc,
biến trung gian, biến điều tiết và biến kiểm soát.

4.6.1. Biến độc lập

Biến độc lập là biến chỉ tác động đến biến trung gian hoặc biến phụ thuộc. Trong
mô hình có thể có nhiều biến độc lập.

4.6.2. Biến phụ thuộc

Biến phụ thuộc là biến chỉ bị tác động bởi các biến khác (bản thân nó không tác
động đến biến nào khác), có thể có một hay nhiều biến phụ thuộc trong một mô
hình nghiên cứu.

4.6.3. Biến trung gian (mediating variable)

Biến trung gian là biến có vai trò làm cầu nối giữa biến độc lập và biến phụ thuộc.
Một mô hình có thể có một hay nhiều biến trung gian

4.6.4. Biến điều tiết (moderating variable)

Biến điều tiết là biến có khả năng (có hoặc không có) làm thay đổi mức độ tác động
của các tương quan trong mô hình mà nó điều tiết. Ví dụ như mô hình bên dưới:
biến điều tiết tác động đến mối quan hệ giữa biến độc lập và biến trung gian, và tác
động lên mối quan hệ giữa biến trung gian và biến phụ thuộc. Một mô hình nghiên
cứu có thể có một hay nhiều biến điều tiết và một biến điều tiết có thể làm thay đổi

Trang: 71
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

một hay nhiều tác động của các cặp biến. Biến điều tiết có thể là biến định tính hay
định lượng. Biến điều tiết khác biến kiểm soát nhé, biến kiểm soát tác động trực
tiếp lên một biến nào đó mà nó kiểm soát, còn biến điều tiết tác động lên mối tương
quan giữa 2 biến nào đó.

Bây giờ mình hướng dẫn sơ cho bạn cách chạy kiểm định biến điều tiết nhé. Về cơ
bản, bản chất biến điều tiết nó khác với biến kiểm soát: biến điều tiết tác động lên
mối quan hệ, nó làm thay đổi (tăng hoặc giảm) mức độ tương quan. Còn biến kiểm
soát thì khác, nó tác động trực tiếp lên biến, kết quả kiểm định chỉ nói lên được là
biến kiểm soát có ảnh hưởng đến biến mà nó kiểm soát hay không. Chính vì vậy mà
biến kiểm soát thông thường sử dụng các phân tích T-test hay Anova - One way để
kiểm tra. Còn đối với biến điều tiết thì lại khác, thông thường cần phải sử dụng phân
tích cấu trúc đa nhóm để kiểm tra, và mức độ phức tạp của phân tích cấu trúc đa
nhóm đương nhiên cao hơn. Mình đã có một phần hướng dẫn phân tích cấu trúc đa
nhóm ở trên nhé.

4.6.5. Biến kiểm soát (Control variable)

Biến kiểm soát mức độ giải thích của chúng như thế nào cho biến thiên của biến
phụ thuộc. Biến kiểm soát có thể là định tính hay định lượng, nhưng thường là biến
định tính. Biến kiểm soát phổ biến là các biến về đặc điểm của cá nhân như giới
tính, độ tuổi, v.v.

4.7. Một số rắc rối có thể sẽ gặp phải khi phân tích số liệu

Trang: 72
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

1. Khi phân tích tương quan tuyến tính Pearson nếu xuất hiện mối tương quan có Sig.
lớn hơn 5% (0.05) thì có phải loại biến quan sát đó ra khỏi mô hình nghiên cứu
không?

Về mặt lý thuyết, chúng ta có 3 dạng tương quan là tương quan tuyến tính, tương
quan từng phần và tương quan bán phần. Tuy nhiên chúng ta chỉ quan tâm đến 1
dạng tương quan trong bước này, đó là tương quan tuyến tính (hay còn gọi là tương
quan Pearson)

Trước tiên, để tính hệ số tương quan Peason, anh chị vào


Analyze/Correlate/Bivariate. Sau đó đưa các biến cần xác định hệ số tương quan
giữa chúng vào ô Variables, xong chọn OK.

Nếu tương quan Pearson mà chúng có Sig. > 0.05 thì khẳng định giữa cặp nhân tố
này có mối tương quan tuyến tính rất bé, nếu chúng ta đưa vào mô hình nghiên cứu
thì không có ý nghĩa thống kê (mức ý nghĩa 95% nhé). Ví dụ ở hình trên, bạn có thể
loại bỏ nhân tố KSHV và Gia ra khỏi mô hình nghiên cứu của mình, vì giữa KSHV và
Gia không xuất hiện trương quan tuyến tính với nhân tố YD (YD là biến phụ thuộc
trong mô hình).

Tuy nhiên, trong một vài trường hợp nếu giữa chúng xuất hiện Sig. nằm trong
khoảng từ 0.05 đến 0.10 mà bạn nhận định (bằng các khảo sát định tính cho thấy)
chúng vẫn có tác động trong mô hình nghiên cứu thì bạn vẫn có thể giữ lại các nhân
tố đó. Lúc này, mức ý nghĩa thống kê không còn ở mức 95% nữa mà xuống còn 90%.

2. Hệ số Cronbach’s alpha < 0.6 (thậm chí < 0.5)

Trang: 73
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Hệ số Cronbach’s alpha dùng để đánh giá độ tin cậy của thang đo. Nếu nó nhỏ hơn
0.6 thì theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), biến đó không đạt yêu
cầu về độ tin cậy để có thể đưa vào nghiên cứu. Lý do giải thích cho trường hợp này
thì có nhiều, chẳng hạn như thang đo bạn xây dựng chưa chuẩn xác, khảo sát không
đúng đối tượng, thái độ không hợp tác của người được khảo sát, v.v. Câu hỏi đặt
ra lúc này: vậy phải làm sao? Anh chị có 2 hướng giải quyết: thứ nhất, cần rà soát
lại toàn bộ thang đo, và tiến hành các khảo sát một cách nghiêm túc và bài bản; lựa
chọn thứ hai, bạn sử dụng dịch vụ khảo sát bên mình để có số liệu nhanh và chuẩn
xác nhất.

3. Khi phân tích EFA, một biến quan sát đồng thời nằm ở nhiều cột khác nhau.

Bạn giữ biến đó nếu giá trị chênh lệch giữa chúng nhỏ hơn 0.3 nhé (Nguyễn Đình
Thọ, 2014)

Trang: 74
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

4. Khi phân tích EFA, các biến không nhóm vào nhân tố như đã giả thuyết

Trong một vài trường hợp các biến chúng ta giả thuyết đo lường một khái niệm
nhưng kết quả chúng lại nhóm lộn xộn, không thể hiện được như kỳ vọng nghiên
cứu. Nguyên nhân thì rất nhiều (anh chị tham khảo thêm Nguyễn Đình Thọ (2014)
nhé). Câu hỏi đặt ra lúc này: vậy phải làm sao? Hãy nghĩ ngay đến Dịch vụ phân
tích số liệu LÊ MINH (CP/ZALO: 0971.202.308) nhé!

5. Khi phân tích EFA mọi thứ đều khá ổn, chỉ có tổng phương sai tích (TVE) nhỏ hơn
50%

Vấn đề này sẽ gặp nhiều nhé anh chị. Hãy gọi cho mình nếu cần nhé! ☺

Trang: 75
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

6. Phân tích hồi qui tuyến tính, giá trị Sig. > 0.05, các trọng số hồi qui chuẩn hóa có
giá trị không như kỳ vọng (có nghĩa là, anh chị muốn nhân tố A phải có tác động
mạnh hơn nhân tố B, tuy nhiên kết quả lại ngược lại, điều này được gọi là không như
kỳ vọng)

Anh chị cứ yên tâm, mọi thứ đều có cách để giải quyết! ☺

7. Phân tích CFA, SEM có P-value, GFI, CFI, TLI, RMSEA, v.v không đạt được tiêu chí
kiểm tra.

Đừng quá lo lắng! Hãy liên lạc với amosleminh.com nhé! ☺

Và đây là danh thiếp của tôi. Kính chúc bạn hoàn thành tốt nghiên cứu của
mình!

Khi sử dụng dịch vụ bên mình, anh/chị sẽ được: (1) Được tư vấn và sửa đổi bảng hỏi; (2) Được hỗ
trợ cách viết nghiên cứu về mặt hình thức; (3) Được hỗ trợ tải miễn phí các bài báo quốc tế tham
khảo; (4) Được hỗ trợ cách sử dụng SPSS và AMOS miễn phí; (5) Được hỗ trợ chỉnh sửa số liệu
trong suốt quá trình nghiên cứu của anh/chị với điều kiện mô hình nghiên cứu không được thay
đổi.

Trang: 76
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Tài liệu tham khảo


Anderson, J. C., và Gerbing, D. W., 1988, “Structural equation modeling in practice:
A review and recommended two-step approach”, Psychological Bulletin, 103(3),
411–423
BOLLEN, K. A., 1989, “A New Incremental Fit Index for General Structural Equation
Models”, Sociological Methods & Research, 17(3), 303–316.
Chin, Wynne W., và Peter A. Todd, 1995, “On the use, usefulness, and ease of use of
structural equation modeling in MIS research: a note of caution”, MIS quarterly,
237-246.
Fornell, C., và Larcker, D. F., 1981, “Structural Equation Models with Unobservable
Variables and Measurement Error: Algebra and Statistics”, Journal of Marketing
Research, 18(3), 382–388.
Gerbing và Anderson, 1998, “An Update Paradigm for Scale Development
Incorporing Unidimensionality and Its Assessments”, Journal of Marketing
Research, Vol.25, 186-192
Green, S. B., 1991, “How Many Subjects Does It Take To Do A Regression Analysis”,
Multivariate Behavioral Research, 26(3), 499–510.
Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, Phân tích dữ liệu nghiên cứu với
SPSS, Tập 2, NXB Hồng Đức.
Jabnoun và Al-Tamimi, 2003, “Measuring perceived service quality at UAE
commercial banks”, International Journal of Quality and Reliability Management.
Jöreskog, K. G., 1971, “Statistical analysis of sets of congeneric tests”,
Psychometrika, 36(2), 109-133.
Kaiser, H. F., 1974, “An index of factorial simplicity”, Psychometrika, 39(1), 31–36.
Kettinger, W. J., Lee, C. C., và Lee, S., 1995, “Global Measures of Information Service
Quality: A Cross-National Study”, Decision Sciences, 26(5), 569–588.

Trang: 77
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

Preacher, K. J., & Hayes, A. F. (2008). “Assessing mediation in communication


research”. London: The Sage sourcebook of advanced data analysis methods for
communication research.
Preacher, K. J., & Hayes, A. F. (2008). “Asymptotic and resampling strategies for
assessing and comparing indirect effects in multiple mediator
models”. Behavior research methods, 40(3), 879-891.

Nguyễn Đình Thọ, 2014, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB
Tài chính.
Nunnally, J. C., và Bernstein, I. H., 1994, Psychometric theory, 3rd ed., New York:
McGrawHill.
Nunnally, J. C., 1978, Psychometric theory, 2nd ed., New York: McGraw-Hill.
Schuman, H., Presser, S., và Ludwig, J., 1981, “Context Effects on Survey Responses
to Questions About Abortion”, Public Opinion Quarterly, 45(2), 216.
Segars, A. H., và Grover, V., 1993, “Re-Examining Perceived Ease of Use and
Usefulness: A Confirmatory Factor Analysis”, MIS Quarterly, 17(4), 517
Steenkamp, J. B. E., và Van Trijp, H. C. (1991). “The use of LISREL in validating
marketing constructs”. International Journal of Research in marketing, 8(4), 283-
299.
Shevlin, M., và Miles, J. N. V., 1998, “Effects of sample size, model specification and
factor loadings on the GFI in confirmatory factor analysis”, Personality and
Individual Differences, 25(1), 85–90.
Taylor, S. A., Sharland, A., Cronin, J. J., và Bullard, W., 1993, “Recreational Service
Quality in the International Setting”, International Journal of Service Industry
Management, 4(4), 68–86.

Đối với các tài liệu tham khảo trên (ngoại trừ sách)
còn lại mình đều có file mềm. Nếu anh/chị cần thì
liên hệ mình gửi hoặc theo link dưới để tải về! ☺
Chúc anh/chị hoàn thành tốt nghiên cứu của mình!

Trang: 78
Hướng dẫn phân tích số liệu sử dụng các phần mềm SPSS, AMOS, SmartPLS, STATA

http://www.mediafire.com/file/okqep5bdaecp6yc/B%25C3%25A0i_b%25C3%
25A1o.rar/file

Trang: 79

You might also like