Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 94

TRƯỜNG ĐẠI HỌC KINH TẾ - ĐHQGHN

TRUNG TÂM DỮ LIỆU VÀ PHÂN TÍCH KINH TẾ -XÃ HỘI

Ứng dụng SPSS trong đề tài


nghiên cứu khoa học sinh viên
TS. Nguyễn Thế Kiên
1.Một số thuật ngữ trong thống kê

1.1.Tổng thể (thường ký hiệu N)


Tổng thể là một kích thước rất lớn số lượng người thuộc đối
tượng chúng ta cần khảo sát.
1.2. Mẫu nghiên cứu (thường ký hiệu n)
Mẫu nghiên cứu (gọi ngắn gọn là mẫu) là một nhóm đối tượng
được chọn ra từ tổng thể để nghiên cứu, có thể là ngẫu nhiên
hoặc theo một tiêu chí nào đó.
1.2. Mẫu nghiên cứu (thường ký hiệu n)
1.3.Quan sát
Mỗi một quan sát tương ứng với một đối tượng khảo sát.
1.4. Mô hình nghiên cứu
Mô hình nghiên cứu chỉ ra mối quan hệ giữa các nhân tố
(biến nghiên cứu) với nhau như thế nào dựa trên các lý
thuyết nền tảng… Một mô hình nghiên cứu gồm gồm 2
thành phần cơ bản là: (1) các biến nghiên cứu và (2) các mối
quan hệ giữa các biến nghiên cứu. Một mô hình nghiên cứu
đơn giản có thể được biểu diễn như sau:
1.4. Mô hình nghiên cứu
1.5. Biến độc lập, biến phụ thuộc, nhân tố

Biến độc lập (nhân tố độc lập) là biến tác động lên biến
khác.
Biến phụ thuộc (nhân tố phụ thuộc) là biến chịu tác động
từ một hay nhiều biến độc lập.
Biến độc lập và biến phụ thuộc có thể được gọi chung là
nhân tố hoặc biến nghiên cứu.
1.6.Biến tiềm ẩn, biến quan sát

Các yếu tố hành vi, thái độ mang tính trừu tượng và


không thể đo lường một cách trực tiếp. Để đo lường được các yếu
tố này, nhà nghiên cứu sẽ phải đo chúng thông qua các yếu tố nhỏ
thỏa mãn hai điều kiện, (1) các yếu tố nhỏ này phản ánh tương
đối đầy đủ tính chất yếu tố trừu tượng, (2) các yếu tố nhỏ này có
thể đo lường trực tiếp được. Các yếu tố trừu tượng được gọi là
biến tiềm ẩn, các yếu tố nhỏ được gọi là biến quan sát.
1.6.Biến tiềm ẩn, biến quan sát
2.Kích thước mẫu

2.1.Kích thước mẫu theo EFA


Theo Hair và cộng sự (2014), kích thước
mẫu tối thiểu để sử dụng EFA là 50, tốt hơn là từ
100 trở lên. Tỷ lệ số quan sát trên một biến phân
tích là 5:1 hoặc 10:1, một số nhà nghiên cứu cho
rằng tỷ lệ này nên là 20:1. “Số quan sát” hiểu
một cách đơn giản là số phiếu khảo sát hợp lệ
cần thiết; “biến đo lường” là một câu hỏi đo
lường trong bảng khảo sát.
2. Kích thước mẫu

2.2. Kích thước mẫu theo hồi quy


Đối với kích thước mẫu tối thiểu cho phân tích hồi quy,
Green (1991) đưa ra hai trường hợp.
Trường hợp một, nếu mục đích phép hồi quy chỉ đánh
giá mức độ phù hợp tổng quát của mô hình như R 2, kiểm
định F ... thì cỡ mẫu tối thiểu là 50 + 8m (m là số lượng
biến độc lập hay còn gọi là predictor tham gia vào hồi quy).
Trường hợp hai, nếu mục đích muốn đánh giá các yếu
tố của từng biến độc lập như kiểm định t, hệ số hồi quy …
thì cỡ mẫu tối thiểu nên là 104 + m (m là số lượng biến độc
lập).
2. Kích thước mẫu

2.2. Kích thước mẫu theo hồi quy


Harris (1985) cho rằng cỡ mẫu phù hợp để chạy hồi quy
đa biến phải bằng số biến độc lập cộng thêm ít nhất là
50.
Hair và cộng sự (2014) cho rằng cỡ mẫu tối thiểu nên
theo tỷ lệ 5:1, tức là 5 quan sát cho một biến độc lập.
Như vậy, nếu có 4 biến độc lập tham gia vào hồi quy, cỡ
mẫu tối thiểu sẽ là 5 x 4 = 20. Tuy nhiên, 5:1 chỉ là cỡ mẫu
tối thiểu cần đạt, để kết quả hồi quy có ý nghĩa thống kê
cao hơn, cỡ mẫu lý tưởng nên theo tỷ lệ 10:1 hoặc 15:1.
3.Mã hóa và nhập liệu
3.1. Phân loại dữ liệu
3.Mã hóa và nhập liệu
3.1. Phân loại dữ liệu
Dữ liệu đính tính: phản ánh tính chất, tính hơn
kém, ta không tính được trị trung bình của dữ liệu dạng
định tính. Kết quả thu thập được của dữ liệu định tính
ở dạng văn bản, ví dụ như giới tính của sinh viên được
phỏng vấn là nam và nữ, kết quả học tập của sinh viên
là yếu, trung bình, khá, giỏi… Từ dữ liệu dạng văn bản
này, trong nhiều trường hợp chúng sẽ mã hóa chúng
thành các con số để có thể dễ dàng thực hiện các thống
kê.
3.Mã hóa và nhập liệu
3.1. Phân loại dữ liệu
Dữ liệu định lượng: phản ánh mức độ, sự hơn
kém, có thể tính được giá trị trung bình. Kết quả thu
thập được của dữ liệu định lượng ở dạng con số, ví dụ
số tuổi người dân tại một khu vực, chiều cao của trẻ em
ở một trường tiểu học…
3.3.Giao diện Variable View và Data View
3.3.1.Variable View là giao diện chúng ta sẽ sử dụng để khai báo
biến
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
- Name: Khai báo tên biến. Nên đặt tên biến không có dấu Tiếng
Việt, không được sử dụng dấu cách trắng, không được đặt ký tự
đầu tiên là một con số, không đặt tên biến trùng với cụm cấm
trong SPSS.
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
Type: Khai báo kiểu dữ liệu. Có nhiều tùy chọn
kiểu dữ liệu, tuy nhiên, tác giả sẽ chỉ trình bày 2 kiểu dữ
liệu thường dùng nhất khi làm luận văn là Numeric và
String. Nếu giá trị nhập vào là một con số, chúng ta sẽ
khai báo là Numeric; nếu giá trị nhập vào là ký tự văn bản,
chúng ta khai báo là String. Ví dụ: Chúng ta có biến Giới
tính, trường hợp không mã hóa Nam thành 1, Nữ thành 2
mà muốn nhập dạng văn bản “Nam” – “Nữ” vào SPSS thì
chúng ta sẽ phải khai báo kiểu dữ liệu là String; trường
hợp nhập vào con số đã mã hóa 1 – 2 đại diện cho Nam –
Nữ thì chúng ta sẽ khai báo kiểu dữ liệu là Numeric.
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
Width: Số lượng ký tự tối đa. Nếu chúng ta nhập vào giá
trị có số ký tự lớn hơn 8, chúng ta cần tăng giá trị Width lên phù
hợp.
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
Khi nhập liệu, nếu ô giá trị không hiển thị đầy đủ các ký tự chúng
ta nhập vào mà bị cắt mất một đoạn phía sau, nghĩa là Width của
ô đó quá nhỏ, không đủ chứa số ký tự chúng ta đã nhập vào.
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
• Decimals: Số ký tự thập phân. Nếu dữ liệu thu thập là
các con số nguyên, chúng ta nên để là 0. Nếu dữ liệu có
phần thập phân, chúng ta sẽ tùy chỉnh Decimals tăng lên
1, 2, 3… tùy vào số ký tự thập phân muốn thể hiện.
• Label: Khai báo nhãn cho biến. Đây là phần chúng ta giải
thích ý nghĩa cho cột tên biến Name. Trong Label chúng
ta không bị giới hạn bởi các quy tắc đặt tên, có thể viết
dài, viết ngắn, viết có dấu Tiếng Việt và tự do sử dụng
dấu cách trắng.
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
- Values: Khai báo giá trị của biến. Mỗi giá trị sẽ tương ứng với
một trường hợp xảy ra của biến và được xác định bằng một con
số (value) đi kèm với một nhãn giải thích (label).
3.3.Giao diện Variable View và Data View
3.3.1.Variable View
Missing: Khai báo các giá trị khuyết trong dữ liệu. Điều
này rất quan trọng, bởi một số kiểm định, phần mềm sẽ dựa vào
khai báo missing value để quyết định có đưa quan sát đó vào tính
toán không.
Measure: Chọn loại thang đo thể hiện dữ liệu: Thang đo
định danh (Nominal), Thang đo thứ bậc (Ordinal), Thang đo mức
độ (Scale).
3.3.Giao diện Variable View và Data View
3.3.2. Data View
3.4.Nhập liệu

3.4.1.Nhập liệu trên SPSS


3.4.Nhập liệu
3.4.2. Nhập dữ liệu từ Excel vào SPSS
Dữ liệu trình bày trong tệp Excel phải tuân theo
tiêu chuẩn nhận diện của SPSS. Dưới đây sẽ là
cấu trúc trình bày chuẩn SPSS của dữ liệu trên
tập tin Excel.
3.4.Nhập liệu
3.4.2. Nhập dữ liệu từ Excel vào SPSS
Để nhập dữ liệu từ tập tin Excel, trên giao diện SPSS, chúng ta
vào File > Import Data
> Excel…
3.4.Nhập liệu
3.4.2. Nhập dữ liệu từ Excel vào SPSS
Cửa sổ Open Data xuất hiện, chúng ta nhấp vào
nút tam giác ngược để dẫn đến thư mục chứa tệp
dữ liệu Excel. Chọn tệp Excel cần mở, sau đó
nhấp vào Open.
4.Lý thuyết về đề tài nghiên cứu

4.3. Mô hình nghiên cứu


4.Lý thuyết về đề tài nghiên cứu
4.4.Giả thuyết nghiên cứu
Giả thuyết nghiên cứu là trả lời dự kiến cho các câu hỏi nghiên cứu. Các trả lời
này tạm thời được công nhận dựa vào lý thuyết và chưa được kiểm nghiệm chứng
minh. Chúng ta tiến hành thiết kế nghiên cứu để thu thập dữ liệu dùng cho việc
kiểm định các giả thuyết đã đề ra. Vì vậy, các giả thuyết nghiên cứu còn được gọi là
giả thuyết kiểm định. Ví dụ, với các câu hỏi nghiên cứu ở mục 5.1.2 và mô hình
nghiên cứu ở mục 5.1.3 ở trên, chúng ta xây dựng các giả thuyết như sau:
Giả thuyết H1: Tiền lương có sự tác động đến sự hài lòng của nhân viên

Giả thuyết H2: Thăng tiến có sự tác động đến sự hài lòng của nhân viên

Giả thuyết H3: Môi trường làm việc có sự tác động đến sự hài lòng của nhân viên

Giả thuyết H4: Tính chất công việc có sự tác động đến sự hài lòng của nhân viên
5.Ví dụ mô hình nghiên cứu
6.Thống kê mô tả

Thống kê mô tả (Descriptive Statistics) giúp tóm tắt


dữ liệu để người xem có cái nhìn tổng quan, tóm tắt về dữ
liệu thu thập được. Kết quả phân tích thống kê mô tả thường
được trình bày thành dạng bảng, biểu đồ thể hiện đặc điểm
của đối tượng khảo sát, dữ liệu khảo sát. Có rất nhiều công
cụ dùng để tóm tắt và trình bày dữ liệu, trong chương này,
tác giả sẽ giới thiệu một số phương pháp được sử dụng phổ
biến sau đây: thống kê tần số (frequency), thống kê trung
bình (descriptive), thống kê kết hợp (custom table), đồ thị và
biểu đồ (chart, plot).
6.Thống kê mô tả

6.1. Thống kê tần số trên SPSS


Sử dụng tập dữ liệu thực hành có tên TH 1.sav
6.Thống kê mô tả

6.1. Thống kê tần số trên SPSS


Tại cửa sổ Frequencies
6.Thống kê mô tả

6.1. Thống kê tần số trên SPSS


Trong tùy chọn Statistics
6.Thống kê mô tả

6.1. Thống kê tần số trên SPSS

Thống kê Ý nghĩa

Mean Trung bình. Là trung bình cộng dữ liệu của biến


Median Trung vị
Sum Tổng giá trị dữ liệu của biến
Minimum Giá trị nhỏ nhất của biến
Maximum Giá trị lớn nhất của biến
Độ lệch chuẩn. Giá trị này càng cao biểu thị sự chênh lệch càng
Std. deviation
nhiều trong đáp án của đáp viên
Skewness Độ lệch. Đồ thị phân phối sẽ lệch sang phải hay sang trái
Kurtosis Độ nhọn. Đồ thị phân phối sẽ nhọn hay tù
6.Thống kê mô tả
6.1. Thống kê tần số trên SPSS
Kết quả cho độ tuổi
Frequency: Tần số
Percent: Tỷ lệ phần trăm
Valid Percent: Tỷ lệ phần trăm chỉ tính trên các giá trị hợp lệ.
Cumulative Percent: Tỷ lệ phần trăm tích lũy chỉ tính trên các giá
trị hợp lệ.
6.Thống kê mô tả
6.2. Thống kê trung bình trên SPSS
Dựa theo giá trị khoảng cách
Chia thước đo Likert 5 mức độ đồng ý thành 5 phần đều nhau và phân phối mỗi
phần tương ứng với một giá trị của thước đo:

Giá trị khoảng cách = (Maximum – Minimum) / 5 = (5-1)/5 = 0.8

Chúng ta sẽ có các đoạn giá trị:

• 1.00 – 1.80 (làm tròn thành 1): Rất không đồng ý


• 1.81 – 2.60 (làm tròn thành 2): Không đồng ý
• 2.61 – 3.40 (làm tròn thành 3): Trung lập
• 3.41 – 4.20 (làm tròn thành 4): Đồng ý
• 4.21 – 5.00 (làm tròn thành 5): Rất đồng ý
6.Thống kê mô tả
6.2. Thống kê trung bình trên SPSS
Analyze > Descriptive Statistics > Descriptives…
6.Thống kê mô tả

6.2. Thống kê trung bình trên SPSS


Tại cửa sổ Descriptives, đưa các biến cần thống kê trung bình
vào mục Variable(s)
6.Thống kê mô tả

6.2. Thống kê trung bình trên SPSS


Mục Options
6.Thống kê mô tả

6.2. Thống kê trung bình trên SPSS


Kết quả
N Minimum Maximum Mean Std. Deviation
TL1 350 1 5 4.02 .957
TL2 350 1 5 3.41 .934
TL3 350 1 5 3.35 .933
TL4 350 1 5 3.96 .960
Valid N (listwise) 350
6.Thống kê mô tả

6.2. Thống kê kết hợp trên SPSS


Sử dụng thống kê kết hợp giúp chúng ta mô tả được đặc điểm dữ
liệu của nhiều biến cùng một lúc, thấy được sự liên quan giữa các
biến mà các thống kê đơn như tần số và trung bình không thể
hiện được.
Sử dụng tập dữ liệu thực hành có tên TH 1.sav
8. Đo lường độ tin cậy bằng hệ số Cronbach’s Alpha

Tính nhất quán nội bộ nghĩa là các biến quan sát trong
một thang đo phải có sự tương quan chặt chẽ nhau, cùng giải
thích cho một khái niệm.
Cronbach' Alpha là một chỉ số đo lường tính nhất quán
nội bộ này.
Như vậy, nếu một thang đo mà các biến quan sát có sự
tương quan càng chặt chẽ, thang đo đó càng có tính nhất quán
cao, hệ số Cronbach’s Alpha sẽ càng cao.
ĐÁNH GIÁ ĐỘ TIN CẬY CỦA THANG ĐO
Nunnally & Bernstein (1994) cho rằng một biến đo lường có
hệ số tương quan biến - tổng (hiệu chỉnh) (Corrected item-total
correlation) ≥ 0.30 thì biến đó đạt yêu cầu; thang đo có Cronbach
alpha ≥ 0.60 là thang đo chấp nhận được về mặt độ tin cậy.
DeVellis (1990) cho rằng chỉ số Cronbach alpha nên từ 0.70
trở lên, song giá trị tối thiểu để thước đo có thể sử dụng được là
0.63.
Hiện nay đa số các kết quả nghiên cứu hàn lâm được công bố
trên các tạp chí uy tín theo quan điểm Nunnally & Bernstein (1994).
9. Phân tích nhân tố khám phá (EFA)

Phân tích nhân tố (Factor Analysis) hay phân tích nhân tố khám
phá (Exploratory Factor Analysis) là một kỹ thuật xử lý định
lượng với mục đích rút gọn một tập hợp k biến quan sát thành
một tập F (với F < k) các nhân tố có ý nghĩa hơn.
www.themegallery.com Company Logo
www.themegallery.com Company Logo
Điều kiện áp dụng EFA
1 Mức độ tương quan giữa các biến đo lường
Phân tích EFA dựa trên cơ sở mối quan hệ giữa các biến đo
lường, vì vậy, trước khi quyết định sử dụng EFA, chúng ta cần xem
xét mối quan hệ giữa các biến đo lường này. Sử dụng ma trận hệ số
tương quan(correlation matrix), chúng ta có thể nhận biết được mức
độ quan hệ giữa các biến.
Nếu các hệ số tương quan nhỏ hơn 0.30, khi đó sử dụng EFA
không phù hợp (Hair et al. 2009).

www.themegallery.com Company Logo


Điều kiện áp dụng EFA
Sau đây là một số tiêu chí đánh giá mối quan hệ giữa các biến:
i) Kiểm định Bartlett:
Kiểm định Bartlett dùng để xem xét ma trận tương quan có phải là
ma trận đơn vị (identity matrix) hay không ?. Ma trận đơn vị ở đây
được hiểu là ma trận có hệ số tương quan giữa các biến bằng 0, và hệ
số tương quan với chính nó bằng 1.
Nếu phép kiểm định Bartlett có p<5%, chúng ta có thể từ chối giả
thuyết H0 (ma trận tương quan là ma trận đơn vị), có nghĩa là các
biến có quan hệ với nhau.

www.themegallery.com Company Logo


Điều kiện áp dụng EFA
Sau đây là một số tiêu chí đánh giá mối quan hệ giữa các biến:
ii) Kiểm định KMO:
Kiểm định KMO(Kaiser – Meyer - Olkin) là chỉ số dùng để so sánh độ lớn
của hệ số tương quan giữa 2 biến X i và Xj với hệ số tương quan riêng phần của
chúng.
KMO là chỉ tiêu xem xét độ thích hợp của EFA, nếu KMO >0.50 thì phân tích
nhân tố là thích hợp.
• Kaiser(1974) đề nghị,
KMO >= 0.90: RẤT TỐT;
0.80 <= KMO < 0.90: TỐT;
0.70 <= KMO <0. 80: ĐƯỢC;
0.60 <= KMO <0. 70: TẠM ĐƯỢC;
0.50 <= KMO <0. 60: XẤU;
KMO <0. 50: KHÔNG CHẤP NHẬN ĐƯỢC

www.themegallery.com Company Logo


www.themegallery.com Company Logo
Điều kiện áp dụng EFA
2 Kích thước mẫu
Để sử dụng EFA, chúng ta cần kích thước mẫu lớn, nhưng vấn đề xác
định kích thước mẫu phù hợp là việc phức tạp. Các nhà nghiên cứu
thường dựa theo theo kinh nghiệm.
Trong EFA, kích thước mẫu thường được xác định dựa vào “kích
thước tối thiểu” và “số lượng biến đo lường đưa vào phân tích”, sau đây
là một vài ý kiến, đề nghị từ các chuyên gia về phân tích nhân tố, chúng
ta có thể xem xét:
i) Hoàng Trọng và Chu Nguyễn Mộng Ngọc(2008), số lượng
quan sát(cỡ mẫu) ít nhất phải gấp 4 đến 5 lần số biến trong phân tích
nhân tố.

www.themegallery.com Company Logo


Điều kiện áp dụng EFA
2 Kích thước mẫu
ii) Hair et al. (2009) cho rằng để sử dụng EFA, kích thước
mẫu tối thiểu phải là 50, tốt hơn nên là 100. Ông Hair đề nghị,
cố gắng tối đa hóa tỷ lệ quan sát trên mỗi biến đo lường là 5:1,
có nghĩa là cứ 1 biến đo lường thì cần tối thiếu là 5 quan sát.
iii) Stevens (2002, theo Habing 2003) một nhân tố được
gọi là tin cậy nếu nhân tố này có từ 3 biến đo lường trở lên.

www.themegallery.com Company Logo


Các bước thực hiện EFA
Bước 1: Kiểm tra điều kiện để thực hiện EFA
i) Số lượng các biến đo lường trong mỗi nhóm nhân tố
ii) Số mẫu đáp ứng được yêu cầu tối thiểu
iii) Kiểm định Bartlett và KMO
Bước 2: Rút trích các nhân tố

www.themegallery.com Company Logo


Các bước thực hiện EFA

Bước 3: Phân tích kết quả rút trích nhân tố


Các con số được thể hiện trong bảng Patterm matric, người
ta gọi là trọng số nhân tố hay hệ số tải nhân tố (factor loading).
(i) Hệ số tải nhân tố (factor loadings)
Theo Hair & ctg (2009, 116),, Factor loading là chỉ tiêu để
đảm bảo mức ý nghĩa thiết thực của EFA (ensuring practical
significance) :
• Nếu Factor loading >0.3 được xem là đạt được mức tối thiểu
• Nếu Factor loading >0.4 được xem là quan trọng
• Nếu Factor loading >= 0.5 được xem là có ý nghĩa thực tiễn

www.themegallery.com Company Logo


Hair & cộng sự (2009) cho rằng hệ số tải nhân tố được xác định
theo kích thước mẫu ở bảng

www.themegallery.com Company Logo


www.themegallery.com Company Logo
Bước 3: Phân tích kết quả rút trích nhân tố

(ii) Thang đo được chấp nhận khi tổng phương sai trích (TVE
–Total Variance Explained) ≥ 50% .
(iii) Tiêu chí eigenvalue là một tiêu chí sử dụng phổ biến để
xác định số lượng nhân tố trong phân tích EFA.
Hair và cộng sự (2014) cho rằng chỉ những nhân tố có
eigenvalue (hay còn gọi là latent roots) từ 1 trở lên mới được đánh
giá là có ý nghĩa và được giữ lại.

www.themegallery.com Company Logo


Bước 3: Phân tích kết quả rút trích nhân tố

Total Variance Explained


Extraction Sums of Squared Rotation Sums of Squared
Initial Eigenvalues Loadings Loadings
Compone % of Cumulative % of Cumulative % of Cumulative
nt Total Variance % Total Variance % Total Variance %
1 2.892 24.099 24.099 2.892 24.099 24.099 2.087 17.395 17.395
2 2.016 16.803 40.903 2.016 16.803 40.903 2.026 16.886 34.281
3 1.644 13.699 54.601 1.644 13.699 54.601 1.967 16.394 50.675
4 1.215 10.128 64.729 1.215 10.128 64.729 1.686 14.054 64.729
5 .723 6.023 70.752
6 .678 5.650 76.402
7 .626 5.216 81.618
8 .577 4.810 86.429
9 .506 4.217 90.646
10 .459 3.823 94.469
11 .362 3.020 97.489
12 .301 2.511 100.000

www.themegallery.com Company Logo


Bước 3: Phân tích kết quả rút trích nhân tố

Eigenvalue thường nằm trong bảng Total Variance Explained.


Cột Initial Eigenvalues biểu diễn giá trị eigenvalue ban đầu, nghĩa là
eigenvalue khi nhân tố chưa được trích, chưa được xoay. Kết quả ở
bảng trên cho thấy eigenvalue tại nhân tố thứ 4 là 1.215 > 1, tại nhân
tố thứ 5 là 0.723 < 1, do vậy quá trình trích sẽ dừng tại nhân tố thứ 4,
có 4 nhân tố được trích.

www.themegallery.com Company Logo


Bước 3: Phân tích kết quả rút trích nhân tố

(iv) Chênh lệch hệ số tải nhân tố của một biến quan sát giữa
các nhân tố ≥ 0.3 là giá trị thường được các nhà nghiên cứu chấp
nhận. Tuy nhiên, nếu chênh lệch hệ số tải nhân tố của một biến quan
sát giữa các nhân tố < 0.3 nhưng giá trị nội dung của biến quan sát
đóng vai trò quan trọng trong thang đo thì chúng ta không nên loại
nó.

www.themegallery.com Company Logo


www.themegallery.com Company Logo
Các bước thực hiện EFA
Bước 4: Đặt tên và diễn giải ý nghĩa các nhân tố

www.themegallery.com Company Logo


www.themegallery.com Company Logo
9. Phân tích nhân tố khám phá (EFA)

Khuyến khích nên lựa chọn Phép trích Principal Components


Analysis (PCA) + Varimax cho đề tài thực hiện phân tích tương
quan và hồi quy tuyến tính sau EFA. Nên lựa chọn Principal Axis
Factoring (PAF) + Promax cho đề tài thực hiện phân tích SEM
sau EFA.
www.themegallery.com Company Logo
www.themegallery.com Company Logo
Bước 3: Phân tích kết quả rút trích nhân tố
Ghi chú:
Chọn “Sorted by size” nếu chúng ta muốn sắp xếp các biến
quan sát trong cùng một nhân tố đứng gần nhau.
Chọn “Suppress small coefficients adsolute value below”,
nếu chúng ta nhập giá trị 0.2, khi đó các trọng số nhân tố hay hệ số
tải nhân tố (factor loading) có giá trị tuyệt đối nhỏ hơn 0.2 sẽ không
được hiển thị trên bảng kết xuất Rotated Component Matrix

www.themegallery.com Company Logo


VD: Sử dụng tập dữ liệu thực hành có tên
TH 1.sav
10. Tạo nhân tố đại diện sau EFA

Kết thúc bước EFA, chúng ta sẽ tiến hành tạo nhân tố


đại diện (biến đại diện) phục vụ cho bước phân tích tương
quan quan, hồi quy, phương sai...
Sau EFA, chúng ta có được các nhân tố giống hoặc
không giống với cấu trúc nhân tố lý thuyết. Chúng ta thực
hiện tạo nhân tố đại diện dựa trên kết quả ma trận xoay EFA
cuối cùng. Bên dưới là bảng tổng hợp các nhân tố sau phân
tích EFA và ký hiệu mã hóa nhân tố đại diện:
10. Tạo nhân tố đại diện sau EFA

Nhân tố Biến quan sát Tên nhân tố Biến đại diện


1 DT1, DT2, DT3, DT4, DT5 Đào tạo thăng tiến F_DT
2 LD1, LD2, LD3, LD4, LD6 Lãnh đạo F_LD
3 CV1, CV2, CV3, CV4, CV5 Bản chất công việc F_CV
4 TL1, TL2, TL3, TL4 Tiền lương F_TL
5 DK1, DK2, DK3, DK4 Điều kiện làm việc F_DK
6 DN1, DN2, DN3 Đồng nghiệp F_DN
7 HL1, HL2, HL3 Sự hài lòng F_HL
10. Tạo nhân tố đại diện sau EFA

Khi đặt ký hiệu cho nhân tố đại diện (biến đại diện), chúng ta nên
thêm tiền tố “F_” trước ký hiệu để tránh trùng ký tự đặc biệt
trong SPSS trong một số trường hợp. Nếu tên biến được khai
báo vi phạm nguyên tắc của SPSS, một bảng thông báo “Name
contain a reserved word” sẽ xuất hiện.
10. Tạo nhân tố đại diện sau EFA

• Tạo nhân tố đại diện bằng trung bình cộng


Từ bảng tổng hợp các nhân tố sau phân tích
EFA, trên giao diện SPSS, chúng ta vào
Transform > Compute Variables…
10. Tạo nhân tố đại diện sau EFA
• Tạo nhân tố đại diện bằng trung bình cộng
Một cửa sổ mới được mở ra, chúng ta chú ý tới 2 mục là Target
Variable bên trái và khung nhập hàm Numeric Expression bên
phải:
10. Tạo nhân tố đại diện sau EFA
• Tạo nhân tố đại diện bằng trung bình cộng
Khi khai báo tên biến, chúng ta có thể vào Type & Label để nhập
nhãn biến. Phần này không bắt buộc, có thể điền hoặc không
điền.
11.Hồi quy tuyến tính bội

Sử dụng tập dữ liệu thực hành có tên 350 - DLTH 1.sav


Chúng ta vào Analyze > Regression > Linear…
11.Hồi quy tuyến tính bội

Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô
Independents.
11.Hồi quy tuyến tính bội

Vào mục Statistics, tích chọn các mục như trong ảnh và chọn
Continue.
11.Hồi quy tuyến tính bội

Vào mục Plots, tích chọn vào Histogram và Normal probability


plot, kéo biến ZRESID thả vào ô Y, kéo biến ZPRED thả vào ô X
như hình bên dưới. Tiếp tục chọn Continue.
11.Hồi quy tuyến tính bội

Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao
diện ban đầu, mục Method là các phương pháp đưa biến vào,
tùy vào dạng nghiên cứu mà chúng ta sẽ chọn Enter hoặc
Stepwise. Tính chất đề tài thực hành là nghiên cứu khẳng định,
do vậy tác giả sẽ chọn phương pháp Enter đưa biến vào một
lượt. Tiếp tục nhấp vào OK
11.Hồi quy tuyến tính bội

SPSS sẽ xuất ra rất nhiều bảng, chúng ta sẽ tập trung vào các
bảng ANOVA, Model Summary, Coefficients và ba biểu đồ
Histogram, Normal P-P Plot, Scatter Plot.
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 102.268 6 17.045 133.369 .000b
Residual 43.835 343 .128
Total 146.103 349

Bảng ANOVA cho chúng ta kết quả kiểm định F để đánh giá giả
thuyết sự phù hợp của mô hình hồi quy. Giá trị sig kiểm định F
bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp.
11.Hồi quy tuyến tính bội
Model Summaryb
Adjusted R Std. Error of the
Model R R Square Square Estimate Durbin-Watson
1 .837a .700 .695 .35749 1.849

Bảng Model Summary cho chúng ta kết quả R bình phương (R


Square) và R bình phương hiệu chỉnh (Adjusted R Square) để đánh giá
mức độ phù hợp của mô hình. Giá trị R bình phương hiệu chỉnh bằng
0.695 cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng
69.5% sự biến thiên của biến phụ thuộc, còn lại 27.4% là do các biến
ngoài mô hình và sai số ngẫu nhiên.
Kết quả bảng này cũng đưa ra giá trị Durbin–Watson để đánh
giá hiện tượng tự tương quan chuỗi bậc nhất. Giá trị DW = 1.849, nằm
trong khoảng 1.5 đến 2.5 nên kết quả không vi phạm giả định tự tương
quan chuỗi bậc nhất (Yahua Qiao, 2011).
11.Hồi quy tuyến tính bội

Coefficients
Standardized
Unstandardized Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) -.475 .159 -2.982 .003
F_LD .267 .030 .322 8.990 .000 .681 1.467
F_DN .009 .030 .009 .283 .777 .794 1.259
F_CV .259 .031 .288 8.463 .000 .755 1.324
F_TL .084 .030 .096 2.783 .006 .730 1.370
F_DT .066 .030 .076 2.226 .027 .750 1.333
F_DK .393 .031 .421 12.686 .000 .794 1.259
www.themegallery.com Company Logo

You might also like