Professional Documents
Culture Documents
Phân Tích Kinh Doanh
Phân Tích Kinh Doanh
Phân Tích Kinh Doanh
Cumulative
Frequency Percent Valid Percent Percent
Valid Female 64 61,0 61,0 61,0
Male 41 39,0 39,0 100,0
Total 105 100,0 100,0
ethnicity
Cumulative
Frequency Percent Valid Percent Percent
Valid Native 5 4,8 4,8 4,8
Asian 20 19,0 19,0 23,8
Black 24 22,9 22,9 46,7
White 45 42,9 42,9 89,5
Hispanic 11 10,5 10,5 100,0
Total 105 100,0 100,0
Có sự khác biệt có ý nghĩa thống kê giữa 2 giá trị tb của bài quizz
Number format -show data labels – decimal 2 dưới 1
PHÂN TÍCH PHƯƠNG SAI ANOVA: so sánh giá trị trung bình của 2 hay nhiều nhóm khác nhau
Kiểm tra sự đồng nhất của phương sai -> đọc based on mean
B1
Sig >0.05 không có sự khác biệt phương sai->đọc anova
Sig<0.0.5 có sự khác biệt phương sai-> đọc robust
B2
+ so sig với <0.05 có sự khác biệt có ý nghĩa thống kê giữa ít nhất 2 nhóm khách hàng về giá trị
trung bình của sự hài lòng về giá(không chỉ cụ thể nhóm nào)
ANOVA
Overall, I am satisfied with the price performance ratio of Oddjob Airways.
Sum of Squares df Mean Square F Sig.
Between Groups 51,755 2 25,878 9,963 ,000
Within Groups 2758,455 1062 2,597
Total 2810,210 1064
B3
Test để biết cụ thể nhóm nào khác nhau: TUKEY test
Multiple Comparisons
Dependent Variable: Overall, I am satisfied with the price performance ratio of Oddjob Airways.
Tukey HSD
Mean Difference 95% Confidence Interval
(I) Traveler Status (J) Traveler Status (I-J) Std. Error Sig. Lower Bound Upper Bound
Blue Silver ,440* ,120 ,001 ,16 ,72
Gold ,487* ,148 ,003 ,14 ,83
*
Silver Blue -,440 ,120 ,001 -,72 -,16
Gold ,047 ,170 ,959 -,35 ,44
Gold Blue -,487* ,148 ,003 -,83 -,14
Silver -,047 ,170 ,959 -,44 ,35
*. The mean difference is significant at the 0.05 level.
Sig<0.05 : có sự khác biệt có ý nghĩa thống kê về giá trị trung bình của sự hài lòng về giá
Vd
Descriptives
total
95% Confidence Interval for Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximu
Native 5 95,20 17,094 7,645 73,98 116,42 75 1
Asian 20 102,90 12,876 2,879 96,87 108,93 78 1
Black 24 100,08 14,714 3,004 93,87 106,30 65 1
White 45 102,27 14,702 2,192 97,85 106,68 51 1
Hispanic 11 92,91 21,215 6,397 78,66 107,16 52 1
Total 105 100,57 15,299 1,493 97,61 103,53 51 1
Sig>0.05 -> không có sự khác biệt mang ý nghĩa thống kê về phương sai -> dùng bảng anova
ANOVA
total
Sum of Squares df Mean Square F Sig.
Between Groups 1033,572 4 258,393 1,109 ,357
Within Groups 23310,142 100 233,101
Total 24343,714 104
Sig>0.05 ->không có sự khác biệt mang ý nghĩa thống kê về giá trị trung bình trong total của biến
ethinicity
Multiple Comparisons
Dependent Variable: total
Tukey HSD
Mean Difference 95% Confidence Interval
(I) ethnicity (J) ethnicity (I-J) Std. Error Sig. Lower Bound Upper Bound
Native Asian -7,700 7,634 ,851 -28,91 13,51
Black -4,883 7,506 ,966 -25,74 15,97
White -7,067 7,197 ,863 -27,06 12,93
Hispanic 2,291 8,235 ,999 -20,59 25,17
Asian Native 7,700 7,634 ,851 -13,51 28,91
Black 2,817 4,623 ,973 -10,03 15,66
White ,633 4,103 1,000 -10,77 12,03
Hispanic 9,991 5,731 ,413 -5,93 25,91
Black Native 4,883 7,506 ,966 -15,97 25,74
Asian -2,817 4,623 ,973 -15,66 10,03
White -2,183 3,859 ,980 -12,90 8,54
Hispanic 7,174 5,559 ,698 -8,27 22,62
White Native 7,067 7,197 ,863 -12,93 27,06
Asian -,633 4,103 1,000 -12,03 10,77
Black 2,183 3,859 ,980 -8,54 12,90
Hispanic 9,358 5,135 ,367 -4,91 23,62
Hispanic Native -2,291 8,235 ,999 -25,17 20,59
Asian -9,991 5,731 ,413 -25,91 5,93
Black -7,174 5,559 ,698 -22,62 8,27
White -9,358 5,135 ,367 -23,62 4,91
1 dependent variable
1 hoặc nhiều independent , nếu có 1 independent variable (hồi quy tuyến tính đơn), có 2 trở lên(hồi quy
tuyến tính bội)
Y= B0+b1x1+b2x2+b3x3+b4x4+ sai số
Model Summary
Adjusted R Std. Error of the
Model R R Square Square Estimate
a
1 ,731 ,534 ,492 5,308
a. Predictors: (Constant), Top 10% HS, Median SAT,
Expenditures/Student, Acceptance Rate
53% biến thiên của biến phụ thuộc (graduation) được giải thích bởi các biến độc lập trong mô hình( cụ
thể, top 10% HS, median SAT, expenditure, acceptance)
Có 2 hạn chế:
- Khi tăng kích cỡ mẫu->R square tăng lên
- Khi thêm biến độc lộc vào mô hình -> R square tăng lên
Dùng R hiệu chỉnh( Adjusted R Square)
Adjusted R Square=0,492
- 49% biến thiên của biến phụ thuộc (graduation) được giải thích bởi các biến độc lập trong mô
hình( cụ thể , top 10% HS, median SAT, expenditure, acceptance)
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 1423,209 4 355,802 12,627 ,000b
Residual 1239,852 44 28,178
Total 2663,061 48
a. Dependent Variable: Graduation %
b. Predictors: (Constant), Top 10% HS, Median SAT, Expenditures/Student, Acceptance Rate
- Nếu sig. < 0,05 -> Mô hình có ý nghĩa thống kê và phù hợp
- Nếu sig. > 0,05-> Mô hình không có ý nghĩa thống kê và không phù hợp
-
-
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 17,921 24,557 ,730 ,469
Median SAT ,072 ,018 ,606 4,004 ,000
Acceptance Rate -,249 ,083 -,446 -2,990 ,005
Expenditures/Student ,000 ,000 -,282 -2,057 ,046
Top 10% HS -,163 ,079 -,296 -2,051 ,046
a. Dependent Variable: Graduation %
ĐA CỘNG TUYẾN
Một vấn đề xảy ra khi có sự tương quan rất mạnh xảy ra giữa các biến độc lập trong mô hình
Khi |r| > 0.7: biểu hiện của đa cộng tuyến
2 hậu quả
- Dấu của hệ số có thể thay đổi(vd: đúng bản chất là dấu dương nhưng vì đa cộng tuyến nên
chuyển sang âm)
- Giá trị Sig. của hệ số bị tăng lên, khiến cho biến mất ý nghĩa thống kê
Correlations
Acceptance
Median SAT Rate Expenditures/Student Top 10% HS
**
Median SAT Pearson Correlation 1 -,602 ,573** ,503**
Sig. (2-tailed) ,000 ,000 ,000
N 49 49 49 49
Acceptance Rate Pearson Correlation -,602** 1 -,284* -,610**
Sig. (2-tailed) ,000 ,048 ,000
N 49 49 49 49
Expenditures/Student Pearson Correlation ,573** -,284* 1 ,506**
Sig. (2-tailed) ,000 ,048 ,000
N 49 49 49 49
** ** **
Top 10% HS Pearson Correlation ,503 -,610 ,506 1
Sig. (2-tailed) ,000 ,000 ,000
N 49 49 49 49
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
=> Không có hiện tượng đa cộng tuyến
Xử lý đa cộng tuyến: Tách các biến tương quan mạnh ra
Y= X1+X2+X3+X4
Trong đs X1 và X2 có hệ số tương quan > 0.7
Model 1 : Y=X1+X3+X4
Model 2: Y= X2+X3+X4
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 893,588 1824,575 ,490 ,628
Age 1044,146 42,141 ,975 24,777 ,000
MBA 14767,232 1351,802 ,430 10,924 ,000
a. Dependent Variable: Salary
Phân tích tác động của tuổi tác lên salary: Hệ số có dấu dương và có ý nghĩa thống kê, cụ thể
tuổi tác tăng lên 1 tuổi thì lương tăng 1044, các yếu tố khác không đổi
Phân tích tác động MBA lên salary: Hệ số của biến MBA có ý nghĩa thống kê và có dấu dương.
Điều này cho thấy có bằng MBA có tác động tích cực lên lương. Nếu một người nhân viên có
bằng MBA, người này có lương cao hơn 14767.23 USD so với người không có bằng MBA, giữ
nguyên các yếu tố khác không thay đổi.
HỒI QUY VỚI BIẾN TƯƠNG TÁC
Age tác động lên salary: tác động trực tiếp
MBA tác động lên salary: tác động điều tiết( điều tiết mqh giữa Age và Salary)
=>MBA có 3 khả năng tác động điều tiết
1. Tích cực(+)
2. Tiêu cực(-)
3. Không có tác động điều tiết
Để phân tích tác động điều tiết: Dùng biến Interaction(biến tương tác)
Age_MBA=Age*MBA
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3902,509 1336,398 2,920 ,006
Age 971,309 31,069 ,907 31,263 ,000
MBA -2971,080 3026,242 -,086 -,982 ,334
Age_MBA 501,848 81,552 ,531 6,154 ,000
a. Dependent Variable: Salary
Hệ số của biến tương tác Age_MBA có ý nghĩa thống kê và có dấu dương. Điều này cho thấy có
bằng MBA có tác động điều tiết tích cực lên mối quan hệ giữa tuổi tác và lương.
Notes:
1. Khi hồi quy với biến tương tác, cần đưa biến thành phần vào(Age, MBA)
2. Khi hồi quy với biến tương tác, không đọc kết quả biến thành phần vào ( Age, MBA)