Phân Tích Kinh Doanh

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 15

gender

Cumulative
Frequency Percent Valid Percent Percent
Valid Female 64 61,0 61,0 61,0
Male 41 39,0 39,0 100,0
Total 105 100,0 100,0

ethnicity
Cumulative
Frequency Percent Valid Percent Percent
Valid Native 5 4,8 4,8 4,8
Asian 20 19,0 19,0 23,8
Black 24 22,9 22,9 46,7
White 45 42,9 42,9 89,5
Hispanic 11 10,5 10,5 100,0
Total 105 100,0 100,0

gender * ethnicity Crosstabulation


Count
ethnicity
Native Asian Black White Hispanic Total
gender Female 4 13 14 26 7 64
Male 1 7 10 19 4 41
Total 5 20 24 45 11 105

gender * ethnicity Crosstabulation


ethnicity
Native Asian Black White Hispanic Total
gender Female Count 4 13 14 26 7 64
% within gender 6,3% 20,3% 21,9% 40,6% 10,9% 100,0%
Male Count 1 7 10 19 4 41
% within gender 2,4% 17,1% 24,4% 46,3% 9,8% 100,0%
Total Count 5 20 24 45 11 105
% within gender 4,8% 19,0% 22,9% 42,9% 10,5% 100,0%
gender * ethnicity Crosstabulation
ethnicity
Native Asian Black White Hispanic Total
gender Female Count 4 13 14 26 7 64
% within ethnicity 80,0% 65,0% 58,3% 57,8% 63,6% 61,0%
Male Count 1 7 10 19 4 41
% within ethnicity 20,0% 35,0% 41,7% 42,2% 36,4% 39,0%
Total Count 5 20 24 45 11 105
% within ethnicity 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

Paired Samples Correlations


N Correlation Sig.
Pair 1 quiz1 & quiz2 105 ,673 ,000

Paired Samples Statistics


Mean N Std. Deviation Std. Error Mean
Pair 1 quiz1 7,47 105 2,481 ,242
quiz2 7,98 105 1,623 ,158

Paired Samples Test


Paired Differences
95% Confidence Interval
Std. Std. Error of the Difference Sig. (2-
Mean Deviation Mean Lower Upper t df tailed)
Pair quiz1 - -,514 1,835 ,179 -,869 -,159 -2,872 104 ,005
1 quiz2

Có sự khác biệt có ý nghĩa thống kê giữa 2 giá trị tb của bài quizz
Number format -show data labels – decimal 2 dưới 1

PHÂN TÍCH PHƯƠNG SAI ANOVA: so sánh giá trị trung bình của 2 hay nhiều nhóm khác nhau

Học anova một chiều(one way)


Descriptives
Overall, I am satisfied with the price performance ratio of Oddjob Airways.
95% Confidence Interval for
Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
Blue 677 4,47 1,641 ,063 4,35 4,60 1 7
Silver 245 4,03 1,560 ,100 3,84 4,23 1 7
Gold 143 3,99 1,556 ,130 3,73 4,24 1 7
Total 1065 4,31 1,625 ,050 4,21 4,40 1 7

Test of Homogeneity of Variances


Levene Statistic df1 df2 Sig.
Overall, I am satisfied with Based on Mean ,907 2 1062 ,404
the price performance ratio Based on Median ,068 2 1062 ,934
of Oddjob Airways. Based on Median and with ,068 2 1017,925 ,934
adjusted df
Based on trimmed mean ,771 2 1062 ,463

Kiểm tra sự đồng nhất của phương sai -> đọc based on mean
B1
Sig >0.05 không có sự khác biệt phương sai->đọc anova
Sig<0.0.5 có sự khác biệt phương sai-> đọc robust
B2

+ so sig với <0.05 có sự khác biệt có ý nghĩa thống kê giữa ít nhất 2 nhóm khách hàng về giá trị
trung bình của sự hài lòng về giá(không chỉ cụ thể nhóm nào)

ANOVA
Overall, I am satisfied with the price performance ratio of Oddjob Airways.
Sum of Squares df Mean Square F Sig.
Between Groups 51,755 2 25,878 9,963 ,000
Within Groups 2758,455 1062 2,597
Total 2810,210 1064

Robust Tests of Equality of Means


Overall, I am satisfied with the price performance ratio of
Oddjob Airways.
Statistica df1 df2 Sig.
Welch 10,230 2 345,211 ,000
a. Asymptotically F distributed.

B3
Test để biết cụ thể nhóm nào khác nhau: TUKEY test

Multiple Comparisons
Dependent Variable: Overall, I am satisfied with the price performance ratio of Oddjob Airways.
Tukey HSD
Mean Difference 95% Confidence Interval
(I) Traveler Status (J) Traveler Status (I-J) Std. Error Sig. Lower Bound Upper Bound
Blue Silver ,440* ,120 ,001 ,16 ,72
Gold ,487* ,148 ,003 ,14 ,83
*
Silver Blue -,440 ,120 ,001 -,72 -,16
Gold ,047 ,170 ,959 -,35 ,44
Gold Blue -,487* ,148 ,003 -,83 -,14
Silver -,047 ,170 ,959 -,44 ,35
*. The mean difference is significant at the 0.05 level.

Sig<0.05 : có sự khác biệt có ý nghĩa thống kê về giá trị trung bình của sự hài lòng về giá

Vd

-blue và silver: 0,01<0,05 : có sự khác biệt về giá trị trung bình


VD CHẠY ANOVA so sánh sự khác biệt trong total của biến ethinicity (grade.sav)

Descriptives
total
95% Confidence Interval for Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximu
Native 5 95,20 17,094 7,645 73,98 116,42 75 1
Asian 20 102,90 12,876 2,879 96,87 108,93 78 1
Black 24 100,08 14,714 3,004 93,87 106,30 65 1
White 45 102,27 14,702 2,192 97,85 106,68 51 1
Hispanic 11 92,91 21,215 6,397 78,66 107,16 52 1
Total 105 100,57 15,299 1,493 97,61 103,53 51 1

Test of Homogeneity of Variances


Levene Statistic df1 df2 Sig.
total Based on Mean ,930 4 100 ,450
Based on Median ,449 4 100 ,773
Based on Median and with ,449 4 78,532 ,773
adjusted df
Based on trimmed mean ,825 4 100 ,512

Sig>0.05 -> không có sự khác biệt mang ý nghĩa thống kê về phương sai -> dùng bảng anova

ANOVA
total
Sum of Squares df Mean Square F Sig.
Between Groups 1033,572 4 258,393 1,109 ,357
Within Groups 23310,142 100 233,101
Total 24343,714 104

Sig>0.05 ->không có sự khác biệt mang ý nghĩa thống kê về giá trị trung bình trong total của biến
ethinicity

Cụ thể: TUKEY TEST

Multiple Comparisons
Dependent Variable: total
Tukey HSD
Mean Difference 95% Confidence Interval
(I) ethnicity (J) ethnicity (I-J) Std. Error Sig. Lower Bound Upper Bound
Native Asian -7,700 7,634 ,851 -28,91 13,51
Black -4,883 7,506 ,966 -25,74 15,97
White -7,067 7,197 ,863 -27,06 12,93
Hispanic 2,291 8,235 ,999 -20,59 25,17
Asian Native 7,700 7,634 ,851 -13,51 28,91
Black 2,817 4,623 ,973 -10,03 15,66
White ,633 4,103 1,000 -10,77 12,03
Hispanic 9,991 5,731 ,413 -5,93 25,91
Black Native 4,883 7,506 ,966 -15,97 25,74
Asian -2,817 4,623 ,973 -15,66 10,03
White -2,183 3,859 ,980 -12,90 8,54
Hispanic 7,174 5,559 ,698 -8,27 22,62
White Native 7,067 7,197 ,863 -12,93 27,06
Asian -,633 4,103 1,000 -12,03 10,77
Black 2,183 3,859 ,980 -8,54 12,90
Hispanic 9,358 5,135 ,367 -4,91 23,62
Hispanic Native -2,291 8,235 ,999 -25,17 20,59
Asian -9,991 5,731 ,413 -25,91 5,93
Black -7,174 5,559 ,698 -22,62 8,27
White -9,358 5,135 ,367 -23,62 4,91

CORRELATIOṆ(R): ĐO LƯỜNG MỐI QUAN HỆ GIỮA HAI BIẾN


Correlations
S1 S2 S3. S4
** **
S1 Pearson Correlation 1 ,739 ,619 ,717**
Sig. (2-tailed) ,000 ,000 ,000
N 1038 1037 952 1033
** **
S2 Pearson Correlation ,739 1 ,694 ,766**
Sig. (2-tailed) ,000 ,000 ,000
N 1037 1040 952 1034
S3 Pearson Correlation ,619** ,694** 1 ,645**
Sig. (2-tailed) ,000 ,000 ,000
N 952 952 954 951
S4 Pearson Correlation ,717** ,766** ,645** 1
Sig. (2-tailed) ,000 ,000 ,000
N 1033 1034 951 1035
**. Correlation is significant at the 0.01 level (2-tailed).

HỒI QUY TUYẾN TÍNH

1 dependent variable
1 hoặc nhiều independent , nếu có 1 independent variable (hồi quy tuyến tính đơn), có 2 trở lên(hồi quy
tuyến tính bội)

Y= B0+b1x1+b2x2+b3x3+b4x4+ sai số

Chạy hồi quy là tìm B1,b2,b3,b4 :

VD CHẠY HỒI QUY file dữ liệu college and universities

Model Summary
Adjusted R Std. Error of the
Model R R Square Square Estimate
a
1 ,731 ,534 ,492 5,308
a. Predictors: (Constant), Top 10% HS, Median SAT,
Expenditures/Student, Acceptance Rate

Giải thích R SQUARE

53% biến thiên của biến phụ thuộc (graduation) được giải thích bởi các biến độc lập trong mô hình( cụ
thể, top 10% HS, median SAT, expenditure, acceptance)

Có 2 hạn chế:
- Khi tăng kích cỡ mẫu->R square tăng lên
- Khi thêm biến độc lộc vào mô hình -> R square tăng lên
 Dùng R hiệu chỉnh( Adjusted R Square)

Adjusted R Square=0,492

- 49% biến thiên của biến phụ thuộc (graduation) được giải thích bởi các biến độc lập trong mô
hình( cụ thể , top 10% HS, median SAT, expenditure, acceptance)

ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 1423,209 4 355,802 12,627 ,000b
Residual 1239,852 44 28,178
Total 2663,061 48
a. Dependent Variable: Graduation %
b. Predictors: (Constant), Top 10% HS, Median SAT, Expenditures/Student, Acceptance Rate

Dùng để đánh giá sự phù hợp của mô hình

Sig. So với 0,05

- Nếu sig. < 0,05 -> Mô hình có ý nghĩa thống kê và phù hợp
- Nếu sig. > 0,05-> Mô hình không có ý nghĩa thống kê và không phù hợp
-
-
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 17,921 24,557 ,730 ,469
Median SAT ,072 ,018 ,606 4,004 ,000
Acceptance Rate -,249 ,083 -,446 -2,990 ,005
Expenditures/Student ,000 ,000 -,282 -2,057 ,046
Top 10% HS -,163 ,079 -,296 -2,051 ,046
a. Dependent Variable: Graduation %

Cách đọc kết quả hồi quy


B1: Xem hệ số hồi quy có ý nghĩa thống kê hay không?
Sig.= significant= p- value(ý nghĩa thống kê) ; mức ý nghĩa thống kê phổ biến là 0.05
Nếu sig< 0.05-> có ý nghĩa thống kê -> bước 2
Nếu sig> 0.05-> không có ý nghĩa thống kê-> X không tác động lên Y
B2: Xem tác động tiêu cực hay tích cực
Nếu dấu của hệ số (+): X có tác động tích cực lên Y. Vd điểm median SAT có tác động tích cực
lên tỷ lệ tốt nghiệp
Nếu dấu của hệ số (-): X có tác động tiêu cực/ngược chiều lên Y
Note
Dấu của hệ số Unstandardized và Standardized là luôn giống nhau
Unstandardized Coefficients : hệ số còn giữ đơn vị gốc của biến
Standardized Coefficients Beta : Hệ số đã chuẩn hóa, không còn giữ đơn vị gốc của biến
Để giải thích ý nghĩa kinh tế, dùng Unstandardized Coefficients
Nếu X tăng 1 đơn vị , Y tăng bao nhiêu đơn vị, giữ nguyên các yếu tố khác không thay đổi
-Hệ số của biến Median SAT có ý nghĩa thống kê và có có dấu dương. Điều này cho thấy điểm
SAT có tác động tích cực lên tỷ lệ tốt nghiệp
Nếu điểm trung vị SAT tăng 1 điểm, tỷ lệ tốt nghiệp tăng 0.072%, giữ nguyên các yếu tố khác
không đổi
-Nếu tỷ lệ chấp thuận( acceptance rate) tăng 1% thì tỷ lệ tốt nghiệp giảm 0.249% giữ nguyên
các yếu tố khác không đổi
-Nếu chi tiêu (Expenditure) tăng 1$ thì tỷ lệ tốt nghiệp giữ nguyên, giữ nguyên các yếu tố khác
không đổi
-Nếu top 10% hs tăng 1 % thì tỷ lệ tốt nghiệp giảm 0,163% giữ nguyên các yếu tố khác không
đổi

ĐA CỘNG TUYẾN
Một vấn đề xảy ra khi có sự tương quan rất mạnh xảy ra giữa các biến độc lập trong mô hình
Khi |r| > 0.7: biểu hiện của đa cộng tuyến
2 hậu quả
- Dấu của hệ số có thể thay đổi(vd: đúng bản chất là dấu dương nhưng vì đa cộng tuyến nên
chuyển sang âm)
- Giá trị Sig. của hệ số bị tăng lên, khiến cho biến mất ý nghĩa thống kê
Correlations
Acceptance
Median SAT Rate Expenditures/Student Top 10% HS
**
Median SAT Pearson Correlation 1 -,602 ,573** ,503**
Sig. (2-tailed) ,000 ,000 ,000
N 49 49 49 49
Acceptance Rate Pearson Correlation -,602** 1 -,284* -,610**
Sig. (2-tailed) ,000 ,048 ,000
N 49 49 49 49
Expenditures/Student Pearson Correlation ,573** -,284* 1 ,506**
Sig. (2-tailed) ,000 ,048 ,000
N 49 49 49 49
** ** **
Top 10% HS Pearson Correlation ,503 -,610 ,506 1
Sig. (2-tailed) ,000 ,000 ,000
N 49 49 49 49
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
=> Không có hiện tượng đa cộng tuyến
Xử lý đa cộng tuyến: Tách các biến tương quan mạnh ra
Y= X1+X2+X3+X4
Trong đs X1 và X2 có hệ số tương quan > 0.7
Model 1 : Y=X1+X3+X4

Model 2: Y= X2+X3+X4

HỒI QUY VỚI BIẾN PHÂN LOẠI


Biến phổ biến: dummy(0,1)

Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 893,588 1824,575 ,490 ,628
Age 1044,146 42,141 ,975 24,777 ,000
MBA 14767,232 1351,802 ,430 10,924 ,000
a. Dependent Variable: Salary

Phân tích tác động của tuổi tác lên salary: Hệ số có dấu dương và có ý nghĩa thống kê, cụ thể
tuổi tác tăng lên 1 tuổi thì lương tăng 1044, các yếu tố khác không đổi
Phân tích tác động MBA lên salary: Hệ số của biến MBA có ý nghĩa thống kê và có dấu dương.

Điều này cho thấy có bằng MBA có tác động tích cực lên lương. Nếu một người nhân viên có
bằng MBA, người này có lương cao hơn 14767.23 USD so với người không có bằng MBA, giữ
nguyên các yếu tố khác không thay đổi.
HỒI QUY VỚI BIẾN TƯƠNG TÁC
Age tác động lên salary: tác động trực tiếp
MBA tác động lên salary: tác động điều tiết( điều tiết mqh giữa Age và Salary)
=>MBA có 3 khả năng tác động điều tiết
1. Tích cực(+)
2. Tiêu cực(-)
3. Không có tác động điều tiết
Để phân tích tác động điều tiết: Dùng biến Interaction(biến tương tác)
Age_MBA=Age*MBA

Phân tích hồi quy cho xuất hiện ( Age_MBA)

Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3902,509 1336,398 2,920 ,006
Age 971,309 31,069 ,907 31,263 ,000
MBA -2971,080 3026,242 -,086 -,982 ,334
Age_MBA 501,848 81,552 ,531 6,154 ,000
a. Dependent Variable: Salary

Hệ số của biến tương tác Age_MBA có ý nghĩa thống kê và có dấu dương. Điều này cho thấy có
bằng MBA có tác động điều tiết tích cực lên mối quan hệ giữa tuổi tác và lương.
Notes:
1. Khi hồi quy với biến tương tác, cần đưa biến thành phần vào(Age, MBA)
2. Khi hồi quy với biến tương tác, không đọc kết quả biến thành phần vào ( Age, MBA)

You might also like