Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 36

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN KINH TẾ VÀ QUẢN LÝ


--- o0o ---

TIỂU LUẬN HỌC PHẦN


THỐNG KÊ ỨNG DỤNG

Giả ng viên hướ ng dẫ n : ThS. Lê Văn Hòa


Nhó m sinh viên : Nguyễn Kiên Định 20192429
: Trầ n Thị Lan Hương 20192455
: Nguyễn Hả i Nam 20192473
: Lương Thị Thù y Dương 20192332
: Phạ m Thị Hồ ng Hiếu 20192446

1
MỤC LỤC
Tình huống 1:
1. Tó m tắ t dữ liệu bằ ng đồ thị và bằ ng tham số thố ng kê mô tả......................................................................................... 3
1.1 Đố i vớ i thờ i gian truy cậ p website cô ng ty........................................................................................................................... 3
1.2 Đố i vớ i số trang đã đọ c................................................................................................................................................................. 4
1.3 Đố i vớ i số tiền chi tiêu bình quâ n mộ t giao dịch................................................................................................................ 6
2. Tó m tắ t tầ n số số tiền đã chi tiêu và số tiền chi tiêu bình quâ n mộ t giao dịch theo từ ng ngày thứ trong tuầ n. 8
3. Tó m tắ t tầ n số số tiền đã chi tiêu và số tiền chi tiêu bình quâ n mộ t giao dịch theo loại trình duyệt web đã sử dụng
8
4. Sự liên hệ giữ a thờ i gian truy cậ p website và số tiền đã chi tiêu................................................................................... 8
4.1 Biểu đồ thể hiện mố i liên hệ gian thờ i gian truy cậ p website và số tiền chi tiêu .
......................................................................................................................................................................................................................... 9
5. Mố i liên hệ giữ a số trang đã xem trên website và số tiền đã chi tiêu........................................................................... 9
5.1 Biểu đồ thể hiện mố i liên hệ giữ a số trang đã xem trên website và số tiền chi mua hà ng...............................10
6. Sự liên hệ giữ a thờ i gian truy cậ p website vớ i số trang đã xem.................................................................................... 10
6.1 Biểu đồ thể hiện sự liên hệ giữ a thờ i gian truy cậ p website và số trang đã xem .................................................. 10
Tình huống 2: Công ty sản xuất đồ chơi trẻ em Specialty Toys.........................................................................11
1. Đồ thị phâ n phố i................................................................................................................................................................................ 12
2. Xá c suấ t hết hà ng đố i vớ i cá c phương á n đặ t hà ng đượ c đề ra....................................................................................... 12
3. Lợ i nhuậ n kì vọ ng............................................................................................................................................................................. 13
3.1 Giả định bá n đượ c 10000 sả n phẩ m....................................................................................................................................... 13
3.2 Giả định bá n đượ c 20000 sả n phẩ m....................................................................................................................................... 13
3.3 Giả định bá n đượ c 30000 sả n phẩ m....................................................................................................................................... 13
4. Lợ i nhuậ n dự kiến............................................................................................................................................................................. 14
5. Khuyến nghị........................................................................................................................................................................................ 15
Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto).........................16
1.Phâ n tích thô ng kê mô tả .................................................................................................................................................................. 16
Ướ c lượ ng trung bình khoả ng.......................................................................................................................................................... 17
Thả o luậ n hà m ý..................................................................................................................................................................................... 17
Xá c định cỡ mẫ u..................................................................................................................................................................................... 18
Thô ng tin thêm........................................................................................................................................................................................ 18
Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary)..................................................19
1. Phâ n tích thố ng kê mô tả ................................................................................................................................................................ 19
2. Ướ c lượ ng khoả ng trung bình..................................................................................................................................................... 19
3. Ướ c lượ ng khoả ng trung bình củ a cá c nhâ n viên bá n hà ng tạ i doanh nghiệp.........................................................20
4. Ướ c lượ ng khoả ng trung bình củ a cá c nhâ n viên bá n hà ng tạ i thự c địa....................................................................20
5. Kiểm định giả thuyết........................................................................................................................................................................ 21
6. Kiểm định giả thuyết........................................................................................................................................................................ 22
7. Kiểm định giả thuyết........................................................................................................................................................................ 24
Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer)............................26
1. Thống kê mô tả..................................................................................................................................................................................... 26
2. Xâ y dự ng phương trình hồ i qui mẫ u......................................................................................................................................... 26
3. Xâ y dự ng phương trình hồ i quy bộ i.......................................................................................................................................... 33
4. Dự bá o.................................................................................................................................................................................................... 35
5. Thô ng tin thêm................................................................................................................................................................................... 35
TÀI LIỆU THAM KHẢO....................................................................................................................................................................... 36

Tình huống 1:

2
Công ty sô-cô-la Heavenly Chocolates (Chapter 3, Shopper)
Bài làm
1. Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả
1.1 Đối với thời gian truy cập website công ty

Cumulative
Bin Frequency
%
4-10 17 34.00%
10-16 22 78.00%
16-22 6 90.00%
22-28 3 96.00%
28-34 2 100.00%
More 0 100.00%

25
Histogram
20 120.00%
100.00% Frequency
15
80.00% Cumulative %
10
60.00%
5 40.00%
0 20.00%
Frequency

0.00%

3
Descriptive statistics
Time (min)
Count 50
Mean 12.810
sample standard deviation 6.063
sample variance 36.764
minimum 4.3
maximum 32.9
Range 28.6
Sum 640.500
sum of squares 10,006.230
deviation sum of squares (SSX) 1,801.425
standard error of the mean 0.857
skewness 1.450
kurtosis 2.404
coefficient of variation (CV) 47.33%
1st quartile 8.650
Median 11.400
3rd quartile 14.900
interquartile range 6.250
Mode 11.400
low extremes 0
low outliers 0
high outliers 4
high extremes 0
Nhận xét: Thờ i gian truy cậ p website củ a khá ch hà ng chủ yếu dướ i 16 phú t, chiếm tớ i
78%
1.2 Đối với số trang đã đọc

4
Bin Frequency Cumulative %
2-4 25 50.00%
4-6 15 80.00%
6-8 7 94.00%
8-10 3 100.00%
More 0 100.00%

Histogram
30
150.00%
Frequency

20 100.00%
10 50.00% Frequency

00.00% Cumulative %
2-44-66-88-10 More
Bin

Descriptive statistics
Pages Viewed
count 50
mean 4.82
sample standard deviation 2.04
sample variance 4.15
minimum 2
maximum 10
range 8
sum 241.00
sum of squares 1,365.00
deviation sum of squares (SSX) 203.38
standard error of the mean 0.29
skewness 0.65

5
kurtosis 0.17

coefficient of variation (CV) 42.27%


1st quartile 3.25
median 4.50
3rd quartile 6.00
interquartile range 2.75
mode 4.00
low extremes 0
low outliers 0
high outliers 0
high extremes 0

Nhận xét: Số lượ ng trang mà khá ch hà ng đã xem là khá khiêm tố n, chủ yếu là từ 2 đến 6 trang, chiếm 80%.
1.3 Đối với số tiền chi tiêu bình quân một giao dịch

Bin Frequency Cumulative %


17-46 14 27.45%
46-75 23 72.55%
75-104 7 86.27%
30104-133 4
Histogram
94.12%
20 150.00% Frequency
10133-162
Bin3 100.00% 100.00% Cumulative %
0 50.00%
More 0 0.00% 100.00%
Frequency

Descriptive statistics
Amount Spent ($)
6
count 50
mean 68.1282
sample standard deviation 32.3438
sample variance 1,046.1187
minimum 17.84
maximum 158.51
range 140.67
sum 3,406.4100
sum of squares 283,332.3967
deviation sum of squares
51,259.8149
(SSX)
standard error of the mean 4.5741
skewness 1.0490
kurtosis 0.8765
coefficient of variation (CV) 47.47%
1st quartile 45.5600
median 62.1500
3rd quartile 82.7350
interquartile range 37.1750
mode #N/A
low extremes 0
low outliers 0
high outliers 2
high extremes 0

7
Nhận xét: Khá ch hà ng chi tiêu chủ yếu ở mứ c dướ i 75$, chiếm 72.55% tổ ng lượ ng tiền đã chi tiêu cho
mua hà ng online.
2. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo từng ngày
thứ trong tuần

Thứ Số giao dịch Tổng số tiền($) Tần số(%) Số tiền bình quân($)
Mon 9 813.38 25.88 90.38
Tue 7 414.86 13.20 59.27
Wed 6 341.82 10.87 56.97
Thu 5 294.03 9.35 58.81
Fri 11 682.24 21.71 62.02
Sat 7 378.74 12.05 54.11
Sun 5 218.15 6.94 43.63
Tổ ng 50 3143.22 100.00

Nhận xét:
Qua bả ng số liệu trên, ta thấ y lượ ng khá ch mua hà ng và o cá c ngà y thứ 2 và thứ 6 là khá lớ n, kéo theo số
tiền đã chi tiêu cũ ng lớ n. Trong khi đó , cá c ngà y chủ nhậ t và thứ 5, số lầ n giao dịch ít hơn, vì vậ y lượ ng
tiền chi tiêu ít hơn nhữ ng ngà y khá c.
3. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo loại trình
duyệt web đã sử dụng
Số giao
Loại trình duyệt Tổng số tiền($) Tần số(%) Số tiền bình quân($)
dịch
Internet Explorer 27 1656.81 48.64 61.36
Firefox 16 1228.21 36.05 76.76
Other 7 521.39 15.31 74.48
Tổ ng 50 3406.41 100.00

Nhận xét:
Khá ch hà ng chủ yếu sử dụ ng trình duyệt Internet Explorer để truy cậ p website, do đó số
tiền khá ch hà ng đã chi tiêu cho mua hà ng online ở trình duyệt web nà y lớ n hơn cá c trình
duyệt cò n lạ i. Tuy nhiên số tiền chi bình quâ n cho mỗ i giao dịch lạ i thấ p hơn Firefox và cá c
trình duyệt web khá c.
4. Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu

8
Amount Spent($)
180.0
0 y = 3.0942x +
160.0
0 28.492
140.0 r² = 0.3365
Amount Spent
0
120.0 ($)
0 Linear
(Amount
100.0 Spent ($))
080.00
60.00

40.00

20.00

0.00
0.0 10.020.0 30.0 40.0
Times(min)

4.1 Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi
tiêu
Hệ số tương quan mẫ u r = 0.580048
Nhận xét: Giữ a thờ i gian truy cậ p website và số tiền chi tiêu có mố i liên hệ tương quan
tuyến tính thuậ n chiều, thờ i gian truy cậ p website cà ng nhiều thì số tiền chi tiêu cà ng
cao.
5. Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu

180.00
y = 11.489x + 12.752
Amount Spent($)

160.0
r² =
0
0.5237
140.0 Amount
0 Spent
120.0 ($)
0 Linear
(Amount
100.0
Spent ($))
0
80.00
60.00
40.00 051015
20.00 Pages Viewed

0.00
9
5.1 Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và số tiền chi
mua hàng
Hệ số tương quan r = 0.7236
Nhận xét: Thô ng qua đồ thị tá n xạ và hệ số tương quan r = 0.7236, ta nhậ n thấ y có mộ t
mố i liên hệ tương quan tuyến tính mạ nh giữ a số trang đã xem trên website và số tiền
chi mua hà ng, tứ c là số lượ ng trang củ a website đượ c xem cà ng nhiều thì số lượ ng tiền
khá ch hà ng đã chi tiêu để mua hà ng củ a cô ng ty cà ng lớ n.
6. Sự liên hệ giữa thời gian truy cập website với số trang đã xem

35.0

30.0
Times( min)

25.0
Time (min)
20.0
15.0 Linear (Time (min))

10.0
y = 1.7725x + 4.2666
5.0 r² = 0.3547

0.0
0 5 10 15
Pages Viewed

6.1 Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang đã xem
Hệ số tương quan mẫ u r = 0.5956
Nhận xét:
Qua đồ thị tá n xạ và hệ số tương quan tuyến tính mẫ u r, ta thấ y có 1 mố i liên hệ tuyến
tính thuậ n chiều giữ a thờ i gian truy cậ p website và số trang đã xem, khá ch hà ng xem
cà ng nhiều trang thì thờ i gian truy cậ p website cà ng nhiều.

10
Tình huống 2:
Công ty sản xuất đồ chơi trẻ em Specialty Toys
Bài làm
1. Đồ thị phân phối
Vớ i doanh số kỳ vọ ng là : 𝜇𝑜 = 200000 sả n phẩ m Từ
giả thiết ta có :
1 – α = 0.95 => α =0.05 =>Zα/2 = 1.96
Mặ t khá c, nhu cầ u 10000 <= 𝜇<= 30000.
Đồ thị phâ n phố i nhu cầ u mua hà ng

Ta có P(xbar - Zα/2 . 𝜎xbar <= 𝜇<= xbar + Zα/2 . 𝜎xbar ) = 1 – α = 0.95


=> P(10000 <= 𝜇<= 30000) = 1 – α = 0.95
Xbar−Z α / 2.σxbar =10000
=> { Xbar +Z α /2. σxbar =30000

2 Xbar=40000
{
=> 2 Z
α / 2.σxbar =20000

=> {Xbar=20000
σxbar=5120

11
=> Vậ y giá trị TB và độ lệch chuẩ n củ a phâ n phố i lầ n lượ t là : Xbar=20000;σxbar =5120
2. Xác suất hết hàng đối với các phương án đặt hàng được đề ra
Phương án 1 : 15000 sả n phẩ m
P( X>= 15000) = P ( 𝑋− 𝜇 𝑂 >= 15000− 𝜇 𝑂
) = P( Z >= -0.98)
𝜎xbar 𝜎xbar
= P(Z> 0) + P( -0.98 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.98)
= 0.5 + 0.3365
=0.8365
Vậy xác suất hết hàng đối với trường hợp đặt 15000 sản phẩm là 0.8365.
Phương án 2 : 18000 sả n phẩ m
P( X>= 18000) = P ( 𝑋− 𝜇 𝑂 >= 18000− 𝜇 𝑂
) = P( Z >= -0.39)
𝜎xbar 𝜎xbar
= P(Z> 0) + P( -0.392 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.39)
= 0.5 + 0.1517
= 0.6517
Vậy với phương án đặt mua 18000 sản phẩm, xác xuất bán hết hàng là 0.6517
Phương án 3 : 24000 sả n phẩ m
P( X>= 24000) = P ( 𝑋− 𝜇 𝑂 >= 24000− 𝜇 𝑂
) = P( Z >= 0.78)
𝜎xbar 𝜎xbar
= P(Z> 0) - P( 0 <Z <= 0.78)
= 0.5 – 0.2823
= 0.2177
Xác suất bán hết 24000 sản phẩm là 0.2177
Phương án 4 : 28000 sả n phẩ m
P( X>= 28000) = P ( 𝑋− 𝜇 𝑂 >= 28000− 𝜇 𝑂
) = P( Z >= 1.57)
𝜎xbar 𝜎xbar
= P(Z> 0) - P( 0 <Z <= 1.57)
= 0.5 – 0.4418
= 0.0582
Xác suất bán hết 28000 sản phẩm là 0.0582

12
3. Lơi nhuận kì vọng
3.1. Giả định bán được 10000 sản phẩm

Tổ ng tiền
Mua Tổ ng tiền Tổ ng tiền Lợ i nhuậ n
đầ u tư mua
(sả nphẩ m) bá n đượ c giá bá n đượ c ($)
sả n phẩ m
24$ ($) giá 5$($)
giá 16$ ($)

15000 240000 25000 240000 -25000


18000 240000 40000 288000 -8000
24000 240000 70000 384000 -74000
28000 240000 90000 448000 -118000

3.2. Giả định bán được 20000 sản phẩm

Mua Tổ ng tiền bá n Tổ ng tiền bá n Tổ ng tiền đầ u Lợ i nhuậ n


(sả n phẩ m) giá 24$ ($) giá 5$ ($) tư giá 16$ ($) ($)
15000 360000 0 240000 120000
18000 432000 0 288000 144000
24000 480000 20000 384000 116000
28000 480000 40000 448000 72000

3.3. Giả định bán được 30000 sản phẩm

Mua Tổ ng tiền bá n Tổ ng tiền bá n Tổ ng tiền đầ u Lợ i nhuậ n


(sả n phẩ m) giá 24$ ($) giá 5$ ($) tư giá 16$ ($) ($)
15000 360000 0 240000 120000
18000 432000 0 288000 144000
24000 576000 0 384000 192000
28000 672000 0 448000 224000

Vậ y lợ i nhuậ n kì vọ ng khi đặ t mua:


 15000 sả n phẩ m là
(-25000+120000+120000).P(X>15000)=179740($)
 18000 sả n phẩ m là

13
(-8000+144000+144000).P(X>18000)=182476($)
 24000 sả n phẩ m là
(-74000+192000+116000).P(X>240000)=51480($)
 30000 sả n phẩ m là
(-118000+72000+224000).P(X>28000)=10324($)
4. Lợi nhuận dự kiến
Gọ i số lượ ng hà ng cầ n đặ t mua là S( sả n phẩ m ). Vì lượ ng hà ng cầ n đặ t phả i đá p ứ ng 70% nhu cầ u ngườ i
mua và chỉ nên 30% hết hà ng.
Tương tự phầ n tính xá c suấ t hết hà ng, ta có :
P(X>=S) = 0.3
=> P ¿
Vớ i S >𝜇𝑜 = 20000 => Z’ > 0.
=> P ( Z>= Z’) = P( Z>0) – P( 0< Z<= Z’) =0.3
=> 0.5 - P( 0< Z<= Z’) = 0.3
=> P( 0< Z<= Z’) = 0.2
=> Z’ = 0.0793
S−μ O
=> =0.0793 => S = 20404.5886
σxbar
Hay lượng hàng ta cần đặt mua là 20404 sản phẩm.
 Lợ i nhuậ n dự kiến thu đượ c là :

phương doanh hà ng tồ n doanh thu kì tiền bá n hà ng số tiền mua lợ i nhuậ n


á n (x1) số (x2) kho (x3) giá ng sinh (x4) tồ n kho (x5) hà ng (x6) ( x7)
X3= x1-x2 X4 =x2 *24 $ X5= x3 * 5$ X6= x1*16$ X7= x4+x5 –x6
20405 10000 10405 489720 52025 326480 215265
20405 20000 405 489720 2025 326480 165265
20405 30000 -9595 489720 -47975 326480 115265

 Vậy lợi nhuận dự kiến theo 3 phương án lần lượt là: 215265;165265; 115265.

14
5. Khuyến nghị
Trướ c khi đặ t hà ng ta cầ n tính toá n kỹ xem mứ c tổ n thấ t hay lợ i nhuậ n nhậ n dượ c là
bao nhiêu để có thể đưa ra con số gâ y ít tổ n thấ t nhấ t.
Nên đặ t mua số lượ ng là 18000 sả n phẩ m. Dự bá o lợ i nhuậ n là 182476($)
Vì P(X>18000)=0,652
Lợ i nhuậ n kì vọ ng là lớ n nhấ t trong 4 trườ ng hợ p đặ t mua hà ng là 182476($)

15
Tình huống 3:
Công ty nghiên cứu thị trường Metropolitan Research
(Chapter 8, Auto)
1) Phân tích thông kê mô tả

Column1 Column2
Descriptive statistics

Miles
Count 50
Mean 73,340.30
sample variance 619,946,014.05
sample standard
24,898.72
deviation
Minimum 25066
Maximum 138114
Range 113048
Sum 3,667,015.00
sum of squares 299,317,334,893.00
deviation sum of squares
30,377,354,688.50
(SSX)

Skewness 0.26
Kurtosis 0.17
coefficient of variation
33.95%
(CV)

1st quartile 60,421.00


Median 72,705.00
3rd quartile 86,575.00
interquartile range 26,154.00
Mode #N/A

16
 Trung bình mẫ u: mean = 73 340.30
 Cỡ mẫ u: n = 50
 Phương sai: S^2 = 619 946 014.05
 Độ lệch chuẩ n: s = 24 898.72
 Tổ ng = 3 667 015
 Trung vị: Me = 72 705

Biểu đồ hộ p và râ u:

BoxPlot

0 20000400006000080000 100000 120000 140000 160000 180000


Miles

2) Ước lượng trung bình khoảng


n=50; s=24898.72; ͞x =73340.30; 1-α=0.95;
Giả sử X là số dặ m lá i đượ c đến khi bộ truyền độ ng bị lỗ i.

1-α = 0.95 => α=0.05 => α/2=0.025 => Zα/2= Z0.025=1.96


N=50>30 nên mẫ u có phâ n phố i xấ p xỉ phâ n phố i bình thườ ng,
e = Zα/2*s/√n = 1.96*24898.72/√50 = 6901.57
L = ͞x –e = 73340.30 – 6901.57 = 66438.73
U= ͞x +e = 73340.30 + 6901.57 = 80241.87
 Khoả ng ướ c lượ ng cho µ là : L ≤ µ ≤ U
Vậ y vớ i độ tin cậ y 95%, số dặ m trung bình tổ ng thể lá i đượ c đến khi bộ truyền độ ng bị
lỗ i đượ c ướ c lượ ng trong khoả ng từ 66438.73 miles đến 80241.87 miles. Vì giá trị
73340.30 thuộ c khoả ng ướ c lượ ng nà y nên ta có thể khẳ ng định bộ truyền độ ng hoạ t
độ ng bình thườ ng.
3) Thảo luận hàm ý
Từ bả ng thố ng kê ta thấ y:

17
 Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phâ n phố i lệch phả i.
 Độ trả i giữ a R0 = 86 575 – 60 421 = 26 154 => mứ c độ phâ n tá n củ a dữ liệu khá
lớ n
 Trung vị nằ m giữ a 2 tứ phâ n vị cho thấ y phâ n phố i khá đều.
Vậ y cho nên chưa có đủ că n cứ để tin rằ ng mộ t số ngườ i mua xe hơi đã bị hỏ ng bộ
truyền độ ng sớ m.
4) Xác định cỡ mẫu
Vớ i e=5000; s = 24898.72; Zα/2= 1.96 thì cầ n lấ y cỡ mẫ u tố i thiểu là :
N = (Zα/2*s)2/e2 = (1.96*24898.72)2/50002 = 95.263
Vậ y lấ y cỡ mẫ u tố i thiểu là 96 chiếc xe.
5) Thông tin thêm
Để đá nh giá vấ n đề lỗ i bộ truyền độ ng mộ t cá ch đầ y đủ hơn thì cầ n có thêm thô ng tin về:
 Tiêu chuẩ n số dặ m mà mộ t chiếc xe bình thườ ng lá i đượ c đến khi bị lỗ i bộ truyền
độ ng mà cô ng ty đặ t ra.
 Lấ y cỡ mẫ u lớ n hơn để có dữ liệu vớ i độ sai lệch ít hơn.

18
Tình huống 4:
Thu nhập của nhân viên bán hàng
(Chapter 13, SalesSalary)
1. Phân tích thống kê mô tả.

Descriptive statistics
Salary ($)
count 120 Số quan sá t
mean 64,925.48 Giá trị trung bình
sample standard deviation 10,838.67 Độ lệch chuẩ n s
sample variance 117,476,831.86 Phương sai mẫ u
minimum 48621
maximum 88730
range 40109 khoả ng biến thiên
1st quartile 56,274.25 Tứ phâ n vị thứ nhấ t
Trung vị (Tứ phâ n vị thứ
median 61,489.50
2)
3rd quartile 76,092.25 Tứ phâ n vị thứ 3
interquartile range 19,818.00 Độ trả i giữ a
mode 53,464.00

2. Ước lượng khoảng trung bình


Ướ c lượ ng khoả ng tin cậ y 95% củ a thu nhậ p trung bình nă m củ a tấ t cả nhữ ng
ngườ i bá n hà ng.
n=120>30 =>theo định lý giớ i hạ n trung tâ m, trung bình mẫ u sẽ xấ p xỉ phâ n
phố i normal.
confidence interval 95.% lower 62,986.23
confidence interval 95.% upper 66,864.72
margin of error 1,939.25
z 1.96

19
Vớ i độ tin cậ y 95%, thu nhậ p trung bình nă m củ a tất cả nhữ ng ngườ i bá n hàng đượ c ướ c lượ ng trong
khoả ng 62,986.23 đế n 66,864.72
3. Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp
Ướ c lượ ng khoả ng tin cậ y 95% củ a thu nhậ p trung bình nă m củ a cá c nhâ n viên bá n
hà ng tạ i doanh nghiệp (inside).
n=60>30 =>theo định lý giớ i hạ n trung tâ m, trung bình mẫ u sẽ xấ p xỉ phâ n phố i
normal.

inside
count 60
confidence interval 95.% lower 55,112.18
confidence interval 95.% upper 56,928.85
margin of error 908.33
z 1.96
Vớ i độ tin cậ y 95%, thu nhậ p trung bình nă m củ a các nhâ n viên bá n hà ng tạ i doanh nghiệp (inside) đượ c
ướ c lượ ng trong khoả ng 55,112.18 đến 56,928.85
4. Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa
Ướ c lượ ng khoả ng tin cậ y 95% củ a thu nhậ p trung bình nă m củ a cá c nhâ n viên bá n
hà ng tạ i thự c địa (outside).
n=60>30 =>theo định lý giớ i hạ n trung tâ m, trung bình mẫ u sẽ xấ p xỉ phâ n phố i
normal.
outside
count 60
confidence interval 95.% lower 71,825.68
confidence interval 95.% upper 75,835.18
margin of error 2,004.75
z 1.96

20
Vớ i độ tin cậ y 95%, thu nhậ p trung bình nă m củ a các nhâ n viên bá n hà ng tạ i thự c địa (outside) đượ c ướ c
lượ ng trong khoả ng 71,825.68 đến 75,835.18
5. Kiểm định giả thuyết.
H0: µ1=µ2, thu nhậ p do vị trí cô ng tá c là như nhau.
H1: µ1≠µ2, có sự khá c nhau về thu nhậ p do vị trí cô ng tá c.

One factor ANOVA

Mean n Std. Dev


56,020.5 60 3,589.83 inside
73,830.4 60 7,922.96 outside
64,925.5 120 10,838.67 Total

ANOVA
table

Source SS df MS F p-value

Treatment 9,515,793,950.21 1 9,515,793,950.208 251.54 4.96E-31


Error 4,463,949,041.72 118 37,830,076.625
Total 13,979,742,991.93 119

21
Comparison of Groups
100,000.0

90,000.0

80,000.0

70,000.0

60,000.0

50,000.0

40,000.0
inside outside

p-value<α=0.05 => bá c bỏ H0
Vớ i độ tin cậ y 95% có đủ bằ ng chứ ng thố ng kê để bác bỏ giả thuyế t H0, như vậ y có sự khá c nhau giữ a thu
nhậ p củ a nhâ n viên bá n hà ng tạ i doanh nghiệp (inside) và nhâ n viê n bá n hà ng tạ i thự c địa (outside).
6. Kiểm định giả thuyết.
n=40>30 => Trung bình mẫ u xấ p xỉ phâ n phố i normal
H0: µ1=µ2=µ3, Thu nhậ p do số nă m kinh nghiệm là như nhau.
H1: Có sự khá c nhau về thu nhậ p do số nă m kinh nghiệm.

One factor ANOVA

Mean n Std. Dev


59,819.6 40 6,005.06 low
68,618.1 40 13,621.38 medium
66,338.7 40 9,699.51 high
64,925.5 120 10,838.67 Total

ANOVA

22
table

Source SS df MS F p-value
Treatment 1,668,100,099.40 2 834,050,049.700 7.93 .0006
Error 12,311,642,892.53 117 105,227,717.030
Total 13,979,742,991.93 119

p-value=0.0006 < α=0.05 => bá c bỏ H0 => Vớ i độ tin cậ y 95% có đủ bằ ng chứ ng


thố ng kê để bá c bỏ giả thuyết H0, như vậ y có sự khá c nhau về thu nhậ p do số nă m
kinh nghiệm.
Phâ n tích sâ u ANOVA:

Post hoc analysis


p-values for pairwise t-
tests
low high medium
59,819.6 66,338.7 68,618.1
low 59,819.6
high 66,338.7 .0053
medium 68,618.1 .0002 .3224
Tukey simultaneous comparison t-values (d.f. = 117)
low high medium
59,819.6 66,338.7 68,618.1
low 59,819.6
high 66,338.7 2.84
medium 68,618.1 3.84 0.99

critical values for experimentwise error rate:


0.05 2.38
0.01 2.97

23
p-valuelow-high=0.0053 < α=0.05 => Có sự khá c nhau về thu nhậ p giữ a ngườ i có
kinh nghiệm thấ p và ngườ i có kinh nghiệm cao.
p-valuelow-medium=0.0002 <α => Có sự khá c nhau về thu nhậ p giữ a ngườ i có kinh
nghiệm thấ p và ngườ i có kinh nghiệm trung bình.
7. Kiểm định giả thuyết.
H0:
- Thu nhậ p do vị trí cô ng tá c là như nhau.
- Thu nhậ p do số nă m kinh nghiệm là như nhau.
- Khô ng có ả nh hưở ng tương tá c giữ a vị trí cô ng tá c và số nă m kinh nghiệm.
H1:
- Có sự khá c nhau về thu nhậ p do vị trí cô ng tá c.
- Có sự khá c nhau về thu nhậ p do số nă m kinh nghiệm.
- Có sự ả nh hưở ng tương tá c giữ a vị trí cô ng tá c và số nă m kinh nghiệm.

Two factor ANOVA


Factor 2
Means:
low medium high
inside 55,031.4 55,607.8 57,422.5 56,020.5
Factor 1 outside 64,607.9 81,628.5 75,254.9 73,830.4
59,819.6 68,618.1 66,338.7 64,925.5
replications per
20
cell
ANOVA
table
p-
Source SS df MS F
value
5.32E-
Factor 1 9,515,793,950.21 1 9,515,793,950.208 751.36
52
Factor 2 1,668,100,099.40 2 834,050,049.700 65.86 9.76E-

24
20
4.37E-
Interaction 1,352,066,184.47 2 676,033,092.233 53.38
17
Error 1,443,782,757.85 114 12,664,761.034
Total 13,979,742,991.93 119

p-value<α=0.05 => bá c bỏ H0
 Vớ i độ tin cậ y 95%, có đủ bằ ng chứ ng thố ng kê để bá c bỏ giả thuyế t H0
như vậ y
- Có sự khá c nhau về thu nhậ p do vị trí cô ng tá c.
- Có sự khá c nhau về thu nhậ p do số nă m kinh nghiệm.
- Có sự ả nh hưở ng tương tá c giữ a vị trí cô ng tá c và số nă m kinh nghiệm.

25
Tình huống 5:
Chi tiêu qua thẻ tín dụng của người tiêu dùng
(Chapter 15, Consumer)

1.Thống kê mô tả.

Amount
Income Household Charged
($1000s) Size ($)
count 50 50 50 Số quan sá t
mean 43.48 3.42 3,964.06 Giá trị trung bình
sample standard
14.55 1.74 933.49 Độ lệch chuẩ n
deviation
sample variance 211.72 3.02 871,411.20 Phương sai mẫ u
minimum 21 1 1864
maximum 67 7 5678
range 46 6 3814 Khoả ng biến thiên
1st quartile 30.25 2.00 3,130.50 Tứ phâ n vị thứ nhấ t
Trung vị (Tứ phâ n vị
median 42.00 3.00 4,090.00
thứ 2)
3rd quartile 54.75 4.75 4,732.75 Tứ phâ n vị thứ 3
interquartile range 24.50 2.75 1,602.25 Độ trả i giữ a
mode 54.00 2.00 3,890.00

Nhậ n xét:
n=50>30 => Theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối
normal.
2. Xây dựng phương trình hồi qui mẫu.
* Thu nhậ p là m biến độ c lậ p.
Lậ p bả ng tính

26
i x(i) y(i) xi- 𝒙̅ yi - 𝒚̅ (xi-𝒙̅ )(yi- 𝒚̅ ( xi- 𝒙̅ )^2 ( yi- 𝒚̅ )^2 ( 𝒀̂i- 𝒚̅ ) ^2
)
1 54 4,016 10.52 51.940 546.409 110.670 2,697.764 181348.223
2 30 3,159 -13.48 -805.060 10852.209 181.710 648,121.604 297755.749
3 32 5,100 -11.48 1,135.940 -13040.591 131.790 1,290,359.684 215955.384
4 50 4,742 6.52 777.940 5072.169 42.510 605,190.644 69659.045
-
5 31 1,864 -12.48 26208.749 155.750 4,410,252.004 255216.936
2,100.060
6 55 4,070 11.52 105.940 1220.429 132.710 11,223.284 217463.669
-
7 37 2,731 -6.48 7990.229 41.990 1,520,436.964 68806.536
1,233.060
8 40 3,348 -3.48 -616.060 2143.889 12.110 379,529.924 19844.357
9 66 4,764 22.52 799.940 18014.649 507.150 639,904.004 831032.792
10 51 4,110 7.52 145.940 1097.469 56.550 21,298.484 92665.448
11 25 4,208 -18.48 243.940 -4508.011 341.510 59,506.724 559608.725
12 48 4,219 4.52 254.940 1152.329 20.430 64,994.404 33478.021
-
13 27 2,477 -16.48 24506.749 271.590 2,211,347.444 445035.752
1,487.060
-
14 33 2,514 -10.48 15196.629 109.830 2,102,674.004 179971.093
1,450.060
15 65 4,214 21.52 249.940 5378.709 463.110 62,470.004 758867.477
16 63 4,965 19.52 1,000.940 19538.349 381.030 1,001,880.884 624368.629
17 42 4,412 -1.48 447.940 -662.951 2.190 200,650.244 3589.208
-
18 21 2,448 -22.48 34081.029 505.350 2,298,437.924 828081.800
1,516.060
19 44 2,995 0.52 -969.060 -503.911 0.270 939,077.284 443.102
20 37 4,171 -6.48 206.940 -1340.971 41.990 42,824.164 68806.536
21 62 5,678 18.52 1,713.940 31742.169 342.990 2,937,590.324 562035.096
22 21 3,623 -22.48 -341.060 7667.029 505.350 116,321.924 828081.800
23 55 5,301 11.52 1,336.940 15401.549 132.710 1,787,408.564 217463.669

27
24 42 3,020 -1.48 -944.060 1397.209 2.190 891,249.284 3589.208
25 41 4,828 -2.48 863.940 -2142.571 6.150 746,392.324 10078.152
26 54 5,573 10.52 1,608.940 16926.049 110.670 2,588,687.924 181348.223
-
27 30 2,583 -13.48 18616.689 181.710 1,907,326.724 297755.749
1,381.060
28 48 3,866 4.52 -98.060 -443.231 20.430 9,615.764 33478.021
29 34 3,586 -9.48 -378.060 3584.009 89.870 142,929.364 147264.063
30 67 5,037 23.52 1,072.940 25235.549 553.190 1,151,200.244 906475.368
31 50 3,605 6.52 -359.060 -2341.071 42.510 128,924.084 69659.045
32 67 5,345 23.52 1,380.940 32479.709 553.190 1,906,995.284 906475.368
33 55 5,370 11.52 1,405.940 16196.429 132.710 1,976,667.284 217463.669
34 52 3,890 8.52 -74.060 -630.991 72.590 5,484.884 118949.112
35 62 4,705 18.52 740.940 13722.209 342.990 548,992.084 562035.096
36 64 4,157 20.52 192.940 3959.129 421.070 37,225.844 689979.422
37 22 3,579 -21.48 -385.060 8271.089 461.390 148,271.204 756047.640
38 29 3,890 -14.48 -74.060 1072.389 209.670 5,484.884 343571.823
39 39 2,972 -4.48 -992.060 4444.429 20.070 984,183.044 32887.823
40 35 3,121 -8.48 -843.060 7149.149 71.910 710,750.164 117834.293
41 39 4,183 -4.48 218.940 -980.851 20.070 47,934.724 32887.823
42 54 3,730 10.52 -234.060 -2462.311 110.670 54,784.084 181348.223
43 23 4,127 -20.48 162.940 -3337.011 419.430 26,549.444 687290.741
-
44 27 2,921 -16.48 17189.629 271.590 1,087,974.164 445035.752
1,043.060
45 26 4,603 -17.48 638.940 -11168.671 305.550 408,244.324 500683.608
46 61 4,273 17.52 308.940 5412.629 306.950 95,443.924 502978.824
47 30 3,067 -13.48 -897.060 12092.369 181.710 804,716.644 297755.749
48 22 3,074 -21.48 -890.060 19118.489 461.390 792,206.804 756047.640
49 46 4,820 2.52 855.940 2156.969 6.350 732,633.284 10406.040
50 66 5,149 22.52 1,184.940 26684.849 507.150 1,404,082.804 831032.792
tổ ng 2174 198,203 0 0 419956.560 10374.480 42699148.820 16999938.312

28
TS(b1) MS(b1) SST SSR

𝑥̅ = (∑xi)/n = 2174/50 = 43.48


𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06

Phương trình hồ i qui mẫ u: 𝑌̂ = b0 + b1*x


b1= TS(b1)/MS(b1) = 419956.560/10374.480 = 40.480
b0 = 𝑦̅ - b1*𝑥̅ = 3964.06 - 40.480*43.48 = 2203.990

PTHQ mẫ u: 𝑌̂ = 2203.990 + 40.480*x


SSR = 16,999,938.312
SST = 42,699,148.820
SSE = SST-SSR= 25,699,210.508
R^2 = SSR/SST = 16,999,938.312/ 42,699,148.820 = 0.398 => Khoả ng 39.8%
số tiền chi tiêu bằ ng thẻ tín dụ ng phụ thuộ c và o thu nhậ p.

Regression Analysis

r 0.398 n 50
² 0.631 k 1
r 731.713 Dep. Var. y(i)
Std. Error

ANOVA
table

Source SS df MS F p-value

Regression 16,999,744.7860 1 16,999,744.7860 31.75 9.01E-07

Residual 25,699,404.0340 48 535,404.2507

Total 42,699,148.8200 49

29
Regression output confidence interval
std.
variables coefficients t (df=48) p-value 95% lower 95% upper
error
Intercept 2,203.9996 329.0489 6.698 2.14E-08 1,542.4024 2,865.5968
x(i) 40.4798 7.1839 5.635 9.01E-07 26.0357 54.9239

PTHQ tổ ng thể: Y = β0 + β1*X


Giả thuyết: H0: β1=0
H1: β1≠0
Chỉ tiêu kiểm định tstat = b1/S(b1) = 5.635
t(α/2) = t(0.025;48) = 2.0106. Ta thấ y tstat >t(α/2) => β1≠0
* Quy mô hộ gia đình là m biến độ c lậ p
Lậ p bả ng tính

(xi- 𝒙̅ )(yi-
i x(i) y(i) xi- 𝒙̅ yi - 𝒚̅ ( xi- 𝒙̅ )^2 ( yi- 𝒚̅ )^2 ( 𝒀̂I - 𝒚̅ )^2
𝒚̅ )
1 3 4,016 -0.42 51.940 -21.8148 0.176 2,697.7636 28809.6308
2 2 3,159 -1.42 -805.060 1143.1852 2.016 648,121.6036 329317.5950
3 4 5,100 0.58 1,135.940 658.8452 0.336 1,290,359.6836 54940.5472
4 5 4,742 1.58 777.940 1229.1452 2.496 605,190.6436 407710.3445
5 2 1,864 -1.42 -2,100.060 2982.0852 2.016 4,410,252.0036 329317.5950
6 2 4,070 -1.42 105.940 -150.4348 2.016 11,223.2836 329317.5950
7 1 2,731 -2.42 -1,233.060 2984.0052 5.856 1,520,436.9636 956464.4401
8 2 3,348 -1.42 -616.060 874.8052 2.016 379,529.9236 329317.5950
9 4 4,764 0.58 799.940 463.9652 0.336 639,904.0036 54940.5472
10 3 4,110 -0.42 145.940 -61.2948 0.176 21,298.4836 28809.6308
11 3 4,208 -0.42 243.940 -102.4548 0.176 59,506.7236 28809.6308
12 4 4,219 0.58 254.940 147.8652 0.336 64,994.4036 54940.5472
13 1 2,477 -2.42 -1,487.060 3598.6852 5.856 2,211,347.4436 956464.4401
14 2 2,514 -1.42 -1,450.060 2059.0852 2.016 2,102,674.0036 329317.5950

30
15 3 4,214 -0.42 249.940 -104.9748 0.176 62,470.0036 28809.6308
16 4 4,965 0.58 1,000.940 580.5452 0.336 1,001,880.8836 54940.5472
17 6 4,412 2.58 447.940 1155.6852 6.656 200,650.2436 1087119.0225
18 2 2,448 -1.42 -1,516.060 2152.8052 2.016 2,298,437.9236 329317.5950
19 1 2,995 -2.42 -969.060 2345.1252 5.856 939,077.2836 956464.4401
20 5 4,171 1.58 206.940 326.9652 2.496 42,824.1636 407710.3445
21 6 5,678 2.58 1,713.940 4421.9652 6.656 2,937,590.3236 1087119.0225
22 3 3,623 -0.42 -341.060 143.2452 0.176 116,321.9236 28809.6308
23 7 5,301 3.58 1,336.940 4786.2452 12.82 1,787,408.5636 2093166.5813
24 2 3,020 -1.42 -944.060 1340.5652 2.016 891,249.2836 329317.5950
25 7 4,828 3.58 863.940 3092.9052 12.82 746,392.3236 2093166.5813
26 6 5,573 2.58 1,608.940 4151.0652 6.656 2,588,687.9236 1087119.0225
27 1 2,583 -2.42 -1,381.060 3342.1652 5.856 1,907,326.7236 956464.4401
28 2 3,866 -1.42 -98.060 139.2452 2.016 9,615.7636 329317.5950
29 5 3,586 1.58 -378.060 -597.3348 2.496 142,929.3636 407710.3445
30 4 5,037 0.58 1,072.940 622.3052 0.336 1,151,200.2436 54940.5472
31 2 3,605 -1.42 -359.060 509.8652 2.016 128,924.0836 329317.5950
32 5 5,345 1.58 1,380.940 2181.8852 2.496 1,906,995.2836 407710.3445
33 6 5,370 2.58 1,405.940 3627.3252 6.656 1,976,667.2836 1087119.0225
34 2 3,890 -1.42 -74.060 105.1652 2.016 5,484.8836 329317.5950
35 3 4,705 -0.42 740.940 -311.1948 0.176 548,992.0836 28809.6308
36 2 4,157 -1.42 192.940 -273.9748 2.016 37,225.8436 329317.5950
37 3 3,579 -0.42 -385.060 161.7252 0.176 148,271.2036 28809.6308
38 4 3,890 0.58 -74.060 -42.9548 0.336 5,484.8836 54940.5472
39 2 2,972 -1.42 -992.060 1408.7252 2.016 984,183.0436 329317.5950
40 1 3,121 -2.42 -843.060 2040.2052 5.856 710,750.1636 956464.4401
41 4 4,183 0.58 218.940 126.9852 0.336 47,934.7236 54940.5472
42 3 3,730 -0.42 -234.060 98.3052 0.176 54,784.0836 28809.6308
43 6 4,127 2.58 162.940 420.3852 6.656 26,549.4436 1087119.0225
44 2 2,921 -1.42 -1,043.060 1481.1452 2.016 1,087,974.1636 329317.5950

31
45 7 4,603 3.58 638.940 2287.4052 12.82 408,244.3236 2093166.5813
46 2 4,273 -1.42 308.940 -438.6948 2.016 95,443.9236 329317.5950
47 2 3,067 -1.42 -897.060 1273.8252 2.016 804,716.6436 329317.5950
48 4 3,074 0.58 -890.060 -516.2348 0.336 792,206.8036 54940.5472
49 5 4,820 1.58 855.940 1352.3852 2.496 732,633.2836 407710.3445
50 4 5,149 0.58 1,184.940 687.2652 0.336 1,404,082.8036 54940.5472
tổ ng 171 198,203 0 0 59,884 148 42,699,149 24,200,675
TS(b1) MS(b1) SST SSR

𝑥̅ = (∑xi)/n = 171/50 = 3.42


𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06
Phương trình hồ i qui mẫ u: 𝑌̂ = b0 + b1*x
b1 = TS(b1)/MS(b1) = 59,884/148 = 404.128
b0 =𝑦̅ - b1*𝑥̅ = 3964.06 - 404.128*3.42 = 2581.942
Vậ y PTHQ mẫ u là : 𝑌̂ = 2581.942 + 404.128*x

SSR = 24,200,675
SST = 42,699,149
SSE = SST-SSR = 18,498,474
R^2 = SSR/SST = 24,200,675/42,699,149 = 0.567 => khoả ng 56.7% số tiền
chi tiêu bằ ng thẻ tín dụ ng phụ thuộ c và o quy mô gia đình.

Regression Analysis

r² 0.567 n 50
r 0.753 k 1
Std. Error 620.793 Dep. Var. y(i)

ANOVA table

Source SS df MS F p-value
Regression 1 24,200,717.4814 62.80 2.86E-10

32
24,200,717.4814

Residual 18,498,431.3386 48 385,383.9862

Total 42,699,148.8200 49

Regression output confidence interval

std.
variables coefficients error t (df=48) p-value 95% lower 95% upper
Intercept 2,581.9410 195.2626 13.223 1.28E-17 2,189.3393 2,974.5427
x(i) 404.1284 50.9979 7.924 2.86E-10 301.5903 506.6664

PTHQ tổ ng thể: Y=β0 + β1*X


Giả thuyết H0: β1=0
H1: β1≠0
Chỉ tiêu kiểm định tstat = b1/S(b1) =7.924
t(α/2) = t(0.025;48) = 2.0106
Ta thấ y tstat >t(α/2) => β1≠0.
Vậ y ta thấ y biến quy mô gia đình có khả nă ng dự bá o chi tiêu qua thẻ tín dụ ng tố t
hơn biến thu nhậ p.
3. Xây dựng phương trình hồi quy bội.

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.908603921
R Square 0.825561086
Adjusted R
Square 0.818138154

Standard Error 398.0910071


Observations 50

33
ANOVA

Significance
df SS MS F
F

1.50876E-
Regression 2 3.5E+07 17625377.84 111.217647
18
Residual 47 7448393 158476.4499
Total 49 4.3E+07

Standard Lower Upper


Coefficients t Stat P-value
Error 95% 95%
3.287E-
Intercept 1304.9048 197.6548 6.6019 907.2745 1702.5350
08
Income (X1) 7.682E-
33.1330 3.9679 8.3503 25.1506 41.1154
($1000s) 11
Household (X2) 3.123E-
356.2959 33.2009 10.7315 289.5043 423.0875
Size 14

Phương trình hồ i qui mẫ u: 𝑌̂ i = b0 + b1*X1i + b2*X2i

Từ bả ng ta có : b0=1,304.9048
b1=33.1330
b2=356.2959
Vậ y PTHQ mẫ u là : 𝑌̂ i = 1,304.9048 + 33.1330*X1 +356.2959*X2
Hệ số xá c định bộ i R2= 0.8256 => Kết quả nà y cho biết 82.56% biến thiên trong
tiền chi tiêu qua thẻ tín dụ ng có thể đượ c giả i thích bở i mố i liên hệ tuyến tính giữ a tiền
chi tiêu qua thẻ tín dụ ng vớ i thu nhậ p và quy mô gia đình, nhưng tầ m quan trọ ng khô ng
ngang nhau.
Hệ số xá c định hiệu chỉnh R2(adj)=0.8181 => Cho biết 81.81% biến thiên trong
tiền chi tiêu qua thẻ tín dụ ng có thể đượ c giả i thích bở i mô hình hồ i qui bộ i mà ta đã xâ y
dự ng.

34
Sai số chuẩ n củ a ướ c lượ ng Sy/x=398.0910
SSR=35,250,755.67
SSE=7,448,393.148
SST=42,699,148.82
Đặ t giả thuyết: H0: β1=β2=0
H1: β1≠0 hoặ c β2≠0
Chọ n α=0.05, n=50, k=2 => D1=k=2; D2=n-k-1=50-2-1=47

Tra bả ng F(D1,D2,α)=F(2;47;0.05) = 3.195


Ftt = 111.2176 >Fα => bá c bỏ H0.
Vậ y mô hình hồ i qui bộ i vớ i cá c biến độ c lậ p là thu nhậ p và quy mô gia đình có thể
giả i thích mộ t cá ch có ý nghĩa cho biến thiên trong tiền chi tiêu qua thẻ tín dụ ng.
4. Dự báo
Vớ i gia đình có 3 ngườ i và thu nhậ p nă m là 40 000$ thì số tiền chi tiêu qua thẻ tín
dụ ng là :
Y = 1,304.9048 + 33.1330*40,000 + 356.2959*3 = 1,327,693.793 ($)
5. Thông tin thêm
Trên thự c tế thì tiền chi tiêu qua thẻ tín dụ ng khô ng chỉ chịu ả nh hưở ng củ a 2 yếu tố
trên mà cò n chịu ả nh hưở ng củ a nhiều yếu tố khá c nữ a, ví dụ như: tuổ i, trình độ họ c
vấ n,số thà nh viên có thu nhậ p, tiết kiệm...

Nên đưa thêm và o mô hình biến tuổ i, số thà nh viên có thu nhậ p. Vì nhữ ng biến nà y có
thể dễ dà ng điều tra.

35
TÀI LIỆU THAM KHẢO

1. Hoà ng Trọ ng, Chu Nguyễn Mộ ng Ngọ c, Thốngkê ứng dụng trong kinh tế - xã hội,
NXB Lao Độ ng – Xã Hộ i, 2008.

2. Nguyễn Cao Vă n và Trầ n Thá i Minh, Giáo trình Lý thuyết xác suất và thống kê toán,
NXB, Thố ng kê, 2005.

3. Trầ n Vă n Thắ ng và cá c tá c giả , Giáo trình Lý thuyết thống kê, NXB Thố ng Kê, 1998.

36

You might also like