Professional Documents
Culture Documents
Tiểu luận Thống kê ứng dụng HUST
Tiểu luận Thống kê ứng dụng HUST
1
MỤC LỤC
Tình huống 1:
1. Tó m tắ t dữ liệu bằ ng đồ thị và bằ ng tham số thố ng kê mô tả......................................................................................... 3
1.1 Đố i vớ i thờ i gian truy cậ p website cô ng ty........................................................................................................................... 3
1.2 Đố i vớ i số trang đã đọ c................................................................................................................................................................. 4
1.3 Đố i vớ i số tiền chi tiêu bình quâ n mộ t giao dịch................................................................................................................ 6
2. Tó m tắ t tầ n số số tiền đã chi tiêu và số tiền chi tiêu bình quâ n mộ t giao dịch theo từ ng ngày thứ trong tuầ n. 8
3. Tó m tắ t tầ n số số tiền đã chi tiêu và số tiền chi tiêu bình quâ n mộ t giao dịch theo loại trình duyệt web đã sử dụng
8
4. Sự liên hệ giữ a thờ i gian truy cậ p website và số tiền đã chi tiêu................................................................................... 8
4.1 Biểu đồ thể hiện mố i liên hệ gian thờ i gian truy cậ p website và số tiền chi tiêu .
......................................................................................................................................................................................................................... 9
5. Mố i liên hệ giữ a số trang đã xem trên website và số tiền đã chi tiêu........................................................................... 9
5.1 Biểu đồ thể hiện mố i liên hệ giữ a số trang đã xem trên website và số tiền chi mua hà ng...............................10
6. Sự liên hệ giữ a thờ i gian truy cậ p website vớ i số trang đã xem.................................................................................... 10
6.1 Biểu đồ thể hiện sự liên hệ giữ a thờ i gian truy cậ p website và số trang đã xem .................................................. 10
Tình huống 2: Công ty sản xuất đồ chơi trẻ em Specialty Toys.........................................................................11
1. Đồ thị phâ n phố i................................................................................................................................................................................ 12
2. Xá c suấ t hết hà ng đố i vớ i cá c phương á n đặ t hà ng đượ c đề ra....................................................................................... 12
3. Lợ i nhuậ n kì vọ ng............................................................................................................................................................................. 13
3.1 Giả định bá n đượ c 10000 sả n phẩ m....................................................................................................................................... 13
3.2 Giả định bá n đượ c 20000 sả n phẩ m....................................................................................................................................... 13
3.3 Giả định bá n đượ c 30000 sả n phẩ m....................................................................................................................................... 13
4. Lợ i nhuậ n dự kiến............................................................................................................................................................................. 14
5. Khuyến nghị........................................................................................................................................................................................ 15
Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto).........................16
1.Phâ n tích thô ng kê mô tả .................................................................................................................................................................. 16
Ướ c lượ ng trung bình khoả ng.......................................................................................................................................................... 17
Thả o luậ n hà m ý..................................................................................................................................................................................... 17
Xá c định cỡ mẫ u..................................................................................................................................................................................... 18
Thô ng tin thêm........................................................................................................................................................................................ 18
Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary)..................................................19
1. Phâ n tích thố ng kê mô tả ................................................................................................................................................................ 19
2. Ướ c lượ ng khoả ng trung bình..................................................................................................................................................... 19
3. Ướ c lượ ng khoả ng trung bình củ a cá c nhâ n viên bá n hà ng tạ i doanh nghiệp.........................................................20
4. Ướ c lượ ng khoả ng trung bình củ a cá c nhâ n viên bá n hà ng tạ i thự c địa....................................................................20
5. Kiểm định giả thuyết........................................................................................................................................................................ 21
6. Kiểm định giả thuyết........................................................................................................................................................................ 22
7. Kiểm định giả thuyết........................................................................................................................................................................ 24
Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer)............................26
1. Thống kê mô tả..................................................................................................................................................................................... 26
2. Xâ y dự ng phương trình hồ i qui mẫ u......................................................................................................................................... 26
3. Xâ y dự ng phương trình hồ i quy bộ i.......................................................................................................................................... 33
4. Dự bá o.................................................................................................................................................................................................... 35
5. Thô ng tin thêm................................................................................................................................................................................... 35
TÀI LIỆU THAM KHẢO....................................................................................................................................................................... 36
Tình huống 1:
2
Công ty sô-cô-la Heavenly Chocolates (Chapter 3, Shopper)
Bài làm
1. Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả
1.1 Đối với thời gian truy cập website công ty
Cumulative
Bin Frequency
%
4-10 17 34.00%
10-16 22 78.00%
16-22 6 90.00%
22-28 3 96.00%
28-34 2 100.00%
More 0 100.00%
25
Histogram
20 120.00%
100.00% Frequency
15
80.00% Cumulative %
10
60.00%
5 40.00%
0 20.00%
Frequency
0.00%
3
Descriptive statistics
Time (min)
Count 50
Mean 12.810
sample standard deviation 6.063
sample variance 36.764
minimum 4.3
maximum 32.9
Range 28.6
Sum 640.500
sum of squares 10,006.230
deviation sum of squares (SSX) 1,801.425
standard error of the mean 0.857
skewness 1.450
kurtosis 2.404
coefficient of variation (CV) 47.33%
1st quartile 8.650
Median 11.400
3rd quartile 14.900
interquartile range 6.250
Mode 11.400
low extremes 0
low outliers 0
high outliers 4
high extremes 0
Nhận xét: Thờ i gian truy cậ p website củ a khá ch hà ng chủ yếu dướ i 16 phú t, chiếm tớ i
78%
1.2 Đối với số trang đã đọc
4
Bin Frequency Cumulative %
2-4 25 50.00%
4-6 15 80.00%
6-8 7 94.00%
8-10 3 100.00%
More 0 100.00%
Histogram
30
150.00%
Frequency
20 100.00%
10 50.00% Frequency
00.00% Cumulative %
2-44-66-88-10 More
Bin
Descriptive statistics
Pages Viewed
count 50
mean 4.82
sample standard deviation 2.04
sample variance 4.15
minimum 2
maximum 10
range 8
sum 241.00
sum of squares 1,365.00
deviation sum of squares (SSX) 203.38
standard error of the mean 0.29
skewness 0.65
5
kurtosis 0.17
Nhận xét: Số lượ ng trang mà khá ch hà ng đã xem là khá khiêm tố n, chủ yếu là từ 2 đến 6 trang, chiếm 80%.
1.3 Đối với số tiền chi tiêu bình quân một giao dịch
Descriptive statistics
Amount Spent ($)
6
count 50
mean 68.1282
sample standard deviation 32.3438
sample variance 1,046.1187
minimum 17.84
maximum 158.51
range 140.67
sum 3,406.4100
sum of squares 283,332.3967
deviation sum of squares
51,259.8149
(SSX)
standard error of the mean 4.5741
skewness 1.0490
kurtosis 0.8765
coefficient of variation (CV) 47.47%
1st quartile 45.5600
median 62.1500
3rd quartile 82.7350
interquartile range 37.1750
mode #N/A
low extremes 0
low outliers 0
high outliers 2
high extremes 0
7
Nhận xét: Khá ch hà ng chi tiêu chủ yếu ở mứ c dướ i 75$, chiếm 72.55% tổ ng lượ ng tiền đã chi tiêu cho
mua hà ng online.
2. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo từng ngày
thứ trong tuần
Thứ Số giao dịch Tổng số tiền($) Tần số(%) Số tiền bình quân($)
Mon 9 813.38 25.88 90.38
Tue 7 414.86 13.20 59.27
Wed 6 341.82 10.87 56.97
Thu 5 294.03 9.35 58.81
Fri 11 682.24 21.71 62.02
Sat 7 378.74 12.05 54.11
Sun 5 218.15 6.94 43.63
Tổ ng 50 3143.22 100.00
Nhận xét:
Qua bả ng số liệu trên, ta thấ y lượ ng khá ch mua hà ng và o cá c ngà y thứ 2 và thứ 6 là khá lớ n, kéo theo số
tiền đã chi tiêu cũ ng lớ n. Trong khi đó , cá c ngà y chủ nhậ t và thứ 5, số lầ n giao dịch ít hơn, vì vậ y lượ ng
tiền chi tiêu ít hơn nhữ ng ngà y khá c.
3. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo loại trình
duyệt web đã sử dụng
Số giao
Loại trình duyệt Tổng số tiền($) Tần số(%) Số tiền bình quân($)
dịch
Internet Explorer 27 1656.81 48.64 61.36
Firefox 16 1228.21 36.05 76.76
Other 7 521.39 15.31 74.48
Tổ ng 50 3406.41 100.00
Nhận xét:
Khá ch hà ng chủ yếu sử dụ ng trình duyệt Internet Explorer để truy cậ p website, do đó số
tiền khá ch hà ng đã chi tiêu cho mua hà ng online ở trình duyệt web nà y lớ n hơn cá c trình
duyệt cò n lạ i. Tuy nhiên số tiền chi bình quâ n cho mỗ i giao dịch lạ i thấ p hơn Firefox và cá c
trình duyệt web khá c.
4. Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu
8
Amount Spent($)
180.0
0 y = 3.0942x +
160.0
0 28.492
140.0 r² = 0.3365
Amount Spent
0
120.0 ($)
0 Linear
(Amount
100.0 Spent ($))
080.00
60.00
40.00
20.00
0.00
0.0 10.020.0 30.0 40.0
Times(min)
4.1 Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi
tiêu
Hệ số tương quan mẫ u r = 0.580048
Nhận xét: Giữ a thờ i gian truy cậ p website và số tiền chi tiêu có mố i liên hệ tương quan
tuyến tính thuậ n chiều, thờ i gian truy cậ p website cà ng nhiều thì số tiền chi tiêu cà ng
cao.
5. Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu
180.00
y = 11.489x + 12.752
Amount Spent($)
160.0
r² =
0
0.5237
140.0 Amount
0 Spent
120.0 ($)
0 Linear
(Amount
100.0
Spent ($))
0
80.00
60.00
40.00 051015
20.00 Pages Viewed
0.00
9
5.1 Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và số tiền chi
mua hàng
Hệ số tương quan r = 0.7236
Nhận xét: Thô ng qua đồ thị tá n xạ và hệ số tương quan r = 0.7236, ta nhậ n thấ y có mộ t
mố i liên hệ tương quan tuyến tính mạ nh giữ a số trang đã xem trên website và số tiền
chi mua hà ng, tứ c là số lượ ng trang củ a website đượ c xem cà ng nhiều thì số lượ ng tiền
khá ch hà ng đã chi tiêu để mua hà ng củ a cô ng ty cà ng lớ n.
6. Sự liên hệ giữa thời gian truy cập website với số trang đã xem
35.0
30.0
Times( min)
25.0
Time (min)
20.0
15.0 Linear (Time (min))
10.0
y = 1.7725x + 4.2666
5.0 r² = 0.3547
0.0
0 5 10 15
Pages Viewed
6.1 Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang đã xem
Hệ số tương quan mẫ u r = 0.5956
Nhận xét:
Qua đồ thị tá n xạ và hệ số tương quan tuyến tính mẫ u r, ta thấ y có 1 mố i liên hệ tuyến
tính thuậ n chiều giữ a thờ i gian truy cậ p website và số trang đã xem, khá ch hà ng xem
cà ng nhiều trang thì thờ i gian truy cậ p website cà ng nhiều.
10
Tình huống 2:
Công ty sản xuất đồ chơi trẻ em Specialty Toys
Bài làm
1. Đồ thị phân phối
Vớ i doanh số kỳ vọ ng là : 𝜇𝑜 = 200000 sả n phẩ m Từ
giả thiết ta có :
1 – α = 0.95 => α =0.05 =>Zα/2 = 1.96
Mặ t khá c, nhu cầ u 10000 <= 𝜇<= 30000.
Đồ thị phâ n phố i nhu cầ u mua hà ng
2 Xbar=40000
{
=> 2 Z
α / 2.σxbar =20000
=> {Xbar=20000
σxbar=5120
11
=> Vậ y giá trị TB và độ lệch chuẩ n củ a phâ n phố i lầ n lượ t là : Xbar=20000;σxbar =5120
2. Xác suất hết hàng đối với các phương án đặt hàng được đề ra
Phương án 1 : 15000 sả n phẩ m
P( X>= 15000) = P ( 𝑋− 𝜇 𝑂 >= 15000− 𝜇 𝑂
) = P( Z >= -0.98)
𝜎xbar 𝜎xbar
= P(Z> 0) + P( -0.98 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.98)
= 0.5 + 0.3365
=0.8365
Vậy xác suất hết hàng đối với trường hợp đặt 15000 sản phẩm là 0.8365.
Phương án 2 : 18000 sả n phẩ m
P( X>= 18000) = P ( 𝑋− 𝜇 𝑂 >= 18000− 𝜇 𝑂
) = P( Z >= -0.39)
𝜎xbar 𝜎xbar
= P(Z> 0) + P( -0.392 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.39)
= 0.5 + 0.1517
= 0.6517
Vậy với phương án đặt mua 18000 sản phẩm, xác xuất bán hết hàng là 0.6517
Phương án 3 : 24000 sả n phẩ m
P( X>= 24000) = P ( 𝑋− 𝜇 𝑂 >= 24000− 𝜇 𝑂
) = P( Z >= 0.78)
𝜎xbar 𝜎xbar
= P(Z> 0) - P( 0 <Z <= 0.78)
= 0.5 – 0.2823
= 0.2177
Xác suất bán hết 24000 sản phẩm là 0.2177
Phương án 4 : 28000 sả n phẩ m
P( X>= 28000) = P ( 𝑋− 𝜇 𝑂 >= 28000− 𝜇 𝑂
) = P( Z >= 1.57)
𝜎xbar 𝜎xbar
= P(Z> 0) - P( 0 <Z <= 1.57)
= 0.5 – 0.4418
= 0.0582
Xác suất bán hết 28000 sản phẩm là 0.0582
12
3. Lơi nhuận kì vọng
3.1. Giả định bán được 10000 sản phẩm
Tổ ng tiền
Mua Tổ ng tiền Tổ ng tiền Lợ i nhuậ n
đầ u tư mua
(sả nphẩ m) bá n đượ c giá bá n đượ c ($)
sả n phẩ m
24$ ($) giá 5$($)
giá 16$ ($)
13
(-8000+144000+144000).P(X>18000)=182476($)
24000 sả n phẩ m là
(-74000+192000+116000).P(X>240000)=51480($)
30000 sả n phẩ m là
(-118000+72000+224000).P(X>28000)=10324($)
4. Lợi nhuận dự kiến
Gọ i số lượ ng hà ng cầ n đặ t mua là S( sả n phẩ m ). Vì lượ ng hà ng cầ n đặ t phả i đá p ứ ng 70% nhu cầ u ngườ i
mua và chỉ nên 30% hết hà ng.
Tương tự phầ n tính xá c suấ t hết hà ng, ta có :
P(X>=S) = 0.3
=> P ¿
Vớ i S >𝜇𝑜 = 20000 => Z’ > 0.
=> P ( Z>= Z’) = P( Z>0) – P( 0< Z<= Z’) =0.3
=> 0.5 - P( 0< Z<= Z’) = 0.3
=> P( 0< Z<= Z’) = 0.2
=> Z’ = 0.0793
S−μ O
=> =0.0793 => S = 20404.5886
σxbar
Hay lượng hàng ta cần đặt mua là 20404 sản phẩm.
Lợ i nhuậ n dự kiến thu đượ c là :
Vậy lợi nhuận dự kiến theo 3 phương án lần lượt là: 215265;165265; 115265.
14
5. Khuyến nghị
Trướ c khi đặ t hà ng ta cầ n tính toá n kỹ xem mứ c tổ n thấ t hay lợ i nhuậ n nhậ n dượ c là
bao nhiêu để có thể đưa ra con số gâ y ít tổ n thấ t nhấ t.
Nên đặ t mua số lượ ng là 18000 sả n phẩ m. Dự bá o lợ i nhuậ n là 182476($)
Vì P(X>18000)=0,652
Lợ i nhuậ n kì vọ ng là lớ n nhấ t trong 4 trườ ng hợ p đặ t mua hà ng là 182476($)
15
Tình huống 3:
Công ty nghiên cứu thị trường Metropolitan Research
(Chapter 8, Auto)
1) Phân tích thông kê mô tả
Column1 Column2
Descriptive statistics
Miles
Count 50
Mean 73,340.30
sample variance 619,946,014.05
sample standard
24,898.72
deviation
Minimum 25066
Maximum 138114
Range 113048
Sum 3,667,015.00
sum of squares 299,317,334,893.00
deviation sum of squares
30,377,354,688.50
(SSX)
Skewness 0.26
Kurtosis 0.17
coefficient of variation
33.95%
(CV)
16
Trung bình mẫ u: mean = 73 340.30
Cỡ mẫ u: n = 50
Phương sai: S^2 = 619 946 014.05
Độ lệch chuẩ n: s = 24 898.72
Tổ ng = 3 667 015
Trung vị: Me = 72 705
Biểu đồ hộ p và râ u:
BoxPlot
17
Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phâ n phố i lệch phả i.
Độ trả i giữ a R0 = 86 575 – 60 421 = 26 154 => mứ c độ phâ n tá n củ a dữ liệu khá
lớ n
Trung vị nằ m giữ a 2 tứ phâ n vị cho thấ y phâ n phố i khá đều.
Vậ y cho nên chưa có đủ că n cứ để tin rằ ng mộ t số ngườ i mua xe hơi đã bị hỏ ng bộ
truyền độ ng sớ m.
4) Xác định cỡ mẫu
Vớ i e=5000; s = 24898.72; Zα/2= 1.96 thì cầ n lấ y cỡ mẫ u tố i thiểu là :
N = (Zα/2*s)2/e2 = (1.96*24898.72)2/50002 = 95.263
Vậ y lấ y cỡ mẫ u tố i thiểu là 96 chiếc xe.
5) Thông tin thêm
Để đá nh giá vấ n đề lỗ i bộ truyền độ ng mộ t cá ch đầ y đủ hơn thì cầ n có thêm thô ng tin về:
Tiêu chuẩ n số dặ m mà mộ t chiếc xe bình thườ ng lá i đượ c đến khi bị lỗ i bộ truyền
độ ng mà cô ng ty đặ t ra.
Lấ y cỡ mẫ u lớ n hơn để có dữ liệu vớ i độ sai lệch ít hơn.
18
Tình huống 4:
Thu nhập của nhân viên bán hàng
(Chapter 13, SalesSalary)
1. Phân tích thống kê mô tả.
Descriptive statistics
Salary ($)
count 120 Số quan sá t
mean 64,925.48 Giá trị trung bình
sample standard deviation 10,838.67 Độ lệch chuẩ n s
sample variance 117,476,831.86 Phương sai mẫ u
minimum 48621
maximum 88730
range 40109 khoả ng biến thiên
1st quartile 56,274.25 Tứ phâ n vị thứ nhấ t
Trung vị (Tứ phâ n vị thứ
median 61,489.50
2)
3rd quartile 76,092.25 Tứ phâ n vị thứ 3
interquartile range 19,818.00 Độ trả i giữ a
mode 53,464.00
19
Vớ i độ tin cậ y 95%, thu nhậ p trung bình nă m củ a tất cả nhữ ng ngườ i bá n hàng đượ c ướ c lượ ng trong
khoả ng 62,986.23 đế n 66,864.72
3. Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp
Ướ c lượ ng khoả ng tin cậ y 95% củ a thu nhậ p trung bình nă m củ a cá c nhâ n viên bá n
hà ng tạ i doanh nghiệp (inside).
n=60>30 =>theo định lý giớ i hạ n trung tâ m, trung bình mẫ u sẽ xấ p xỉ phâ n phố i
normal.
inside
count 60
confidence interval 95.% lower 55,112.18
confidence interval 95.% upper 56,928.85
margin of error 908.33
z 1.96
Vớ i độ tin cậ y 95%, thu nhậ p trung bình nă m củ a các nhâ n viên bá n hà ng tạ i doanh nghiệp (inside) đượ c
ướ c lượ ng trong khoả ng 55,112.18 đến 56,928.85
4. Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa
Ướ c lượ ng khoả ng tin cậ y 95% củ a thu nhậ p trung bình nă m củ a cá c nhâ n viên bá n
hà ng tạ i thự c địa (outside).
n=60>30 =>theo định lý giớ i hạ n trung tâ m, trung bình mẫ u sẽ xấ p xỉ phâ n phố i
normal.
outside
count 60
confidence interval 95.% lower 71,825.68
confidence interval 95.% upper 75,835.18
margin of error 2,004.75
z 1.96
20
Vớ i độ tin cậ y 95%, thu nhậ p trung bình nă m củ a các nhâ n viên bá n hà ng tạ i thự c địa (outside) đượ c ướ c
lượ ng trong khoả ng 71,825.68 đến 75,835.18
5. Kiểm định giả thuyết.
H0: µ1=µ2, thu nhậ p do vị trí cô ng tá c là như nhau.
H1: µ1≠µ2, có sự khá c nhau về thu nhậ p do vị trí cô ng tá c.
ANOVA
table
Source SS df MS F p-value
21
Comparison of Groups
100,000.0
90,000.0
80,000.0
70,000.0
60,000.0
50,000.0
40,000.0
inside outside
p-value<α=0.05 => bá c bỏ H0
Vớ i độ tin cậ y 95% có đủ bằ ng chứ ng thố ng kê để bác bỏ giả thuyế t H0, như vậ y có sự khá c nhau giữ a thu
nhậ p củ a nhâ n viên bá n hà ng tạ i doanh nghiệp (inside) và nhâ n viê n bá n hà ng tạ i thự c địa (outside).
6. Kiểm định giả thuyết.
n=40>30 => Trung bình mẫ u xấ p xỉ phâ n phố i normal
H0: µ1=µ2=µ3, Thu nhậ p do số nă m kinh nghiệm là như nhau.
H1: Có sự khá c nhau về thu nhậ p do số nă m kinh nghiệm.
ANOVA
22
table
Source SS df MS F p-value
Treatment 1,668,100,099.40 2 834,050,049.700 7.93 .0006
Error 12,311,642,892.53 117 105,227,717.030
Total 13,979,742,991.93 119
23
p-valuelow-high=0.0053 < α=0.05 => Có sự khá c nhau về thu nhậ p giữ a ngườ i có
kinh nghiệm thấ p và ngườ i có kinh nghiệm cao.
p-valuelow-medium=0.0002 <α => Có sự khá c nhau về thu nhậ p giữ a ngườ i có kinh
nghiệm thấ p và ngườ i có kinh nghiệm trung bình.
7. Kiểm định giả thuyết.
H0:
- Thu nhậ p do vị trí cô ng tá c là như nhau.
- Thu nhậ p do số nă m kinh nghiệm là như nhau.
- Khô ng có ả nh hưở ng tương tá c giữ a vị trí cô ng tá c và số nă m kinh nghiệm.
H1:
- Có sự khá c nhau về thu nhậ p do vị trí cô ng tá c.
- Có sự khá c nhau về thu nhậ p do số nă m kinh nghiệm.
- Có sự ả nh hưở ng tương tá c giữ a vị trí cô ng tá c và số nă m kinh nghiệm.
24
20
4.37E-
Interaction 1,352,066,184.47 2 676,033,092.233 53.38
17
Error 1,443,782,757.85 114 12,664,761.034
Total 13,979,742,991.93 119
p-value<α=0.05 => bá c bỏ H0
Vớ i độ tin cậ y 95%, có đủ bằ ng chứ ng thố ng kê để bá c bỏ giả thuyế t H0
như vậ y
- Có sự khá c nhau về thu nhậ p do vị trí cô ng tá c.
- Có sự khá c nhau về thu nhậ p do số nă m kinh nghiệm.
- Có sự ả nh hưở ng tương tá c giữ a vị trí cô ng tá c và số nă m kinh nghiệm.
25
Tình huống 5:
Chi tiêu qua thẻ tín dụng của người tiêu dùng
(Chapter 15, Consumer)
1.Thống kê mô tả.
Amount
Income Household Charged
($1000s) Size ($)
count 50 50 50 Số quan sá t
mean 43.48 3.42 3,964.06 Giá trị trung bình
sample standard
14.55 1.74 933.49 Độ lệch chuẩ n
deviation
sample variance 211.72 3.02 871,411.20 Phương sai mẫ u
minimum 21 1 1864
maximum 67 7 5678
range 46 6 3814 Khoả ng biến thiên
1st quartile 30.25 2.00 3,130.50 Tứ phâ n vị thứ nhấ t
Trung vị (Tứ phâ n vị
median 42.00 3.00 4,090.00
thứ 2)
3rd quartile 54.75 4.75 4,732.75 Tứ phâ n vị thứ 3
interquartile range 24.50 2.75 1,602.25 Độ trả i giữ a
mode 54.00 2.00 3,890.00
Nhậ n xét:
n=50>30 => Theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối
normal.
2. Xây dựng phương trình hồi qui mẫu.
* Thu nhậ p là m biến độ c lậ p.
Lậ p bả ng tính
26
i x(i) y(i) xi- 𝒙̅ yi - 𝒚̅ (xi-𝒙̅ )(yi- 𝒚̅ ( xi- 𝒙̅ )^2 ( yi- 𝒚̅ )^2 ( 𝒀̂i- 𝒚̅ ) ^2
)
1 54 4,016 10.52 51.940 546.409 110.670 2,697.764 181348.223
2 30 3,159 -13.48 -805.060 10852.209 181.710 648,121.604 297755.749
3 32 5,100 -11.48 1,135.940 -13040.591 131.790 1,290,359.684 215955.384
4 50 4,742 6.52 777.940 5072.169 42.510 605,190.644 69659.045
-
5 31 1,864 -12.48 26208.749 155.750 4,410,252.004 255216.936
2,100.060
6 55 4,070 11.52 105.940 1220.429 132.710 11,223.284 217463.669
-
7 37 2,731 -6.48 7990.229 41.990 1,520,436.964 68806.536
1,233.060
8 40 3,348 -3.48 -616.060 2143.889 12.110 379,529.924 19844.357
9 66 4,764 22.52 799.940 18014.649 507.150 639,904.004 831032.792
10 51 4,110 7.52 145.940 1097.469 56.550 21,298.484 92665.448
11 25 4,208 -18.48 243.940 -4508.011 341.510 59,506.724 559608.725
12 48 4,219 4.52 254.940 1152.329 20.430 64,994.404 33478.021
-
13 27 2,477 -16.48 24506.749 271.590 2,211,347.444 445035.752
1,487.060
-
14 33 2,514 -10.48 15196.629 109.830 2,102,674.004 179971.093
1,450.060
15 65 4,214 21.52 249.940 5378.709 463.110 62,470.004 758867.477
16 63 4,965 19.52 1,000.940 19538.349 381.030 1,001,880.884 624368.629
17 42 4,412 -1.48 447.940 -662.951 2.190 200,650.244 3589.208
-
18 21 2,448 -22.48 34081.029 505.350 2,298,437.924 828081.800
1,516.060
19 44 2,995 0.52 -969.060 -503.911 0.270 939,077.284 443.102
20 37 4,171 -6.48 206.940 -1340.971 41.990 42,824.164 68806.536
21 62 5,678 18.52 1,713.940 31742.169 342.990 2,937,590.324 562035.096
22 21 3,623 -22.48 -341.060 7667.029 505.350 116,321.924 828081.800
23 55 5,301 11.52 1,336.940 15401.549 132.710 1,787,408.564 217463.669
27
24 42 3,020 -1.48 -944.060 1397.209 2.190 891,249.284 3589.208
25 41 4,828 -2.48 863.940 -2142.571 6.150 746,392.324 10078.152
26 54 5,573 10.52 1,608.940 16926.049 110.670 2,588,687.924 181348.223
-
27 30 2,583 -13.48 18616.689 181.710 1,907,326.724 297755.749
1,381.060
28 48 3,866 4.52 -98.060 -443.231 20.430 9,615.764 33478.021
29 34 3,586 -9.48 -378.060 3584.009 89.870 142,929.364 147264.063
30 67 5,037 23.52 1,072.940 25235.549 553.190 1,151,200.244 906475.368
31 50 3,605 6.52 -359.060 -2341.071 42.510 128,924.084 69659.045
32 67 5,345 23.52 1,380.940 32479.709 553.190 1,906,995.284 906475.368
33 55 5,370 11.52 1,405.940 16196.429 132.710 1,976,667.284 217463.669
34 52 3,890 8.52 -74.060 -630.991 72.590 5,484.884 118949.112
35 62 4,705 18.52 740.940 13722.209 342.990 548,992.084 562035.096
36 64 4,157 20.52 192.940 3959.129 421.070 37,225.844 689979.422
37 22 3,579 -21.48 -385.060 8271.089 461.390 148,271.204 756047.640
38 29 3,890 -14.48 -74.060 1072.389 209.670 5,484.884 343571.823
39 39 2,972 -4.48 -992.060 4444.429 20.070 984,183.044 32887.823
40 35 3,121 -8.48 -843.060 7149.149 71.910 710,750.164 117834.293
41 39 4,183 -4.48 218.940 -980.851 20.070 47,934.724 32887.823
42 54 3,730 10.52 -234.060 -2462.311 110.670 54,784.084 181348.223
43 23 4,127 -20.48 162.940 -3337.011 419.430 26,549.444 687290.741
-
44 27 2,921 -16.48 17189.629 271.590 1,087,974.164 445035.752
1,043.060
45 26 4,603 -17.48 638.940 -11168.671 305.550 408,244.324 500683.608
46 61 4,273 17.52 308.940 5412.629 306.950 95,443.924 502978.824
47 30 3,067 -13.48 -897.060 12092.369 181.710 804,716.644 297755.749
48 22 3,074 -21.48 -890.060 19118.489 461.390 792,206.804 756047.640
49 46 4,820 2.52 855.940 2156.969 6.350 732,633.284 10406.040
50 66 5,149 22.52 1,184.940 26684.849 507.150 1,404,082.804 831032.792
tổ ng 2174 198,203 0 0 419956.560 10374.480 42699148.820 16999938.312
28
TS(b1) MS(b1) SST SSR
Regression Analysis
r 0.398 n 50
² 0.631 k 1
r 731.713 Dep. Var. y(i)
Std. Error
ANOVA
table
Source SS df MS F p-value
Total 42,699,148.8200 49
29
Regression output confidence interval
std.
variables coefficients t (df=48) p-value 95% lower 95% upper
error
Intercept 2,203.9996 329.0489 6.698 2.14E-08 1,542.4024 2,865.5968
x(i) 40.4798 7.1839 5.635 9.01E-07 26.0357 54.9239
(xi- 𝒙̅ )(yi-
i x(i) y(i) xi- 𝒙̅ yi - 𝒚̅ ( xi- 𝒙̅ )^2 ( yi- 𝒚̅ )^2 ( 𝒀̂I - 𝒚̅ )^2
𝒚̅ )
1 3 4,016 -0.42 51.940 -21.8148 0.176 2,697.7636 28809.6308
2 2 3,159 -1.42 -805.060 1143.1852 2.016 648,121.6036 329317.5950
3 4 5,100 0.58 1,135.940 658.8452 0.336 1,290,359.6836 54940.5472
4 5 4,742 1.58 777.940 1229.1452 2.496 605,190.6436 407710.3445
5 2 1,864 -1.42 -2,100.060 2982.0852 2.016 4,410,252.0036 329317.5950
6 2 4,070 -1.42 105.940 -150.4348 2.016 11,223.2836 329317.5950
7 1 2,731 -2.42 -1,233.060 2984.0052 5.856 1,520,436.9636 956464.4401
8 2 3,348 -1.42 -616.060 874.8052 2.016 379,529.9236 329317.5950
9 4 4,764 0.58 799.940 463.9652 0.336 639,904.0036 54940.5472
10 3 4,110 -0.42 145.940 -61.2948 0.176 21,298.4836 28809.6308
11 3 4,208 -0.42 243.940 -102.4548 0.176 59,506.7236 28809.6308
12 4 4,219 0.58 254.940 147.8652 0.336 64,994.4036 54940.5472
13 1 2,477 -2.42 -1,487.060 3598.6852 5.856 2,211,347.4436 956464.4401
14 2 2,514 -1.42 -1,450.060 2059.0852 2.016 2,102,674.0036 329317.5950
30
15 3 4,214 -0.42 249.940 -104.9748 0.176 62,470.0036 28809.6308
16 4 4,965 0.58 1,000.940 580.5452 0.336 1,001,880.8836 54940.5472
17 6 4,412 2.58 447.940 1155.6852 6.656 200,650.2436 1087119.0225
18 2 2,448 -1.42 -1,516.060 2152.8052 2.016 2,298,437.9236 329317.5950
19 1 2,995 -2.42 -969.060 2345.1252 5.856 939,077.2836 956464.4401
20 5 4,171 1.58 206.940 326.9652 2.496 42,824.1636 407710.3445
21 6 5,678 2.58 1,713.940 4421.9652 6.656 2,937,590.3236 1087119.0225
22 3 3,623 -0.42 -341.060 143.2452 0.176 116,321.9236 28809.6308
23 7 5,301 3.58 1,336.940 4786.2452 12.82 1,787,408.5636 2093166.5813
24 2 3,020 -1.42 -944.060 1340.5652 2.016 891,249.2836 329317.5950
25 7 4,828 3.58 863.940 3092.9052 12.82 746,392.3236 2093166.5813
26 6 5,573 2.58 1,608.940 4151.0652 6.656 2,588,687.9236 1087119.0225
27 1 2,583 -2.42 -1,381.060 3342.1652 5.856 1,907,326.7236 956464.4401
28 2 3,866 -1.42 -98.060 139.2452 2.016 9,615.7636 329317.5950
29 5 3,586 1.58 -378.060 -597.3348 2.496 142,929.3636 407710.3445
30 4 5,037 0.58 1,072.940 622.3052 0.336 1,151,200.2436 54940.5472
31 2 3,605 -1.42 -359.060 509.8652 2.016 128,924.0836 329317.5950
32 5 5,345 1.58 1,380.940 2181.8852 2.496 1,906,995.2836 407710.3445
33 6 5,370 2.58 1,405.940 3627.3252 6.656 1,976,667.2836 1087119.0225
34 2 3,890 -1.42 -74.060 105.1652 2.016 5,484.8836 329317.5950
35 3 4,705 -0.42 740.940 -311.1948 0.176 548,992.0836 28809.6308
36 2 4,157 -1.42 192.940 -273.9748 2.016 37,225.8436 329317.5950
37 3 3,579 -0.42 -385.060 161.7252 0.176 148,271.2036 28809.6308
38 4 3,890 0.58 -74.060 -42.9548 0.336 5,484.8836 54940.5472
39 2 2,972 -1.42 -992.060 1408.7252 2.016 984,183.0436 329317.5950
40 1 3,121 -2.42 -843.060 2040.2052 5.856 710,750.1636 956464.4401
41 4 4,183 0.58 218.940 126.9852 0.336 47,934.7236 54940.5472
42 3 3,730 -0.42 -234.060 98.3052 0.176 54,784.0836 28809.6308
43 6 4,127 2.58 162.940 420.3852 6.656 26,549.4436 1087119.0225
44 2 2,921 -1.42 -1,043.060 1481.1452 2.016 1,087,974.1636 329317.5950
31
45 7 4,603 3.58 638.940 2287.4052 12.82 408,244.3236 2093166.5813
46 2 4,273 -1.42 308.940 -438.6948 2.016 95,443.9236 329317.5950
47 2 3,067 -1.42 -897.060 1273.8252 2.016 804,716.6436 329317.5950
48 4 3,074 0.58 -890.060 -516.2348 0.336 792,206.8036 54940.5472
49 5 4,820 1.58 855.940 1352.3852 2.496 732,633.2836 407710.3445
50 4 5,149 0.58 1,184.940 687.2652 0.336 1,404,082.8036 54940.5472
tổ ng 171 198,203 0 0 59,884 148 42,699,149 24,200,675
TS(b1) MS(b1) SST SSR
SSR = 24,200,675
SST = 42,699,149
SSE = SST-SSR = 18,498,474
R^2 = SSR/SST = 24,200,675/42,699,149 = 0.567 => khoả ng 56.7% số tiền
chi tiêu bằ ng thẻ tín dụ ng phụ thuộ c và o quy mô gia đình.
Regression Analysis
r² 0.567 n 50
r 0.753 k 1
Std. Error 620.793 Dep. Var. y(i)
ANOVA table
Source SS df MS F p-value
Regression 1 24,200,717.4814 62.80 2.86E-10
32
24,200,717.4814
Total 42,699,148.8200 49
std.
variables coefficients error t (df=48) p-value 95% lower 95% upper
Intercept 2,581.9410 195.2626 13.223 1.28E-17 2,189.3393 2,974.5427
x(i) 404.1284 50.9979 7.924 2.86E-10 301.5903 506.6664
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.908603921
R Square 0.825561086
Adjusted R
Square 0.818138154
33
ANOVA
Significance
df SS MS F
F
1.50876E-
Regression 2 3.5E+07 17625377.84 111.217647
18
Residual 47 7448393 158476.4499
Total 49 4.3E+07
Từ bả ng ta có : b0=1,304.9048
b1=33.1330
b2=356.2959
Vậ y PTHQ mẫ u là : 𝑌̂ i = 1,304.9048 + 33.1330*X1 +356.2959*X2
Hệ số xá c định bộ i R2= 0.8256 => Kết quả nà y cho biết 82.56% biến thiên trong
tiền chi tiêu qua thẻ tín dụ ng có thể đượ c giả i thích bở i mố i liên hệ tuyến tính giữ a tiền
chi tiêu qua thẻ tín dụ ng vớ i thu nhậ p và quy mô gia đình, nhưng tầ m quan trọ ng khô ng
ngang nhau.
Hệ số xá c định hiệu chỉnh R2(adj)=0.8181 => Cho biết 81.81% biến thiên trong
tiền chi tiêu qua thẻ tín dụ ng có thể đượ c giả i thích bở i mô hình hồ i qui bộ i mà ta đã xâ y
dự ng.
34
Sai số chuẩ n củ a ướ c lượ ng Sy/x=398.0910
SSR=35,250,755.67
SSE=7,448,393.148
SST=42,699,148.82
Đặ t giả thuyết: H0: β1=β2=0
H1: β1≠0 hoặ c β2≠0
Chọ n α=0.05, n=50, k=2 => D1=k=2; D2=n-k-1=50-2-1=47
Nên đưa thêm và o mô hình biến tuổ i, số thà nh viên có thu nhậ p. Vì nhữ ng biến nà y có
thể dễ dà ng điều tra.
35
TÀI LIỆU THAM KHẢO
1. Hoà ng Trọ ng, Chu Nguyễn Mộ ng Ngọ c, Thốngkê ứng dụng trong kinh tế - xã hội,
NXB Lao Độ ng – Xã Hộ i, 2008.
2. Nguyễn Cao Vă n và Trầ n Thá i Minh, Giáo trình Lý thuyết xác suất và thống kê toán,
NXB, Thố ng kê, 2005.
3. Trầ n Vă n Thắ ng và cá c tá c giả , Giáo trình Lý thuyết thống kê, NXB Thố ng Kê, 1998.
36