Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 22

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI


----

BÀI THẢO LUẬN

MÔN: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

Nhóm thực hiện: Nhóm 1

LỚP: 23105AMAT0111
LỚP HỌC: CN19-ECO.DB

NĂM HỌC 2022-2023


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
----

BÀI THẢO LUẬN

MÔN XÁC SUẤT VÀ THỐNG KÊ TOÁN


Nhóm sinh viên thực hiện
22K610001: Nguyễn Mỹ An
22K610003: Đặng Châu Anh
22K610009: Đặng Châu Anh
22K610015: Đinh Phương Anh
22K610002: Hoàng Lê Phương Anh
22K610016: Kim Mai Anh
22K610007: Nguyễn Hoàng Châu Anh
22K610006: Nguyễn Kiều Anh
22K610013: Nguyễn Minh Anh
22K610005: Nguyễn Thế Anh
22K610008: Nguyễn Tiến Anh
22K610011:Nguyễn Trung Thế Anh
22K610014: Phùng Tuấn Anh
22K610010: Tạ Minh Anh
22K610004: Trần Phan Bảo Anh
NĂM HỌC 2022-2023
MỤC LỤC

I. Mở đầu ……………………………………………………………………
II. Phương pháp nghiên cứu……………………………………………………..
1. Lý thuyết về bài toán ước lượng và kiểm định giả thuyết về kỳ vọng toán
của
ĐLNN…………………………………………………………………………
1.1 Ước lượng kỳ vọng toán của ĐLNN…………………………………….
1.2 Kiểm định giả thuyết về tham số của ĐLNN……………………
1.2.1 Kiểm định giả thuyết về Kỳ vọng toán của ĐLNN………………
1.2.2 Kiểm định giả thuyết về Tỷ lệ của đám đông………………………
III. Kết quả nghiên cứu ………………………………………………………….
1. Bài toán ước lượng và kiểm định ……………………………………………
1.1 2 Bài toán ước lượng …………………………………………………..
1.2 2 Bài toán định lượng…………………………………………………..
2. Mô tả số liệu…………………………………………………………..
3. Giải quyết bài toán…………………………………………………
III.1 Bài toán ước
lượng…………………………………………………………..
III.2 Bài toán kiểm
định…………………………………………………………….
I. MỞ ĐẦU:
Giờ là thời đại công nghệ 5.0, các nền tảng mạng xã hội càng được biết đến
và đa dạng hơn. Về độ tuổi cho thấy giới trẻ có tần suất sử dụng mạng xã hội
cao nhất.
Điển hình là độ tuổi của sinh viên. Từ khi xảy ra tình hình dịch Covid diễn
ra phức tạp, căng thẳng ở nước ta, nhu cầu nghiên cứu, giải trí và thời gian
sử dụng mạng xã hội của sinh viên từ đó cũng tăng lên. Thông qua bài khảo
sát dưới đây của việc sử dụng mạng xã hội của sinh viên hiện nay.
Từ những lí do nêu trên, nhóm em đã tập trung nghiên cứu việc sử dụng
mạng xã hội đối với đối tượng nghiên cứu là sinh viên CN19-ECO.DB thuộc
đại học Thương Mại.
II. PHƯƠNG PHÁP NGHIÊN CỨU:
1. Lý thuyết về bài toán ước lượng và kiểm định giả thuyết về kỳ
vọng toán của ĐLNN:
1.1Ước lượng kỳ vọng toán của ĐLNN:
Bài toán: Xét ĐLNN X, có E(X)= μ, Var(X)= σ2; μ chưa biết.

Ta xét bài toán trong 3 trường hợp:

Trường hợp 1: X ~ N(μ,σ2), σ2 đã biết.

Trường hợp 2: Chưa biết QLPP của X, n > 30.

Trường hợp 3: X ~ N(μ,σ2), σ2 chưa biết, n<30.

1.1.1 Trường hợp 1: X ~ N(μ,σ2), σ2 đã biết.

B1: Vì X ~ N(μ; σ2) nên

B2: Đưa ra khoảng tin cậy.

• a. Khoảng tin cậy đối xứng (α1 = α2 = α/2).

Với độ tin cậy γ = 1- α ta tìm được phân vị uα/2 sao cho:

1
/2 1- /2
- u/2α=
0 u/2
Thay U, biến đổi tương đương:
γ

Đặt sai số của ước lượng:

Khoảng tin cậy đối xứng của μ: ( X −ε ; X +ε)

B3: Tính toán và kết luận

Với mẫu cụ thể ta có khoảng tin cậy cụ thể của μ:

• Chú ý:

1. BT cho khoảng tin cậy đối xứng là (a,b):

2. BT cho E(X)= µ, ước lượng trung bình mẫu

3. Từ công thức ta có 3 bài toán sau:

BT1: cho n, γ. Tìm ε.


ε √n α
BT2: cho n, ε. Tìm γ. uα /2 = ⇒ ⇒ γ =1−α
σ 2

2
BT3: cho ε, γ. Tìm n.

b. Khoảng tin cậy phải (α1 =0; α2 = α). ƯL µmin

Với độ tin cậy γ = 1- α ta tìm được phân vị uα sao cho:

1- α= 
γ
0 u
Khoảng tin cậy phải của μ là:

c. Khoảng tin cậy trái (α1 = α; α2 = 0). ƯL µmax

Với độ tin cậy γ = 1- α ta tìm được phân vị uα sao cho:

 1-
- u α=0 γ
Khoảng tin cậy trái của μ là:

1.1.2 Trường hợp 2: Chưa biết QLPP của X, n > 30

B1: Vì n > 30 nên

B2; B3 làm tương tự trường hợp 1.

• Chú ý: nếu σ chưa biết, vì n>30 nên ta lấy

3
1.1.3 Trường hợp 3: X ~ N(μ,σ2), σ2 chưa biết, n<30.

• B1: Vì X ~ N(μ; σ2)

B2: Đưa ra khoảng tin cậy

KTC Xác suất Khoảng tin cậy


Đối xứng ( X −ε ; X +ε)

Phải

Trái

a. Khoảng tin cậy đối xứng (α1 = α2 = α/2).

Với độ tin cậy γ = 1- α ta tìm được phân vị tα/2(n-1) sao cho:

/2 1- /2
- t/2(n-1)α=
0 γ t/2(n-1)
Trong đó:

Khoảng tin cậy đối xứng của µ là:

b. Khoảng tin cậy phải (α1 =0; α2 = α). ƯL µmin

Với độ tin cậy γ = 1- α ta tìm được phân vị tα(n-1) sao cho:

4
Khoảng tin cậy phải của μ là:

c. Khoảng tin cậy trái (α1 = α; α2 = 0). ƯL µmax

Với độ tin cậy γ = 1- α ta tìm được phân vị tα(n-1) sao cho:

Khoảng tin cậy trái của μ là:

1.2 Kiểm định giả thuyết về tham số của ĐLNN:


1.2.1 Kiểm định giả thuyết về Kỳ vọng toán của ĐLNN:

Bài toán: Xét ĐLNN X , có E(X) = μ, Var(X) = σ2; μ chưa biết.

Từ cơ sở nào đó người ta đặt giả thuyết H0: μ=μ0. Nghi ngờ GT trên với mức ý
nghĩa α ta kiểm định 1 trong 3 bài toán sau:

Ta xét các bài toán trong 3 trường hợp:


Trường hợp 1: X ~ N(μ,σ2), σ2 đã biết.
Trường hợp 2: Chưa biết QLPP của X, n > 30.
Trường hợp 3: X ~ N(μ,σ2), σ2 chưa biết, n<30.
1.2.1.1 Trường hợp 1: X ~ N(μ,σ2), σ2 đã biết.
B1: Xây dựng tiêu chuẩn kiểm định

Vì X ~ N(μ; σ2) nên

XDTCKĐ: . Nếu H0 đúng U ~ N(0; 1)

B2: Tìm miền bác bỏ.

5
a. Bài toán 1:¿ { H 0 :μ=μ0 ¿ ¿¿
/2 /2
- u/20 u/2
Với mức ý nghĩa a ta tìm được phân vị chuẩn uα/2:
P(|U|>uα /2 )=α


0 u
Với mức ý nghĩa a ta tìm được phân vị chuẩn uα:
P(U >u α )=α

c. Bài toán 3:¿ { H 0 :μ=μ0 ¿ ¿¿



- u 0
Với mức ý nghĩa a ta tìm được phân vị chuẩn uα:

6
B3: Với mẫu cụ thể, tính, kết luận theo Quy tắc kiểm định

• Với mẫu cụ thể tính

• Kết luận theo quy tắc kiểm định.


+ Nếu utn ϵ Wα : Bác bỏ H0, chấp nhận H1.
+ Nếu utn ɇ Wα : Chưa có cơ sở bác bỏ H0.

Bảng tóm tắt trường hợp 1: X ~ N(μ,σ2), σ2 đã biết

H H Xác Suất Miền bác bỏ


0 1
µ= Wα = {u : |u | >
µ≠µ P(ǀUǀ>u ) = α tn tn
µ 0 α/2
0 u }
α/2
µ>µ P(U>u ) = α Wα = {u : u > u }
0 α tn tn α
µ<µ P(U<-u ) = α Wα = {u : u < -u }
0 α tn tn α

1.2.1.2 Trường hợp 2: Chưa biết QLPP của X, n >30.


B1: Xây dựng tiêu chuẩn kiểm định

Vì n >30 nên

XDTCKĐ: . Nếu H0 đúng U N(0; 1)

B2, B3 tương tự trường hợp 1.


* Chú ý: Nếu σ chưa biết, vì n>30 nên ta lấy

1.2.1.3 Trường hợp 3: X ~ N(μ,σ2), σ2 chưa biết, n<30.


B1: Vì X ~ N(μ; σ2)

XDTCKĐ: . Nếu H0 đúng T ~ T(n-1).

7
B2: Tóm tắt trong bảng sau:
H H P(G ϵ Wα/H ) = α Miền bác bỏ
0 1 0
µ=µ (n-
0 (n-1) Wα = {t : |t | > t
µ≠µ P(ǀTǀ>t )=α tn tn α/2
0 α/2 1)
}

µ>µ (n-1) (n-1)


0 P(T>t )=α Wα = {t : t > t }
α tn tn α

µ<µ (n-1) (n-1)


0 P(T<-t )=α Wα = {t : t < - t }
α tn tn α

B3: Tính và kết luận theo Quy tắc kiểm định

• Với mẫu cụ thể tính

• Kết luận theo quy tắc kiểm định.


+ Nếu ttn ϵ Wα : Bác bỏ H0, chấp nhận H1.
+ Nếu ttn ɇ Wα : Chưa có cơ sở bác bỏ H0.

1.2.2 Kiểm định giả thuyết về tỷ lệ của đám đông:

Bài toán: Xét đám đông có tỷ lệ phần tử mang dấu hiệu A là p; p chưa biết.

Từ cơ sở nào đó người ta đặt giả thuyết H0: p=p0. Nghi ngờ GT trên với mức ý
nghĩa α ta kiểm định 1 trong 3 bài toán sau:

nA
f
B1: Chọn mẫu kích thước n khá lớn. Ta có tần suất mẫu n

pq
Vì n khá lớn nên f ≈ N p,
n
f − p0
U=


XDTCKĐ: p0 q0 . Nếu H0 đúng U ≈ N(0; 1)
n
8
B2: Tóm tắt trong bảng sau:

H0 H1 Xác suất Miền bác bỏ

p= Wα = {u : |u | >
p ≠ p0 P(ǀUǀ>uα/2) = α tn tn
p0
u }
α/2
Wα = {u : u >
p > p0 P(U>u ) = α tn tn
α u }
α
Wα = {u : u < -
p < p0 P(U<-u ) = α tn tn
α B3: Tính và kết luận
u }
α theo Quy tắc kiểm f
utn =


định

• Với mẫu cụ thể tính

• Kết luận theo quy tắc kiểm định.

+ Nếu utn ϵ Wα : Bác bỏ H0, chấp nhận H1.

+ Nếu utn ɇ Wα : Chưa có cơ sở bác bỏ H0.

III. KẾT QUẢ NGHIÊN CỨU:


1. Bài toán ước lượng và kiểm định:
1.1 2 bài toán ước lượng:
1.1.1 Bài toán 1:Với mức độ tin cậy 90%, hãy ước lượng số giờ sử
dụng mạng xã hội trung bình một ngày của sinh viên lớp CN19-
ECO.DB
Số giờ 1-2 2-3 3-4 4-5

Số sinh viên 12 47 6 35

9
1.1.2 Bài toán 2: Theo dõi 9 ngày sử dụng mạng xã hội của sinh viên lớp
CN19-ECO.DB thấy thời gian sử dụng trung bình một ngày là 12 giờ và
độ lệch tiêu chuẩn mẫu điều chỉnh về lượng thời gian sử dụng là 6 giờ.
Với độ tin cậy 90 % hãy ước lượng lượng thời gian trung bình tối đa
trong một ngày của sinh viên. Biết lượng thời gian trong một ngày là một
ĐLNN một phân phối theo quy luật chuẩn .

1.2 2 Bài toán kiểm định:


1.2.1 Bài toán 1: Theo khảo sát sinh viên lớp CN19-ECO.DB thì
17,6% sử dụng mạng xã hội Tiktok. Có ý kiến cho rằng tỉ trên
thấp hơn so với thực tế. Kiểm tra ngẫu nhiên 100 sinh viên thì
thấy có 75 sinh viên sử dụng Tiktok. Với mức ý nghĩa 5% hãy
kết luận xem ý kiến trên có xác đáng hay không?
1.2.2 Bài toán 2: Theo dõi thời gian cần thiết sinh viên sử dụng
mạng xã hội của 100 sinh viên được kết quả:
Số giờ 1-2 2-3 3-4 4-5

Số sinh viên 12 47 6 35

Với mức ý nghĩa 0,05 có thể nói rằng thời gian trung bình cần thiết sử dụng mạng xã hội là ít
hơn 3 giờ hay không?

2. Mô tả dữ liệu:
Để giải quyết bài tập này, nhóm em đã thực hiện khảo sát trên một mẫu gồm 100 sinh viên,
bao gồm các sinh viên lớp CN19-ECO.DB của trường Đại học Thương Mại. Sau khi điều tra
chúng tôi đã thu được kết quả như sau:

 Biểu đồ 1

10
Như vậy theo như kết quả điều tra, 100% ( tương đương 100 sinh viên) đều đang sử dụng
mạng xã hội.

 Biểu đồ 2

64,7% ( tương đương 65 sinh viên) sử dụng Facebook,

17,6% ( tương đương 17 sinh viên) sử dụng Instagram,

17,6% ( tương đương 17 sinh viên) sử dụng Tik Tok,

 Biểu đồ 3

11
64,7% ( tương đương 65 sinh viên) sử dụng mạng xã hội để giải trí,

11,8% ( tương đương 12 sinh viên) sử dụng mạng xã hội để cập nhật thông tin,

11,8% ( tương đương 12 sinh viên) sử dụng mạng xã hội để kết nối, liên lạc

11,7% còn lại ( tương đương 11 sinh viên) sử dụng mạng xã hội để học tập và chia sẻ tâm
sự

 Biểu đồ 4

11,8% ( tương đương 12 sinh viên) sử dụng mạng xã hội trung bình 1-2 tiếng/ngày

47,1% ( tương đương 47 sinh viên) sử dụng mạng xã hội trung bình 2-3 tiếng/ngày

5,8% còn lại ( tương đương 6 sinh viên ) sử dụng mạng xã hội trung bình 3-4 tiếng/ngày

35,3% ( tương đương 35 sinh viên) sử dụng mạng xã hội trung bình 4-5 tiếng/ngày

Từ đó ta lập được bảng khảo sát như sau:

Số giờ 1-2 2-3 3-4 4-5

12
Số sinh viên 12 47 6 35

 Biểu đồ 5

35,3% ( tương đương 35 sinh viên) lợi ích khi sử dụng mạng xã hội của sinh viên để giải
tỏa căng thẳng

23,5% ( tương đương 23 sinh viên) lợi ích khi sử dụng mạng xã hội của sinh viên để kết nối
với mọi người dễ dàng

17,6% ( tương đương 18 sinh viên) lợi ích khi sử dụng mạng xã hội của sinh viên để học
hỏi được nhiều kỹ năng

17,6% ( tương đương 18 sinh viên) lợi ích khi sử dụng mạng xã hội của sinh viên để thu
nhập tài liệu, thông tin

3. Giải quyết bài toán:


3.1 Bài toán ước lượng:
3.1.1 Bài toán 1:
=> n=200, =0.9, chưa biết quy luật phân phối của X. Ước lượng ?

=> Trường hợp 2 (chưa biết quy luật phân phối của X, n>30) của bài toán ước

lượng kì vọng toán của đại lượng ngẫu nhiên

Gọi X là số giờ sử dụng mạng xã hội một ngày của sinh viên lớp CN19-ECO.ĐB
X là số giờ sử dụng mạng xã hội TB một ngày của sinh viên lớp CN19-ECO.ĐB
trên mẫu
μlà số giờ sử dụng mạng xã hội TB một ngày của sinh viên lớp CN19-ECO.ĐB
trên đám đông

13
2
σ
n=100>30 =>> X ≈ N ( μ; )
n

X−μ

=>> U = σ N (0,1)
√n
Từ bảng số liệu và đề bài ta có:

[ ]
k
1 1, 5.12+2 , 5.47+3 , 5.6+4 ,5.35
x=
n
∑ ni . x i = ¿ 100
= 3,4
i=1

[∑ ]
k
1 2 2
s = ni . x i −n .(X ) = 1,182
'2
n−1 i=1

¿ ≫ s = √ s ' 2 = 1,0873
'

Ta có: σ ≈ s' = 1,0873

Với độ tin cậy 1-α = 0,9, tìm phân vị U α2 sao cho:

P (-U α2 < U <U α2 ) = 1-α

X−μ
P (- 2 < σ <U α2 ) = 1-α

√n
σ σ
 P ( X - U α2 . < μ< X +U α2 . ) = 1-α
√n √n

1 - α = 0,9 =>>α =0 , 1=>>U α2 = U 0 , 05 = 1,65

Kết luận: Với độ tin cậy 90%, số giờ sử dụng mạng xã hội trung bình 1 ngày
σ σ
của SV CN19.ECO là ( X - U α2 . < μ< X + U α2 . ) = (2,96 < μ< 3,32) hay
√n √n
(2,96 ; 3,32)

3.1.2 Bài toán 2:

=> n=9, x = 12, s, = 6, γ =0 ,9 chưa biết quy luật phân phối của X. Ước lượng ?

14
=> Trường hợp 3 (X ~ N(μ; σ2), σ2 chưa biết, n ¿ 30 của bài toán ước lượng kì vọng toán
của ĐLNN

Gọi X là số giờ sử dụng mạng xã hội một ngày của sinh viên lớp CN19-ECO.ĐB
X là số giờ sử dụng mạng xã hội trunng bình một ngày của sinh viên lớp CN19-ECO.ĐB
trên mẫu
μlà số giờ sử dụng mạng xã hội trung bình một ngày của sinh viên lớp CN19-ECO.ĐB
trên đám đông

Vì X ~ N(μ; σ2) XDTK: ~ T n−1

Với độ tin cậy γ = 0,9 ta tìm được phân vị tα/2(n-1) sao cho:

8
t 0 , 05 × 6
Và = = 3,72
√9

Khoảng tin cậy đối xứng của µ là: ( X −ε ; X +ε)


 μϵ 9−3 , 72; 9+ 3 ,72
 μϵ 5 , 28 ; 12 ,72
 Kết luận: Với độ tin cậy 90% có thể nói thời gian sử dụng mạng xã hội của sinh viên lớp
CN19-ECO.DB nằm trong khoảng 5 , 28 ; 12, 72
3.2 Bài toán kiểm định:
3.2.1 Bài toán 1:
n=100;α =0 , 05 ; chưa biết quy luật phân phối của X

Trường hợp 2, bài toán này thuộc bài toán tỷ lệ kiểm định giả thuyết về tỷ lệ của đám
đông

nA 75
p0=17 ,6 %=0,176; n=100; n A =75, f A= = = 0,75.
n 100

Cặp GTTK: { H 0 : p= p0=0,176


H 1 : p 0< p

15
Gọi p là tỷ lệ sinh viên sử dụng mạng xã hội Tiktok

f là tỷ lệ sinh viên sử dụng mạng xã hội Tiktok trên mẫu

f − p0
U=
XDTK:
√ p0 q0
n
Nếu H0 đúng U ≈ N(0;1)

+Miền bác bỏ: Wα = {u : u > u }


tn tn α

Wα = {u : u > u = 1,64


tn tn 0,05

f − p0
U= (0 , 75−0176)× √ 100


+ p0 q0 = = 15,07
√0,176 × 0,824
n

Nếu utnϵWα : Bác bỏ H0, chấp nhận H1

Kết luận: Với mức ý nghĩa 5% có thể nói rằng ý kiến trên là không đúng.

3.2.2 Bài toán 2:


n=100;α =0 , 05 ; chưa biết quy luật phân phối của X

Trường hợp 2, bài toán này thuộc bài toán tỷ lệ kiểm định giả thuyết về kỳ vọng toán của
ĐLNN

μ0=3; n=100; α =0.05 , chưa biết QLPP của X

Gọi X là số giờ sử dụng mạng xã hội một ngày của sinh viên lớp CN19-ECO.DB
X là số giờ sử dụng mạng xã hội trunng bình một ngày của sinh viên lớp CN19-ECO.DB
trên mẫu.
μ là số giờ sử dụng mạng xã hội trunng bình một ngày của sinh viên lớp CN19-ECO.DB
trên đám đông.

Với mức ý nghĩa α=0.05 ta kiểm định: { H 0 : μ=3


H 1 : μ< 3

Vì n = 49 > 30 nên

16
Nếu H 0 đúng có U N 0 ,1

Với mức ý nghĩa a ta tìm được phân vị chuẩn uα:

Từ bảng số liệu và đề bài ta có:

[∑ ]
k
1 1, 5.12+2 , 5.47+3 , 5.6+4 ,5.35
x= ni . x i = ¿ = 3,4
n i=1 100

[∑ ]
k
1
s
'2
= ni . x 2i −n .(X )2 = 1,182
n−1 i=1

¿ ≫ s = √ s ' 2 = 1,0873
'

Vì n=100 > 30 nên ta lấy σ ≈ s, = 1,0873

+ Miền bác bỏ

utn :u tn ←u0.05 =−1 ,65

x−μ0 3 , 4−3

utn = σ 1,0873 = 3,68 ¿ −uα = -1,65
√n √100
 Nếu utn ɇ Wα : Chưa có cơ sở bác bỏ H0.

Kết luận: Với mức ý nghĩa 5% ta không thể nói trung bình cần thiết sử dụng mạng xã hội là ít
hơn 3 giờ

17

You might also like