Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 29

Đề tài: Tai nạn xe hơi của Hoa Kỳ

Giới thiệu về đề tài:


Sự miêu tả
Đây là bộ dữ liệu về tai nạn xe hơi trên toàn quốc, bao gồm 49 tiểu bang của Hoa Kỳ. Dữ
liệu về sự cố được thu thập từ tháng 2 năm 2016 đến tháng 12 năm 2021, sử dụng nhiều
API cung cấp dữ liệu về sự cố (hoặc sự kiện) lưu lượng truy cập trực tuyến. Các API này
phát dữ liệu lưu lượng truy cập được thu thập bởi nhiều thực thể, chẳng hạn như bộ giao
thông vận tải của Hoa Kỳ và tiểu bang, cơ quan thực thi pháp luật, camera giao thông và
cảm biến giao thông trong mạng lưới đường bộ. Hiện tại, có khoảng 2,8 triệu hồ sơ tai
nạn trong bộ dữ liệu này.

Nội dung
Tập dữ liệu này đã được thu thập trong thời gian thực, sử dụng nhiều API lưu lượng truy
cập. Hiện tại, nó chứa dữ liệu tai nạn được thu thập từ tháng 2 năm 2016 đến tháng 12
năm 2021 cho Hoa Kỳ tiếp giáp.

Cảm hứng: Nghiên cứu chiều dài của phạm vi đường bị ảnh hưởng bởi vụ tai nạn có bị
ảnh hưởng bởi mức độ tai nạn xảy ra hay không? Và mức độ nghiêm trọng của các vụ tai
nạn có bị ảnh hưởng bởi các điều kiện thời tiết hay không?....

Giới thiệu về tập dữ liệu


Cột
1. ID: Mã hồ sơ tai nạn.
2. Severity – Mức độ nghiêm trọng (từ 1 đến 4, 1 biểu thị tác động ít nhất, 4 biểu thị
tác động nhiều nhất đến giao thông)
3. Start_Time – Thời gian bắt đầu xảy ra tai nạn theo múi giờ địa phương
4. End_Time – Thời gian kết thúc vụ tai nạn theo múi giờ địa phương. Thời gian kết
thúc ở đây là khi tác động của tai nạn đến lưu lượng giao thông.
5. Start_Lat: Vĩ độ trong tọa độ GPS của điểm bắt đầu
6. Start_Lng: Kinh độ trong tọa độ GPS của điểm bắt đầu.
7. End_Lat - Vĩ độ trong tọa độ GPS của điểm kết thúc
8. End_Lng- Kinh độ trong tọa độ GPS của điểm kết thúc
9. Distance.mi.: Chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn.
10. Description: mô tả về vụ tai nạn
11. Number: Hiển thị số đường trong mục Địa Chỉ
12. Street: hiển thị tên đường trong mục Địa Chỉ
13. Side: Phía của đường phố (Trái/Phải) trong trường Địa Chỉ
14. City: Tên phố
15. County: Tên quận
16. State: Hiển thị trạng thái
17. Zipcode: Mã bưu chính/ Mã vùng
18. Country: tên đất nước
19. Timezone: hiển thị múi giờ dựa trên vị trí xảy ra tai nạn (phía đông, trung tâm
v.v…)
20. Airport_Code: Trạm thời tiết dựa trên sân bay (là trạm gần nhất với nơi xảy ra tai
nạn)
21. Weather_Timestamp: Dấu thời gian của bản ghi quan sát thời tiết.
22. Temperature.F.: Nhiệt độ (tính bằng F)
23. Wind_Chill.F. : Gió lạnh (tính bằng F)
24. Humidity... Độ ẩm (tính bằng %)
25. Pressure.in.: Áp suất không khí
26. Visibility.mi.: Tầm nhìn (tính bằng dặm)
27. Wind_Direction: hướng gió
28. Wind_Speed.mph: tốc độ gió (dặm/giờ)
29. Precipitation.in: Lượng mưa (tính bằng inch)
30. Weather_Condition: Điều kiện thời tiết
31. Amenity: Sự hiện diện của “sự tiện nghi” ở một vị trí gần đó (false or true)
32. Bump: Sự hiện diện cho biết “có gờ giảm tốc hoặc gờ giảm tốc” ở vị trí gần đó
(false or true)
33. Crossing: Sự hiện diện “Có giao lộ” ở một vị trí gần đó (false or true)
34. Give_Way: Sự hiện diện “Có biển báo cho đi qua” ở một vị trí gần đó (true or
false)
35. Junction: Sự hiện diện “có đường giao nhau” ở vị trí gần đó (false or true)
36. No_Exit: Sự hiện diện “không có lối đi ra” ở vị trí gần đó (false or true)
37. Railway: Sự hiện diện của “tuyến đường sắt” ở một vị trí gần đó (false or true)
38. Roundabout: Sự hiện diện của “bùng binh” ở một vị trí gần đó (false or true)
39. Station: Sự hiện diện của “ga tàu” ở một vị trí gần đó (false or true)
40. Stop: Sự hiện diện của “ĐIỂM DỪNG/CẤM ĐI” ở một vị trí gần đó (false or true)
41. Traffic_Calming: Sự hiện diện của “giao thông lắng dịu” ở một vị trí gần đó (false
or true)
42. Traffic_Signal: Sự hiện diện của “tín hiệu giao thông” ở một vị trí gần đó(false or
true)
43. Turning_Loop: sự hiện diện của “vòng quay đầu” ở một vị trí gần đó (false or
true)
44. Sunrise_Sunset: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên mặt
trời mọc/mặt trời lặn.
45. Civil_Twilight: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên
chạng vạng dân dụng
46. Nautical_Twilight: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên
chạng vạng hàng hải buổi sáng
47. Astronomical_Twilight: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa
trên chạng vạng thiên văn

 
+ Dữ liệu định lượng:
Các cột thuộc Thang đo khoảng và Thang đo tỷ lệ
1. Start_Lat: Vĩ độ trong tọa độ GPS của điểm bắt đầu
2. Start_Lng: Kinh độ trong tọa độ GPS của điểm bắt đầu.
3. End_Lat - Vĩ độ trong tọa độ GPS của điểm kết thúc
4. End_Lng- Kinh độ trong tọa độ GPS của điểm kết thúc
5. Distance.mi.: Chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn (Dặm)
6. Temperature.F.: Nhiệt độ (tính bằng F)
7. Wind_Chill.F. : Gió lạnh (tính bằng F)
8. Humidity... Độ ẩm (tính bằng %)
9. Pressure.in.: Áp suất không khí
10. Visibility.mi.: Tầm nhìn (tính bằng dặm)
11. Wind_Speed.mph: tốc độ gió (dặm/giờ)
12. Precipitation.in: Lượng mưa (tính bằng inch)

+ Dữ liệu định tính:


Các cột thuộc Thang đo định danh:
1. Weather_Condition: Điều kiện thời tiết
2. Wind_Direction: hướng gió
3. Timezone: hiển thị múi giờ dựa trên vị trí xảy ra tai nạn (phía đông, trung tâm
v.v…)
4. Airport_Code: Trạm thời tiết dựa trên sân bay (là trạm gần nhất với nơi xảy ra
tai nạn)
5. Weather_Timestamp: Dấu thời gian của bản ghi quan sát thời tiết
6. Start_Time – Thời gian bắt đầu xảy ra tai nạn theo múi giờ địa phương
7. End_Time – Thời gian kết thúc vụ tai nạn theo múi giờ địa phương. Thời gian
kết thúc ở đây là khi tác động của tai nạn đến lưu lượng giao thông.
8. Description: mô tả về vụ tai nạn
9. Number: Hiển thị số đường trong mục Địa Chỉ
10. Street: hiển thị tên đường trong mục Địa Chỉ
11. Side: Phía của đường phố (Trái/Phải) trong trường Địa Chỉ
12. City: Tên phố
13. County: Tên quận
14. State: Hiển thị trạng thái
15. Zipcode: Mã bưu chính/ Mã vùng
16. Country: tên đất nước
17. ID: Mã hồ sơ tai nạn
18. Amenity: Sự hiện diện của “sự tiện nghi” ở một vị trí gần đó (false or true)
19. Bump: Sự hiện diện cho biết “có gờ giảm tốc hoặc gờ giảm tốc” ở vị trí gần đó
(false or true)
20. Crossing: Sự hiện diện “Có giao lộ” ở một vị trí gần đó (false or true)
21. Give_Way: Sự hiện diện “Có biển báo cho đi qua” ở một vị trí gần đó (true or
false)
22. Junction: Sự hiện diện “có đường giao nhau” ở vị trí gần đó (false or true)
23. No_Exit: Sự hiện diện “không có lối đi ra” ở vị trí gần đó (false or true)
24. Railway: Sự hiện diện của “tuyến đường sắt” ở một vị trí gần đó (false or true)
25. Roundabout: Sự hiện diện của “bùng binh” ở một vị trí gần đó (false or true)
26. Station: Sự hiện diện của “ga tàu” ở một vị trí gần đó (false or true)
27. Stop: Sự hiện diện của “ĐIỂM DỪNG/CẤM ĐI” ở một vị trí gần đó (false or
true)
28. Traffic_Calming: Sự hiện diện của “giao thông lắng dịu” ở một vị trí gần đó
(false or true)
29. Traffic_Signal: Sự hiện diện của “tín hiệu giao thông” ở một vị trí gần đó(false
or true)
30. Turning_Loop: sự hiện diện của “vòng quay đầu” ở một vị trí gần đó (false or
true)
31. Sunrise_Sunset: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên
mặt trời mọc/mặt trời lặn.
32. Civil_Twilight: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên
chạng vạng dân dụng
33. Nautical_Twilight: Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên
chạng vạng hàng hải buổi sáng
34. Astronomical_Twilight: Khoảng thời gian trong ngày (tức là ngày hoặc đêm)
dựa trên chạng vạng thiên văn

Các cột thuộc Thang đo thứ bậc:


35. Severity – Mức độ nghiêm trọng (từ 1 đến 4, 1 biểu thị tác động ít nhất, 4 biểu
thị tác động nhiều nhất đến giao thông)

Lệnh R
tb=read.csv("US_Accidents_Dec21_updated.csv")
attach(tb)
head(tb)

Chọn các biến để phân tích trong toàn bộ bài tiểu luận:

Biến định lượng Biến định tính


+ Severity: mức độ nghiêm
+Distance.mi.: Chiều dài của trọng của tai nạn gây ảnh hưởng
phạm vị đường bị ảnh hưởng
đến giao thông (từ 1 đến 4)
bởi vụ tai nạn (Dặm)
+Precipitation.in. : Lượng + Weather_Condition: điều kiện
mưa (tính bằng inch) thời tiết.
2. PHÂN TÍCH THỐNG KÊ MÔ TẢ
2.1 Biến định lượng.
+ Lập bảng tần số, tần suất, tần số tích lũy, tần suất tích lũy cho chia tổ của biến
chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn (dặm)
>range(Distance.mi.)
[1] 0.000 155.186
>chiato=cut(Distance.mi.,breaks=seq(0,155.190, 31.038),include.lowest=T)
>table(chiato)
>cumsum(table(chiato))
>prop.table(table(chiato))*100
>cumsum(prop.table(table(chiato)))*100

Chia tổ Tần số Tần số tích Tần suất Tần suất


lũy (%) tích lũy (%)
[0, 31.038] 2844658 2844658 99.976 99.976
(31.038 , 62.076] 563 2845221 0.02 99.996
(62.076 , 93.114] 80 2845301 0.003 99.999
(93.114 , 124.152] 27 2845328 0.00051 99.99951
(124.152 , 155.190] 14 2845342 0.00049 100
Tổng 2845342 100
+ Tính các số đo trung tâm, số đo độ phân bố, số đo phân tán chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 1
>DL1=subset(Distance.mi.,Severity==1)

Các số đo trung tâm (hướng Các số đo độ phân bố Các số đo độ phân tán


tâm)
Mode: Tứ phân vị: >quantile(DL1) Khoảng biến thiên: Chiều
> P=table(DL1) 0% 25% 50% 75% 100% dài của phạm vị đường bị
> which(P==max(P))
0 ảnh hưởng bởi vụ tai nạn
1
0 0 0 0 24.603 (dặm) có mức độ nghiêm

Nhận xét: “Chiều dài của phạm vị trọng là 1:


đường bị ảnh hưởng bởi vụ tai + Tứ phân vị thứ 1: Cho biết 25%
24.603-0=24.603
nạn (dặm) có mức độ nghiêm số vụ tai nạn giao thông có mức độ
trọng là 1” xuất hiện nhiều nhất là nghiêm trọng là 1 có Chiều dài của (giá trị lớn nhất trừ giá trị
0 (dặm), nằm ở vị trí thứ 1 trên phạm vị đường bị ảnh hưởng bởi nhỏ nhất)
bảng tần số vụ tai nạn (dặm) là 0
Độ trải giữa của Chiều dài

+ Tứ phân vị thứ 2: Cho biết 50% của phạm vị đường bị ảnh


số vụ tai nạn giao thông có mức độ hưởng bởi vụ tai nạn (dặm)
nghiêm trọng là 1 có Chiều dài của có mức độ nghiêm trọng là
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) là 0 1:
0 -0 = 0
+ Tứ phân vị thứ 3: Cho biết 75% *** Lấy giá trị tứ phân vị
số vụ tai nạn giao thông có mức độ thứ 3 (75%) trừ giá trị tứ
nghiêm trọng là 1 có Chiều dài của phân vị thứ 1(25%)
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) là 0
Trung vị Tính phân vị thứ 80 cho Chiều Độ lệch chuẩn của Chiều
> median(DL1) dài của phạm vị đường bị ảnh dài của phạm vị đường bị
[1] 0
hưởng bởi vụ tai nạn (dặm) có ảnh hưởng bởi vụ tai nạn
Ý Nghĩa: Cho biết 50% số vụ tai
nạn giao thông có mức độ nghiêm mức độ nghiêm trọng là 1: (dặm) có mức độ nghiêm
trọng là 1 có Chiều dài của phạm > quantile(DL1,0.8) trọng là 1:
vị đường bị ảnh hưởng bởi vụ tai 80% > sd(DL1)
nạn (dặm) là 0 0 [1] 1.012714 (dặm)
80%
Ý nghĩa: độ phân tán của
Chiều dài của phạm vị
0
Y/N: Cho biết 80% số vụ tai nạn đường bị ảnh hưởng bởi vụ
giao thông có mức độ nghiêm tai nạn (dặm) có mức độ
trọng là 1 có Chiều dài của phạm
nghiêm trọng là 1 so với
vị đường bị ảnh hưởng bởi vụ tai
nạn (dặm) là 0 Chiều dài TRUNG BÌNH
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
1 là : 1.012714

Phương sai về Chiều dài


của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
1 là:
> var(DL1)
[1] 1.02559

Ý nghĩa: Độ biến động về


Chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ
tai nạn (dặm) có mức độ
nghiêm trọng là 1 là:
1.02559 (dặm2)

Trung bình:
> mean(DL1)
[1] 0.2027973
Chiều dài TRUNG BÌNH của
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) có mức độ
nghiêm trọng là 1 là: 0.2027973

+ Tính các số đo trung tâm, số đo độ phân bố, số đo phân tán chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 2
>DL2=subset(Distance.mi.,Severity==2)

Các số đo trung tâm (hướng Các số đo độ phân bố Các số đo độ phân tán


tâm)
Mode: Tứ phân vị: >quantile(DL2) Khoảng biến thiên: Chiều
> P2=table(DL2) 0% 25% 50% 75% 100% dài của phạm vị đường bị
> which(P2==max(P2))
0 ảnh hưởng bởi vụ tai nạn
1
0 0.053 0.232 0.754 155.186 (dặm) có mức độ nghiêm

Nhận xét: “Chiều dài của phạm vị trọng là 2 là:


đường bị ảnh hưởng bởi vụ tai + Tứ phân vị thứ 1: Cho biết 25%
155.186-0=155.186
nạn (dặm) có mức độ nghiêm số vụ tai nạn giao thông có mức độ
trọng là 2” xuất hiện nhiều nhất là nghiêm trọng là 2 có Chiều dài của (giá trị lớn nhất trừ giá trị
0 (dặm), nằm ở vị trí thứ 1 trên phạm vị đường bị ảnh hưởng bởi nhỏ nhất)
bảng tần số vụ tai nạn (dặm) là 0.053
Độ trải giữa của Chiều dài

+ Tứ phân vị thứ 2: Cho biết 50% của phạm vị đường bị ảnh


số vụ tai nạn giao thông có mức độ hưởng bởi vụ tai nạn (dặm)
nghiêm trọng là 2 có Chiều dài của có mức độ nghiêm trọng là
phạm vị đường bị ảnh hưởng bởi 2:
vụ tai nạn (dặm) là 0.232 0.754- 0.053 = 0.701
+ Tứ phân vị thứ 3: Cho biết 75% *** Lấy giá trị tứ phân vị
số vụ tai nạn giao thông có mức độ thứ 3 (75%) trừ giá trị tứ
nghiêm trọng là 1 có Chiều dài của phân vị thứ 1(25%)
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) là 0.754

Trung vị Tính phân vị thứ 80 cho Chiều Độ lệch chuẩn Chiều dài
> median(DL2) dài của phạm vị đường bị ảnh của phạm vị đường bị ảnh
[1] 0.232
hưởng bởi vụ tai nạn (dặm) có hưởng bởi vụ tai nạn (dặm)
Ý Nghĩa: Cho biết 50% số vụ tai
nạn giao thông có mức độ nghiêm mức độ nghiêm trọng là 2: có mức độ nghiêm trọng là
trọng là 2 có Chiều dài của phạm > quantile(DL2,0.8) 2:
vị đường bị ảnh hưởng bởi vụ tai 80% > sd(DL2)
nạn (dặm) là 0.232 0.943 [1] 1.393914 (dặm)
80%
Ý nghĩa: độ phân tán của
Chiều dài của phạm vị
0.943
Y/N: Cho biết 80% số vụ tai nạn đường bị ảnh hưởng bởi vụ
giao thông có mức độ nghiêm tai nạn (dặm) có mức độ
trọng là 2 có Chiều dài của phạm
nghiêm trọng là 2 so với
vị đường bị ảnh hưởng bởi vụ tai
nạn (dặm) là 0.943 Chiều dài TRUNG BÌNH
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
2 là : 1.393914 (dặm)
Phương sai về Chiều dài
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
2 là:
> var(DL2)
[1] 1.942997

Ý nghĩa: Độ biến động về


Chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ
tai nạn (dặm) có mức độ
nghiêm trọng là 2 là:
1.942997 (dặm2)

Trung bình:
> mean(DL2)
[1] 0.674301
Chiều dài TRUNG BÌNH của
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) có mức độ
nghiêm trọng là 2 là: 0.674301

+ Tính các số đo trung tâm, số đo độ phân bố, số đo phân tán chiều dài của phạm vị
đường bị ảnh hưởng bỏi vụ tai nạn (dặm) có mức độ nghiêm trọng là 3
>DL3=subset(Distance.mi.,Severity==3)
Các số đo trung tâm (hướng Các số đo độ phân bố Các số đo độ phân tán
tâm)
Mode: Tứ phân vị: >quantile(DL3) Khoảng biến thiên: Chiều
> P3=table(DL3) 0% 25% 50% 75% 100% dài của phạm vị đường bị
> which(P3==max(P3))
0 ảnh hưởng bởi vụ tai nạn
1
0 0.004 0.328 0.676 151.525 (dặm) có mức độ nghiêm
Nhận xét: “Chiều dài của phạm vị trọng là 3 là:
đường bị ảnh hưởng bởi vụ tai + Tứ phân vị thứ 1: Cho biết 25%
151.525 -0=151.525
nạn (dặm) có mức độ nghiêm số vụ tai nạn giao thông có mức độ
trọng là 3” xuất hiện nhiều nhất là nghiêm trọng là 3 có Chiều dài của (giá trị lớn nhất trừ giá trị
0 (dặm), nằm ở vị trí thứ 1 trên phạm vị đường bị ảnh hưởng bởi nhỏ nhất)
bảng tần số vụ tai nạn (dặm) là 0.004
Độ trải giữa của Chiều dài

+ Tứ phân vị thứ 2: Cho biết 50% của phạm vị đường bị ảnh


số vụ tai nạn giao thông có mức độ hưởng bởi vụ tai nạn (dặm)
nghiêm trọng là 3 có Chiều dài của có mức độ nghiêm trọng là
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) là 0.328 3:
+ Tứ phân vị thứ 3: Cho biết 75% 0.676 - 0.004 = 0.672
số vụ tai nạn giao thông có mức độ *** Lấy giá trị tứ phân vị
nghiêm trọng là 3 có Chiều dài của thứ 3 (75%) trừ giá trị tứ
phạm vị đường bị ảnh hưởng bởi phân vị thứ 1(25%)
vụ tai nạn (dặm) là 0.676

Trung vị Tính phân vị thứ 80 cho Chiều Độ lệch chuẩn Chiều dài
> median(DL3) dài của phạm vị đường bị ảnh của phạm vị đường bị ảnh
[1] 0.328
hưởng bởi vụ tai nạn (dặm) có hưởng bởi vụ tai nạn (dặm)
Ý Nghĩa: Cho biết 50% số vụ tai
nạn giao thông có mức độ nghiêm mức độ nghiêm trọng là 3: có mức độ nghiêm trọng là
trọng là 3 có Chiều dài của phạm > quantile(DL3,0.8) 3:
vị đường bị ảnh hưởng bởi vụ tai 80% > sd(DL3)
nạn (dặm) là: 0.328 0.786 [1] 1.68561 (dặm)
80%
Ý nghĩa: độ phân tán của
Chiều dài của phạm vị
0.786
đường bị ảnh hưởng bởi vụ
Y/N: Cho biết 80% số vụ tai nạn
giao thông có mức độ nghiêm tai nạn (dặm) có mức độ
trọng là 3 có Chiều dài của phạm nghiêm trọng là 3 so với
vị đường bị ảnh hưởng bởi vụ tai
Chiều dài TRUNG BÌNH
nạn (dặm) là 0.786
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
3 là : 1.68561 (dặm)
Phương sai về Chiều dài
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
3 là:
> var(DL3)
[1] 2.841281

Ý nghĩa: Độ biến động về


Chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ
tai nạn (dặm) có mức độ
nghiêm trọng là 3 là:
2.841281 (dặm2)

Trung bình:
> mean(DL3)
[1] 0.6188147
Chiều dài TRUNG BÌNH của
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) có mức độ
nghiêm trọng là 3 là: 0.6188147

+ Tính các số đo trung tâm, số đo độ phân bố, số đo phân tán chiều dài của phạm
vị đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 4
>DL4=subset(Distance.mi.,Severity==4)
Các số đo trung tâm (hướng Các số đo độ phân bố Các số đo độ phân tán
tâm)
Mode: Tứ phân vị: >quantile(DL4) Khoảng biến thiên: Chiều
> P4=table(DL4) 0% 25% 50% 75% 100% dài của phạm vị đường bị
> which(P4==max(P4))
0 ảnh hưởng bởi vụ tai nạn
1
0 0.182 0.521 1.426 152.543 (dặm) có mức độ nghiêm
Nhận xét: “Chiều dài của phạm vị trọng là 4 là:
đường bị ảnh hưởng bởi vụ tai + Tứ phân vị thứ 1: Cho biết 25%
152.543 -0=152.543
nạn (dặm) có mức độ nghiêm số vụ tai nạn giao thông có mức độ
trọng là 4” xuất hiện nhiều nhất là nghiêm trọng là 4 có Chiều dài của (giá trị lớn nhất trừ giá trị
0 (dặm), nằm ở vị trí thứ 1 trên phạm vị đường bị ảnh hưởng bởi nhỏ nhất)
bảng tần số vụ tai nạn (dặm) là 0.182
Độ trải giữa của Chiều dài

+ Tứ phân vị thứ 2: Cho biết 50% của phạm vị đường bị ảnh


số vụ tai nạn giao thông có mức độ hưởng bởi vụ tai nạn (dặm)
nghiêm trọng là 4 có Chiều dài của có mức độ nghiêm trọng là
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) là 0.521 4:
+ Tứ phân vị thứ 3: Cho biết 75% 1.426 - 0.182 = 1.244
số vụ tai nạn giao thông có mức độ *** Lấy giá trị tứ phân vị
nghiêm trọng là 4 có Chiều dài của thứ 3 (75%) trừ giá trị tứ
phạm vị đường bị ảnh hưởng bởi phân vị thứ 1(25%)
vụ tai nạn (dặm) là 1.426
Trung vị Tính phân vị thứ 80 cho Chiều Độ lệch chuẩn Chiều dài
> median(DL4) dài của phạm vị đường bị ảnh của phạm vị đường bị ảnh
[1] 0.521
hưởng bởi vụ tai nạn (dặm) có hưởng bởi vụ tai nạn (dặm)
Ý Nghĩa: Cho biết 50% số vụ tai
nạn giao thông có mức độ nghiêm mức độ nghiêm trọng là 4: có mức độ nghiêm trọng là
trọng là 4 có Chiều dài của phạm > quantile(DL4,0.8) 4:
vị đường bị ảnh hưởng bởi vụ tai 80% > sd(DL4)
nạn (dặm) là 0.521 1.824 [1] 3.331298 (dặm)
80%
Ý nghĩa: độ phân tán của
Chiều dài của phạm vị
1.824
Y/N: Cho biết 80% số vụ tai nạn đường bị ảnh hưởng bởi vụ
giao thông có mức độ nghiêm tai nạn (dặm) có mức độ
trọng là 4 có Chiều dài của phạm
nghiêm trọng là 4 so với
vị đường bị ảnh hưởng bởi vụ tai
nạn (dặm) là 1.824 Chiều dài TRUNG BÌNH
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
4 là : 3.331298 (dặm)
Phương sai về Chiều dài
của phạm vị đường bị ảnh
hưởng bởi vụ tai nạn (dặm)
có mức độ nghiêm trọng là
4 là:
> var(DL4)
[1] 11.09755
Ý nghĩa: Độ biến động về
Chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ
tai nạn (dặm) có mức độ
nghiêm trọng là 4 là:
11.09755 (dặm2)

Trung bình:
> mean(DL4)
[1] 1.448978
Chiều dài TRUNG BÌNH của
phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) có mức độ
nghiêm trọng là 4 là: 1.448978

- Phân tích bằng biểu đồ:


+ Sử dụng biểu đồ phân phối tần số để mô tả phân phối: chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 1
> range(DL1)
[1] 0.000 24.603
> hist(DL1,breaks=seq(0,24.605,4.921),include.lowest=T)
Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn
(dặm) có mức độ nghiêm trọng là 1 tập trung chủ yếu ở bên trái, không đối xứng, không
đều, cụ thể tập trung chủ yếu trong khoảng từ 0 đến 5.

+ Sử dụng biểu đồ phân phối tần số để mô tả phân phối: chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 2
>range(DL2)
[1] 0.000 155.186
>hist(DL2,breaks=seq(0,155.190,31.038),include.lowest=T)

Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn
(dặm) có mức độ nghiêm trọng là 2 tập trung chủ yếu ở bên trái, không đối xứng, không
đều, cụ thể tập trung chủ yếu trong khoảng từ 0 đến 30

+ Sử dụng biểu đồ phân phối tần số để mô tả phân phối: chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 3.
> range(DL3)
[1] 0.000 151.525
> hist(DL3,breaks=seq(0,151.525,30.305),include.lowest=T)

Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn
(dặm) có mức độ nghiêm trọng là 3 tập trung chủ yếu ở bên trái, không đối xứng, không
đều, cụ thể tập trung chủ yếu trong khoảng từ 0 đến 30

+ Sử dụng biểu đồ phân phối tần số để mô tả phân phối: chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 4.
> range(DL4)
[1] 0.000 152.543
> hist(DL4,breaks=seq(0,152.545,30.509),include.lowest=T)
Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn
(dặm) có mức độ nghiêm trọng là 4 tập trung chủ yếu ở bên trái, không đối xứng, không
đều, cụ thể tập trung chủ yếu trong khoảng từ 0 đến 30

+ Sử dụng biểu đồ hộp và râu để mô tả giá trị ngoại biên của chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 1
>boxplot(DL1, horizontal=T)

Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai
nạn (dặm) có mức độ nghiêm trọng là 1 tập trung chủ yếu ở bên trái, không đối xứng.
Có rất nhiều giá trị ngoại biên ở bên phải
Giá trị tứ phân vị thứ 1: 0
Giá trị tứ phân vị thứ 2: 0
Giá trị tứ phân vị thứ 3: 0
+ Sử dụng biểu đồ hộp và râu để mô tả giá trị ngoại biên của chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 2
>boxplot(DL2,horizontal=T)

Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai
nạn (dặm) có mức độ nghiêm trọng là 2 tập trung chủ yếu ở bên trái, không đối xứng.
Có rất nhiều giá trị ngoại biên ở bên phải
Giá trị tứ phân vị thứ 1: 0.053
Giá trị tứ phân vị thứ 2: 0.232
Giá trị tứ phân vị thứ 3: 0.754

+ Sử dụng biểu đồ hộp và râu để mô tả giá trị ngoại biên của chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 3
>boxplot(DL3,horizontal=T)

Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai
nạn (dặm) có mức độ nghiêm trọng là 3 tập trung chủ yếu ở bên trái, không đối xứng.
Có rất nhiều giá trị ngoại biên ở bên phải
Giá trị tứ phân vị thứ 1: 0.004
Giá trị tứ phân vị thứ 2: 0.328
Giá trị tứ phân vị thứ 3: 0.676
+ Sử dụng biểu đồ hộp và râu để mô tả giá trị ngoại biên của chiều dài của phạm vị
đường bị ảnh hưởng bởi vụ tai nạn (dặm) có mức độ nghiêm trọng là 4
>boxplot(DL4,horizontal=T)

Nhận xét: Phân phối dữ liệu về chiều dài của phạm vị đường bị ảnh hưởng bởi vụ tai nạn
(dặm) có mức độ nghiêm trọng là 4 tập trung chủ yếu ở bên trái, không đối xứng. Có rất
nhiều giá trị ngoại biên ở bên phải
Giá trị tứ phân vị thứ 1: 0.182
Giá trị tứ phân vị thứ 2: 0.521
Giá trị tứ phân vị thứ 3: 1.426

2.2. Biến định tính: Severity (Mức độ nghiêm trọng của tai nạn) và Weather_Condition
(điều kiện thời tiết)
2.2.1. Phân tích:
- Phân tích bằng đại lượng thống kê mô tả
+ Mode: Mức độ nghiêm trọng của tai nạn xuất hiện nhiều nhất trong dữ liệu là mức độ
2, nằm ở vị trí thứ 2 trên bảng tần số.
Lệnh:
> which(table(Severity)==max(table(Severity)))
2
2
+ Mode: Điều kiện thời tiết xuất hiện nhiều nhất trong dữ liệu là Fair ,nằm ở vị trí thứ
17 trên bảng tần số.
Lệnh:
> which(table(Weather_Condition)==max(table(Weather_Condition)))
Fair
17
- Phân tích bằng biểu đồ
+ Sử dụng biểu đồ tròn để mô tả phân phối của Severity (Mức độ nghiêm trọng của tai
nạn)
> piepercent2 = round(100*table(Severity)/sum(table(Severity)), 1)
>pie(table(Severity),labels = piepercent2,radius = +1,col =c("white", "light blue",
"#FED966","yellow"))
>legend("topright",c("1","2","3","4"),cex=.9,fill=c("white", "light blue",
"#FED966","yellow"))

Nhận xét: Tỷ lệ số vụ tai nạn có mức độ nghiêm trọng ở mức 2 là cao nhất với 89%, thấp
nhất là ở mức 1 với tỷ lệ là 0.9(%), mức 3 và mức 4 có tỷ lệ lần lượt là: 5.5(%) và 4.6(%)

+ Sử dụng biểu đồ thanh để mô tả phân phối: các mức độ nghiêm trọng của tai nạn với
Sunrise_Sunset (Khoảng thời gian trong ngày (tức là ngày hoặc đêm) dựa trên mặt trời
mọc/mặt trời lặn)
>y=table(Severity,Sunrise_Sunset)
>barplot(y)
Nhận xét:
Vào ban ngày (tính từ lúc mặt trời mọc): thì số lượng tai nạn có mức độ nghiêm
trọng là 1 là ít nhất, mức độ 2 là cao nhất, mức độ 3 nhiều hơn mức độ 4 một chút
Vào buổi tối (tính từ lúc mặt trời lặn): thì số lượng tai nạn có mức độ nghiêm trọng
là 1 là ít nhất, mức độ 2 là cao nhất, mức độ 4 nhiều hơn mức độ 3 một chút.

+ Lập bảng tần số chéo cho chia tổ chiều dài của phạm vị đường bị ảnh hưởng bởi
vụ tai nạn (dặm) với mức độ nghiêm trọng của tai nạn
> range(Distance.mi.)
[1] 0.000 155.186
> chiato2=cut(Distance.mi.,breaks=seq(0,155.190,31.038),include.lowest=T)
> table(chiato2,Severity)

Thực hiện bài toán: Tính tỷ lệ số vụ tai nạn có chiều dài của phạm vị đường bị ảnh hưởng
bởi vụ tai nạn từ 0 đến 31 (dặm) chỉ tính trong mức độ nghiêm trong là 2:
Kết quả: 2532649/(2532649+40+12+2+3)*100(%)= 99.99775 (%)
THỐNG KỂ SUY DIỄN:
Lệnh
>tb=read.csv("US_Accidents_Dec21_updated.csv")
>tb=na.omit(tb2)
>attach(tb)
>head(tb)

3. BÀI TOÁN ƯỚC LƯỢNG


3.1 ƯỚC LƯỢNG ĐIỂM
Bài toán 1: Thực hiện ước lượng điểm cho Lượng mưa trung bình khi có các vụ tai nạn
xảy ra theo dữ liệu điều tra.
> mean(Precipitation.in.)
[1] 0.004346527 (inch)
Kết luận: ước lượng điểm cho Lượng mưa trung bình khi có các vụ tai nạn xảy ra là:
0.004346527 (inch)

Bài toán 2: Thực hiện bài toán ước lượng điểm cho tỷ lệ số vụ tai nạn xảy ra có lượng
mưa dưới 0.004346527 (inch) trong dữ liệu điều tra.
Bài làm:
> sum(Precipitation.in.< 0.004346527)/length(Precipitation.in.)*100
[1] 94.13636 (%)
Kết luận: Vậy ước lượng điểm cho tỷ lệ số vụ tai nạn xảy ra có lượng mưa dưới
0.004346527 (inch) trong dữ liệu điều tra là 94.13636 (%)

Bài toán 3: Thực hiện ước lượng điểm cho phương sai Lượng mưa khi có các vụ tai nạn
xảy ra theo dữ liệu điều tra.
> var(Precipitation.in.)
[1] 0.001814428
ước lượng điểm cho phương sai Lượng mưa khi có các vụ tai nạn xảy ra theo dữ liệu điều
tra là: 0.001814428 (inch2)

Bài toán 4: Thực hiện hiện ước lượng điểm cho độ lệch chuẩn của Lượng mưa khi có các
vụ tai nạn xảy ra theo dữ liệu điều tra.
> sd(Precipitation.in.)
[1] 0.0425961
ước lượng điểm cho độ lệch chuẩn của Lượng mưa khi có các vụ tai nạn xảy ra theo dữ
liệu điều tra là: 0.0425961 (inch)
3.2 Ước lượng khoảng
Bài toán 1: Thực hiện ước lượng khoảng 95% cho Lượng mưa trung bình khi có các vụ
tai nạn xảy ra theo dữ liệu điều tra.
>t.test(Precipitation.in.,conf.level=0.95)
Kết luận: Vậy ước lượng khoảng 95% cho Lượng mưa trung bình khi có các vụ tai nạn
xảy ra theo dữ liệu điều tra là: [0.004260748 , 0.004432307]

Bài toán 2: Thực hiện ước lượng khoảng 95% cho tỷ lệ số vụ tai nạn xảy ra có lượng
mưa dưới 0.004346527 (inch) trong dữ liệu điều tra.
Bài làm:
> sum(Precipitation.in.< 0.004346527)
891718
> length(Precipitation.in.)
947262
> prop.test(891718, 947262,conf.level=0.95,correct=F)
Kết luận: Vậy ước lượng khoảng 95% cho tỷ lệ số vụ tai nạn xảy ra có lượng mưa dưới
0.004346527 (inch) trong dữ liệu điều tra là: [0.9408887 , 0.9418350] , tức [94.09(%) ,
94.18(%)]

4 Bài toán kiểm định


4.1 Bài toán kiểm định một tham số
Bài toán 1: Thực hiện kiểm định tại mức ý nghĩa 5% Lượng mưa trung bình khi có các
vụ tai nạn xảy ra theo dữ liệu điều tra có cao hơn 0.004346527 hay không?
Bài làm:
Gọi µ là Lượng mưa trung bình khi có các vụ tai nạn xảy ra.
Ho: µ ≤ 0.004346527
H1: µ > 0.004346527
>t.test(Precipitation.in., mu=0.004346527,alt="g")
Kết luận: p-value = 0.5 > mức ý nghĩa= 0.05 => Bác bỏ H1, chấp nhận Ho
Vây tại mức ý nghĩa 5% không đủ bằng chứng thống kê để cho rằng Lượng mưa trung
bình khi có các vụ tai nạn xảy ra theo dữ liệu điều tra cao hơn 0.004346527 (inch)

Bài toán 2: Thực hiện kiểm định tại mức ý nghĩa 5% cho tỷ lệ số vụ tai nạn xảy ra có
lượng mưa dưới 0.004346527 (inch) trong dữ liệu điều tra có là 94.13636 (%) hay
không?
Bài làm:
Gọi p là tỷ lệ số vụ tai nạn xảy ra có lượng mưa dưới 0.004346527 (inch) trong dữ liệu
điều tra
Ho: p = 94.13636 %
H1: p # 94.13636 %
> sum(Precipitation.in.< 0.004346527)
891718
> length(Precipitation.in.)
947262
> prop.test(891718, 947262,p=0.9413636,alt=”t”,correct=F)

Kết luận: p-value = 0.9999 > mức ý nghĩa 0.05 => bác bỏ H1, chấp nhận Ho
Vây tai mức ý nghĩa 5%, đủ bằng chứng thống kê để cho rằng tỷ lệ số vụ tai nạn xảy ra
có lượng mưa dưới 0.004346527 (inch) trong dữ liệu điều tra là 94.13636 (%)

4.2. Bài toán kiểm định hai tham số.


Bài toán 1: Kiểm định Lượng mưa trung bình của các vụ tai nạn có mức độ nghiêm trọng
là 2 có thấp hơn mức độ nghiêm trọng là 3 hay không? Với mức ý nghĩa 5%.
Bài làm:
Gọi µ1, µ2 lần lượt là Lượng mưa trung bình của các vụ tai nạn có mức độ nghiêm trọng
là 2,3.
Ho: µ1- µ2 ≥ 0
H1: µ1- µ2 < 0
Lệnh:
> LM2=subset(Precipitation.in.,Severity==2)
> LM3=subset(Precipitation.in.,Severity==3)
> t.test(LM2,LM3,mu=0,alt="l")
Kết luận: p-value = 8.447*10-6 < mức ý nghĩa = 0.05 => bác bỏ Ho, chấp nhận H1
Vậy tại mức ý nghĩa 5%, đủ bằng chứng thống kê cho rằng Lượng mưa trung bình của
các vụ tai nạn có mức độ nghiêm trọng là 2 thấp hơn mức độ nghiêm trọng là 3.

Bài toán 2: Thực hiện kiểm định tỷ lệ số vụ tai nạn xảy ra có lượng mưa dưới
0.004346527 (inch) trong mức độ nghiêm trọng tai nạn là 2 có thấp hơn tỷ lệ này trong
mức độ nghiêm trọng tai nạn là 3 hay không? Tại mức ý nghĩa 5%.
Bài làm:
Gọi p1, p2 lần lượt là tỷ lệ số vụ tai nạn xảy ra có lượng mưa không quá 0.004346527
(inch) trong mức độ nghiêm trọng tai nạn là 2,3
Ho: p1-p2 ≥ 0
H1: p1-p2 < 0
> sum(Precipitation.in.< 0.004346527&Severity==2)
[1] 841883
> sum(Precipitation.in.< 0.004346527&Severity==3)
[1] 12425
> sum(Severity==2)
[1] 893384
> sum(Severity==3)
[1] 13725
> prop.test(c(841883,12425),c(893384,13725),alt="l",correct=F)

Kết luận: p-value = 1 > mức ý nghĩa = 0.05 => bác bỏ H1, chấp nhận Ho.
Vậy tại mức ý nghĩa 5%, không đủ bằng chứng thống kê cho tỷ lệ số vụ tai nạn xảy ra có
lượng mưa dưới 0.004346527 (inch) trong mức độ nghiêm trọng tai nạn là 2 thấp hơn tỷ
lệ này trong mức độ nghiêm trọng tai nạn là 3.

Bài toán 3: Kiểm định độ biến động của lượng mưa khi tai nạn xảy ra ở mức độ
nghiêm trọng là 3 và 4 có như nhau hay không? Tại mức ý nghĩa 5%
Bài làm: gọi sigma2(1) , sigma2(2) lần lượt là độ biến động của lượng mưa khi tai nạn
xảy ra ở mức độ nghiêm trọng là 3, 4
Ho: sigma2(1) = sigma2(2) (như nhau)
H1: sigma2(1) # sigma2(2) (không như nhau)
> LM3=subset(Precipitation.in.,Severity==3)
> LM4=subset(Precipitation.in.,Severity==4)
> var.test(LM3,LM4,alt="t")

p-value < 2.2*10-16 < mức ý nghĩa 5% => bác bỏ Ho, chấp nhận H1.

Tại mức ý nghĩa 5%, không đủ bằng chứng thống kê cho rằng độ biến động của lượng
mưa khi tai nạn xảy ra ở mức độ nghiêm trọng là 3 và 4 là như nhau.
4.3. Bài toán Phân Tích Phương Sai.
Vấn đề đặt ra:
Kiểm định tại mức ý nghĩa 5% Chiều dài của phạm vị đường bị ảnh hưởng do tai nạn có
bị ảnh hưởng bởi mức độ nghiêm trọng của tai nạn hay không? Sau đó lập bảng phân tích
phương sai.
Bài làm:
Gọi µ1,µ2,µ3,µ4 lần lượt là Chiều dài trung bình của phạm vị đường bị ảnh hưởng bởi tai
nạn của các mức độ tai nạn nghiêm trọng 1,2,3,4.
Ho: µ1=µ2=µ3=µ4
H1: ∃ i,j ∈ {1,2,3,4} : µi # µj
> attach(tb)
> D=Severity
> D[Severity==1]="A"
> D[Severity==2]="B"
> D[Severity==3]="C"
> D[Severity==4]="D"
> anova(lm(Distance.mi.~D))
Kết luận: p-value < 2.2*10-16 < mức ý nghĩa= 0.05 => bác bỏ Ho, chấp nhận H1
Vậy tại mức ý nghĩa 5%, đủ bằng chứng thống kê cho rằng Chiều dài của phạm vị đường
bị ảnh hưởng do tai nạn có bị ảnh hưởng bởi mức độ nghiêm trọng của tai nạn.

Lập bảng phân tích phương sai:

Tổng bình phương Bậc tự do Phương Sai Tỉ số F


Nguồn biến thiên
(sum Sq) (df) (MS)

Giữa các nhóm SSG= 13063 3 4354.4 5438.9


Nội bộ các nhóm SSW= 758383 947258 0.8
Tổng SST= 771446 947261

4.5. Kiểm định tại mức ý nghĩa 5%, điều kiện thời tiết và mức độ nghiêm trọng của
tai nạn có mối liên hệ với nhau hay không?
Bài làm:
Ho: điều kiện thời tiết và mức độ nghiêm trọng của tai nạn độc lập với nhau
H1: điều kiện thời tiết và mức độ nghiêm trọng của tai nạn có mối liên hệ với nhau
> matran=table(Weather_Condition,D)
> chisq.test(matran)

Kết luận: p-value < 2.2*10-16 < mức ý nghĩa 5% => bác bỏ Ho, chấp nhận H1
Tại mức ý nghĩa 5%, đủ bằng chứng thống kê cho rằng điều kiện thời tiết và mức độ
nghiêm trọng của tai nạn có mối liên hệ với nhau.

Tổng kết
So sánh chiều dài của phạm vi đường bị ảnh hưởng bởi tai nạn của các mức độ
nghiêm trọng 1 2 3 4
1 2 3 4
Mode 0 0 0 0
Trung bình 0.2027973 0.674301 0.6188147 1.448978
Trung vị 0 0.232 0.328 0.521
Khoảng biến thiên 24.603 155.186 151.525 152.543
Độ trải giữa 0 0.701 0.672 1.244
Độ lệch chuẩn 1.012714 1.393914 1.68561 3.331298
Phương Sai 1.02559 1.942997 2.841281 11.09755
Cao Nhất 24.603 155.186 151.525 152.543
Thấp nhất 0 0 0 0
Kết luận:
Giống nhau:
+ chiều dài của phạm vi đường bị ảnh hưởng bởi tai nạn của các mức độ nghiêm trọng 1
2 3 4 xuất hiện nhiều nhất đều là 0 (dặm)
+ chiều dài của phạm vi đường bị ảnh hưởng bởi tai nạn của các mức độ nghiêm trọng 1
2 3 4 ngắn nhất đều là 0 (dặm)
Khác Nhau:
+ Ở các đại lượng trung vị, độ lệch chuẩn, Phương Sai: chiều dài của phạm vi đường
bị ảnh hưởng bởi tai nạn của các mức độ nghiêm trọng 1 2 3 4 có sự tăng dần từ 1 đến 4
+ Ở đại lượng trung bình thì: chiều dài của phạm vi đường bị ảnh hưởng bởi tai nạn
của các mức độ nghiêm trọng 1 là thấp nhất, 4 là cao nhất và mức độ nghiêm trọng 2 dài
hơn mức độ nghiêm trọng 3.
+ Ở đại lượng khoảng biến thiên thì: chiều dài của phạm vi đường bị ảnh hưởng bởi tai
nạn của các mức độ nghiêm trọng 1 là thấp nhất, 2 là cao nhất và mức độ nghiêm trọng 3
ngắn hơn mức độ nghiêm trọng 4.

+ Ở đại lượng độ trải giữa thì: chiều dài của phạm vi đường bị ảnh hưởng bởi tai nạn
của các mức độ nghiêm trọng 1 là thấp nhất, 4 là cao nhất và mức độ nghiêm trọng 2
ngắn hơn mức độ nghiêm trọng 3.

So sánh lượng mưa trung bình của các vụ tai nạn ứng với mức độ nghiêm trọng 1 2
34
> LM1=subset(Precipitation.in.,Severity==1)
> LM2=subset(Precipitation.in.,Severity==2)
> LM3=subset(Precipitation.in.,Severity==3)
> LM4=subset(Precipitation.in.,Severity==4)
> mean(LM1)
[1] 0.002877549
> mean(LM2)
[1] 0.004332583
> mean(LM3)
[1] 0.005712204
> mean(LM4)
[1] 0.0046631

Từ so sánh bằng thống kê mô tả và từ các bài toán kiểm định của thống kê suy diễn,
với phạm vi các biến định lượng và biến định tính mà nhóm đã chọn thì nhóm đưa
ra kết luận “chiều dài của phạm vi đường bị ảnh hưởng bởi tai nạn của các mức độ
nghiêm trọng 1 2 3 4 bị ảnh hưởng bởi các điều kiện thời tiết”
“lượng mưa trung bình khi có các tai nạn xảy ra ứng với các mức độ nghiêm
trọng 1,2,3,4 là khác nhau”

Vậy một trong nhiều nguyên nhân của các vụ tai nạn xảy ra với mức độ nghiêm trọng
tương ứng 1,2,3,4 có thể nói là do Điều Kiện Thời Tiết
Giải pháp cho vấn đề này là:
+ Khi thời tiết xấu những người tham gia giao thông nên giảm tốc độ lưu thông hoặc
dừng lại đợi nếu thời tiết quá xấu do mưa bão, gió to, hay có lốc xoáy.
+ Không vượt đèn đỏ, không lấn làn, lấn chiếm vỉa hè để đi nhanh hơn do thời tiết xấu vì
điều này rất dễ xảy ra tai nạn.

You might also like