Download as pdf or txt
Download as pdf or txt
You are on page 1of 1

BÀI TẬP THỰC HÀNH _THỐNG KÊ MÔ TẢ

Deadline: 23h00 ngày 10/07/2022

Phần mềm sử dụng: Stata


Thực hiện theo nhóm các yêu cầu sau:
a) Tải bộ dữ liệu Train-Set.csv ở đường link:
https://www.kaggle.com/datasets/akashdeepkuila/big-mart-sales
b) Mô tả bộ dữ liệu
 Mô tả bộ dữ liệu: gồm bao nhiêu biến? bao nhiêu quan sát? Dữ liệu của các
biến là định tính hay định lượng? nếu là định lượng --> liên tục hay rời rạc.
 Dữ liệu của các biến được thu thập theo thang đo nào? Các dữ liệu được thu
thập theo đơn vị gì?
 Mã hóa lại các thuộc tính của các biến định tính bằng các số (chẳng hạn: 1,
2, 3,…).
c) Mô tả các biến trong bộ dữ liệu
 Lập các bảng tần số của từng biến sau: FatContent; OutletType;
LocationType; ProductType. Hãy cho nhận xét chi tiết về các bảng tần số
trên.
 Lập các bảng tần số đồng thời của: FatContent theo ProductType;
ProductVisibility theo OutletType; Weight theo ProductType; MRP theo
ProductType; OutletSales theo OutletType. Hãy cho nhận xét chi tiết về các
bảng tần số trên.
 Dùng đồ thị phù hợp mô tả tất cả các biến có trong bộ dữ liệu và cho nhận
xét.
 Phát hiện các Missing value (nếu có).
 Tính toán các trị thống kê mô tả đặc trưng của các biến: Weight,
ProductVisibility, MRP, OutletType. Từ đó, hãy cho nhận xét về hình dáng
phân phối dữ liệu của các biến trên?

You might also like