Thực hiện theo nhóm các yêu cầu sau: a) Tải bộ dữ liệu Train-Set.csv ở đường link: https://www.kaggle.com/datasets/akashdeepkuila/big-mart-sales b) Mô tả bộ dữ liệu Mô tả bộ dữ liệu: gồm bao nhiêu biến? bao nhiêu quan sát? Dữ liệu của các biến là định tính hay định lượng? nếu là định lượng --> liên tục hay rời rạc. Dữ liệu của các biến được thu thập theo thang đo nào? Các dữ liệu được thu thập theo đơn vị gì? Mã hóa lại các thuộc tính của các biến định tính bằng các số (chẳng hạn: 1, 2, 3,…). c) Mô tả các biến trong bộ dữ liệu Lập các bảng tần số của từng biến sau: FatContent; OutletType; LocationType; ProductType. Hãy cho nhận xét chi tiết về các bảng tần số trên. Lập các bảng tần số đồng thời của: FatContent theo ProductType; ProductVisibility theo OutletType; Weight theo ProductType; MRP theo ProductType; OutletSales theo OutletType. Hãy cho nhận xét chi tiết về các bảng tần số trên. Dùng đồ thị phù hợp mô tả tất cả các biến có trong bộ dữ liệu và cho nhận xét. Phát hiện các Missing value (nếu có). Tính toán các trị thống kê mô tả đặc trưng của các biến: Weight, ProductVisibility, MRP, OutletType. Từ đó, hãy cho nhận xét về hình dáng phân phối dữ liệu của các biến trên?