1. Từ file dữ liệu cho sẳn tách làm 2 file riêng: a. ThuNhap_HoGiaDinh_data.tab: chiếm 70% dữ liệu trong file dubao_hogiadinh. tab b. ThuNhap_HoGiaDinh_forecast.tab: 30% dữ liệu dùng để dự báo. Và bỏ đi dữ liệu cột biến phụ thuộc (Vay Vốn)
Lab 2 – Phân lớp dữ liệu
1. Sử dụng 3 phương pháp: hồi qui logistic, svm, cây quyết định tiến hành phân lớp theo “Vay Vốn”. Đánh giá các phương pháp. Lưu ý thế hiện quan sát dữ liệu theo dạng bảng hoặc biều đồ a. Chụp màn hình xây dựng mô hình: b. Chụp màn hình đánh giá các phương pháp và Ma trận nhầm lẫn 2. Sử dụng mô hình tốt nhất để dự báo “Vay Vốn” cho khách hàng trong file: ThuNhap_HoGiaDinh_forecast.tab a. Chụp màn hình xây dựng mô hình: b. Chụp màn hình kết quả dự báo: 3. Phân tích chuyên sâu: sử dụng mô hình Tree và mô hình hồi qui logistic để đưa ra những phát hiện từ mô hình