Professional Documents
Culture Documents
Exercise Machine Learning 1 w2
Exercise Machine Learning 1 w2
BÀI 2:
Cho bảng dữ liệu sau:
BÀI 2
Đọc tập dữ liệu : Số lượng dòng và cột (biết, mỗi một phần tử của véc-tơ ngăn cách nhau bởi dấu "," ).
6
BÀI 3
Đọc tập dữ liệu và xử lý tập dữ liệu, thực hiện một số yêu cầu sau:
a. Số lượng thuộc tính và dòng trong bản ghi dữ liệu.
b. Có bao nhiêu thuộc tính là kiểu định tính, định lượng?
c. Kiểm tra các vấn đề có ở trong tập dữ liệu, phương pháp xử lý đối với từng vấn đề.
d. Thực hiện phân tách đầu ra và đầu vào để chuẩn bị cho mô hình học máy. (Nhãn là cột Test Results)
Yêu cầu:
• Xây dựng bằng nhiều mô hình Bayes các phân phối khác nhau
• Đánh giá kết quả
BÀI 2
Sử dụng dữ liệu từ bài 3 (Đọc và xử lý dữ liệu), thực hiện yêu cầu:
• Xây dựng mô hình học máy bằng thuật toán Bayes ngây thơ
Gợi ý: Để có thể áp dụng phân phối Gaussian cho mô hình, cần thực hiện mã hóa các ký tự được đại
diện bởi số. Ví dụ: 1 - Nam, 0 - Nữ.
7
Chương 3
K-Nearest Neighbor
Dự đoán với x = {Nhiệt độ : 24.6, Lượng mưa : 49, Gió : Mạnh} sẽ rơi vào lớp nào khi sử dụng thuật
toán kNN với k = 3 hoặc k = 5. Áp dụng hai phương pháp đo khoảng cách Euclid và Manhattan.
BÀI 2:
Mở rộng tập dữ liệu từ Bài 1:
Nhiệt độ Lượng mưa Gió Kết quả
32 12 Bình thường Không
21.3 67 Yếu Không
28.3 72 Yếu Có
24.3 54 Mạnh Không
19.7 16 Bình thường Có
Sử dụng dữ liệu sau khi kết hợp, dùng thuật toán kNN để dự đoán bảng dữ liệu sau.
Nhiệt độ Lượng mưa Gió Kết quả
11 78 Mạnh Không
24.3 77 Yếu Không
21.9 12 Yếu Có
29.3 09 Mạnh Có
8
Bảng 3.3: Bảng dữ liệu dự đoán
Giá trị k tốt nhất là bao nhiêu để bảng kết quả trên đạt tốt nhất.