Professional Documents
Culture Documents
Mô Hình Linear Regression
Mô Hình Linear Regression
Mô Hình Linear Regression
Giải thích vì sao chọn hàm Means Squared Error (MSE) cho mô hình Linear Regression?
Viết theo phong cách Problem - Why - Solution cho các ứng viên hàm độ lỗi.
Trong mô hình hồi quy tuyến tính, dữ liệu đầu ra phụ thuộc tuyến tính với dữ liệu đầu vào. Biểu
đồ thường được vẽ để trực quan hóa xu hướng chung của toàn bộ dữ liệu.
Hàm độ lỗi trả về một số không âm thể hiện mức độ chênh lệch giữa giá trị mô hình của chúng ta
dự đoán và giá trị thực tế. Mức độ chênh lệch ở đây chính là tất cả các đường màu xanh được biểu
diễn như hình trên. Vậy, ta sẽ có một hàm thể hiện trung bình tổng các đại lượng sai lệch.
Một trong những hàm độ lỗi được sử dụng phổ biến cho bài toán hồi quy là khoảng cách Euclid
Giá trị trung bình của khoảng cách từ mỗi điểm đến mô hình hồi quy dự đoán được tính toán và
hiển thị dưới dạng sai số bình phương trung bình (Mean Squared Error). Ở đây, bình phương là
bước quan trọng để giảm độ phức tạp với các dấu âm.
Việc xác định độ lỗi của mô hình cần được thực hiện trên nhiều mẫu dữ liệu huấn luyện → Hàm
độ lỗi cần được tính bằng trung bình sai số cho từng mẫu dữ liệu huấn luyện. Nếu như không chia
trung bình cho số mẫu, độ lỗi sẽ trở nên thiếu thực tế.
Công thức độ lỗi được chia thêm cho 2 là để thuận tiện cho bước tính đạo hàm.