Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 3

Báo cáo Bài thực hành 5

Bộ dữ liệu: Human Activity Recognition Using Smartphones Data Set

Accuracy

Model Mean Cross Validation scores Accuracy score


SVM 0.932151794 0.963106796
kNN 0.97099124 0.978640777
RF 0.972569205 0.972330097
LDA 0.923170327 0.91407767

Sau khi tuning mô hình sử dụng Gridsearch CV thì kết quả của mô hình kNN ra
kết quả tốt nhất. Kết quả của mô hình LDA cho ra kết quả thấp nhất

Model Mean Cross Validation scores Accuracy score


LDA 0.918946555 0.920679612
RF 0.97281213 0.974563107
SVM 0.931229552 0.970582524
kNN 0.967859951 0.98038835

Ở bảng kết quả sau khi chạy 5 lần với 5 seed khác nhau khi thực hiện chia dữ liệu
thành 2 tập train test thì xếp hạng độ chính xác của mô hình cũng không có gì thay đổi

Confusion Matrix
Mô hình Kneighbors Mô hình Random Forest

Mô hình SVC Mô hình LDA

Nhìn vào kết quả của các ma trận nhầm lẫn thì có thể thấy rằng ma trận này được chia làm 2
nhóm là các labels từ 1 đến 3 (0 đến 2) trong ma trận và các labels từ 4 đến 6 (3 đến 5) trong ma trận
bởi vì các hoạt động như walking, walking upstairs, walking downstairs là những hành động sẽ có
điểm chung và các hành động sitting, standing, laying cũng như vậy. Và cuối cùng là nhãn dữ đoán
giữa sitting và standing có tỉ lệ sai nhiều nhất ở cả 4 phương pháp vì 2 hành động này có nhiều điểm
chung nhất khi đeo thiết bị đo trên eo. Còn hành động có tỉ lệ dự đoán chính xác 100%(cao nhất) là
hành động nằm vì hành động này các thông số trên trục tọa độ là khác biệt nhất với các hành động
còn lại.
Bộ dữ liệu: Iris

Accuracy

Model Mean Cross Validation scores Accuracy score


SVM 0.941666667 1
kNN 0.966666667 1
RF 0.941666667 0.966666667
LDA 0.983333333 0.966666667

Với bộ dữ liệu Iris thì mô hình SVM, kNN có độ chính xác là 1 và còn mô hình RF,
LDA có độ chính xác thấp hơn là 9,67.

Model Mean Cross Validation scores Accuracy score


LDA 0.975 0.98
RF 0.935 0.973333333
SVM 0.955 0.986666667
kNN 0.953333333 0.986666667
Ở bảng kết quả sau khi chạy 5 lần với 5 seed khác nhau khi thực hiện chia dữ liệu
thành 2 tập train test thì xếp hạng độ chính xác của mô hình có sự thay đổi. Mô hình SVM
và kNN có độ chính xác trung bình là 0.987 còn mô hình RF có độ chính xác thấp nhất.

Bộ dữ liệu: Wine+quality

Model Mean Cross Validation scores Accuracy score


SVM 0.432750611 0.542307692
kNN 0.460652439 0.597692308
RF 0.66596487 0.687692308
LDA 0.53646165 0.532307692
Kết quả thu được của bộ dữ liệu này khá thấp một phần vì không xử dụng Stratified để
chia dữ liệu một phần là do sự mất cân xứng của dữ liệu khiến cho kết quả không được
cao.Trong đó mô hình RF cho kết quả tốt nhất còn mô hình LDA cho kết quả thấp nhất. Về
hiệu suất khi vẽ ma trận nhầm lẫn thì tỉ lệ dữ đoán sai giữa 2 nhãn 1 và 7 là cao nhất vì dữ
liệu của 2 nhãn này là khá ít.

You might also like