Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 2

Giới thiệu về machine learnig:

Machine Learning (còn được gọi là học máy) là một lĩnh vự của trí tuệ nhân tạo mà
nó tập trung vào phát triển các thuật toán và mô hình có khả năng tự “học” dữ liệu
mà không cần được lập trình cụ thể. Nói một cách đơn giản là machine learning là
khả năng của máy tính học hỏi từ kinh nghiệm

Khi bước vào môn machine learning thì các thuật ngữ như kNN, Linear Regression,
Naive Bayes classifers, Decision Tree,... rất phổ biến.

GIới thiệu về kNN:


kNN là một thuật toán dựa trên sự dự đoán từ dữ liệu nhập vào trong giai đoạn huấn
luyện, thuật toán này lưu trữ toàn bộ tập dữ liệu huấn luyện làm tài liệu tham khảo.
Trước khi đưa ra kết quả phỏng đoán, nó sẽ tính toán khoảng cách dữ liệu nhập vào
và tất cả mẫu huấn luyện. Thuật toán kNN dựa trên khái niệm về sự tương đồng và
sự gần nhau nhất giữa các điểm dữ liệu.

Nhiệm vụ của kNN:


Thì nhiệm vụ của kNN là phân loại và hồi quy.

+ Phân loại là mục tiêu dự đoán lớp hoặc nhóm trong dữ liệu.
Ví dụ nếu mô hình đc huấn luyện để phân loại hình ảnh là “mèo” hoặc “chó”, khi bạn
cung cấp một bức ảnh mới, kNN sẽ xem xét “k” gần nhất và quyết định liệu đó là
hình ảnh mèo hay là chó.

+ Còn hồi quy thì mục tiêu dữ đoán một giá trị số, thường là giá trị liên tục. Thì trong
kNN, hồi quy thường áp dụng khi giá trị mục tiêu là liên tục và có thể được ước
lượng bàng cách lấy trung bình hoặc trung vị của giá trị của “k” gần nhất.
Ví dụ: Nếu mô hình đc huấn luyện để dự đoán giá nhà dựa trên diện tích, số phòng,
và vị trí, kNN sẽ xem xét K gần nhất dự đoán giá nhà dựa trên giá trị trung bình hoặc
trung vị của chúng

Tóm lại, trong kNN, có thể sử dụng cả phân loại và hồi quy đều được tùy thuộc bạn
muốn dự đoán cái gì

Giới thiệu về Linear Regression:


Linear Regression là một phương pháp được sử dụng để mô hình hóa mối quan hệ
tuyến tính giữa một biến phụ thuộc ( còn được gòi đối tượng cần dự đoán) và một
hoặc nhiều biến độc lập ( đặc trưng hoặc thuộc tính). Mục tiêu của Linear Regression
là tìm ra một đường thẳng đối với hồi quy đơn hoặc tìm ra một siêu phẳng đối với
hồi quy đa biến sao cho tổng bình phương của sự chệnh lệch giữa giá trị dự đoán và
giá trị thực tế là nhỏ nhất.
Làm rõ hồi quy đơn và hồi quy đa biến trong linear
regression:
Thì trong Linear Regression được chia thành 2 linear chính đó là hồi quy đơn và hồi
quy đa biến

Trong hồi quy đơn, chỉ có một biến độc lập được sử dụng để dự đoán biến phụ
thuộc. Mô hình tuyến tính đơn có dạng là

You might also like