Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 2

1.

Hệ thống gợi ý sản phẩm


Từ dữ liệu ban đầu, chúng ta có thể xây dựng một hệ thống đề xuất các sản phẩm liên quan đến
sản phẩm mà người dùng tìm kiếm. Một trong nhiều cách phổ biến để xây dựng một hệ thống
đó là Semantic Search.

Semantic Search là một phương pháp dùng để cải thiện độ chính xác trong việc hiểu nội dung
của query mà người dùng tìm kiếm. Thay vì việc tìm các nội dung dựa trên các kí tự chính xác
như các phương pháp truyền thống, thì semantic search thậm chí có thể tìm được các từ đồng
nghĩa. Nhờ đó, ta có thể tìm các Product có liên quan đến Product của người dùng tìm kiếm
bằng semantic search dựa trên trường “Group” của Product. Dùng cosine distance để tính độ
tương đồng về ngữ nghĩa của các câu. Cụ thể trong bài toán của ta sẽ là tính cosin distance giữa
các trường “Group” của từng Product. Khi đó cosine giữa 2 vector embedding của 2 câu tương
ứng càng gần 1.0 thì ngữ nghĩa và độ tương quan sẽ càng gần nhau. Sau đó ta có thể tính cosine
distance của Product ID input của người dùng, và tính một danh sách các độ tương quan cosine
giữa Product ID input và Product khác. Sau cùng ta có thể sắp xếp danh sách đó theo các tiêu chí
mà ta tự đề xuất ra như là (1) độ tương quan cosine, (2) giá sản phẩm, v.v. Từ đó có thể xuất ra
output là danh sách top 10, hoặc top 50 các Product liên quan đến Product ID input của người
dùng. Trong phương pháp thô này, ta sẽ dùng mô hình Sentence-Transformers cụ thể là
Vietnamese SBert để thực hiện việc embedding câu từ sang biểu diễn vector để có thể thực hiện
việc tính cosine distance.

You might also like