Professional Documents
Culture Documents
Hệ thống gợi ý sản phẩm
Hệ thống gợi ý sản phẩm
Semantic Search là một phương pháp dùng để cải thiện độ chính xác trong việc hiểu nội dung
của query mà người dùng tìm kiếm. Thay vì việc tìm các nội dung dựa trên các kí tự chính xác
như các phương pháp truyền thống, thì semantic search thậm chí có thể tìm được các từ đồng
nghĩa. Nhờ đó, ta có thể tìm các Product có liên quan đến Product của người dùng tìm kiếm
bằng semantic search dựa trên trường “Group” của Product. Dùng cosine distance để tính độ
tương đồng về ngữ nghĩa của các câu. Cụ thể trong bài toán của ta sẽ là tính cosin distance giữa
các trường “Group” của từng Product. Khi đó cosine giữa 2 vector embedding của 2 câu tương
ứng càng gần 1.0 thì ngữ nghĩa và độ tương quan sẽ càng gần nhau. Sau đó ta có thể tính cosine
distance của Product ID input của người dùng, và tính một danh sách các độ tương quan cosine
giữa Product ID input và Product khác. Sau cùng ta có thể sắp xếp danh sách đó theo các tiêu chí
mà ta tự đề xuất ra như là (1) độ tương quan cosine, (2) giá sản phẩm, v.v. Từ đó có thể xuất ra
output là danh sách top 10, hoặc top 50 các Product liên quan đến Product ID input của người
dùng. Trong phương pháp thô này, ta sẽ dùng mô hình Sentence-Transformers cụ thể là
Vietnamese SBert để thực hiện việc embedding câu từ sang biểu diễn vector để có thể thực hiện
việc tính cosine distance.