Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 48

ỦY BAN NHÂN DÂN THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC SÀI GÒN


KHOA CÔNG NGHỆ THÔNG TIN

Đề cương tiểu luận học phần Đồ án chuyên ngành

Nghiên cứu về Ứng dụng của Sentiment Analysis trong xây


dựng Chuyển đổi Số ở trường Đại học

GVHD:Phan Tấn Quốc

Sinh viên:Trần Vũ Ngọc Thành

TP. HỒ CHÍ MINH, THÁNG 02 NĂM 2024


LỜI CAM ĐOAN
Trong thời đại hiện đại, vai trò của công nghệ trong giáo dục đã trở nên không thể phủ
nhận. Sự tiến bộ của công nghệ thông tin và truyền thông (ICT) đã tạo ra một bước đột
phá trong cách mà giáo viên giảng dạy và sinh viên học tập. Tôi, Trần Vũ Ngọc Thành,
cam đoan rằng đề tài "Nghiên cứu về Ứng dụng của Sentiment Analysis trong xây dựng
Chuyển đổi Số ở trường Đại học", cam đoan rằng đề tài này được thực hiện với sự chân
thành và tận tâm. Dưới đây là cam đoan chi tiết của tôi:

Cam đoan về Mục Đích và Tính Chính Xác: Tôi cam đoan rằng mục đích của đề tài là
nghiên cứu sâu về cách Sentiment Analysis có thể được áp dụng để hiểu cảm xúc, ý kiến
và suy nghĩ của cộng đồng giáo dục đại học về quá trình chuyển đổi số. Tôi cam kết cung
cấp thông tin chính xác và đáng tin cậy, dựa trên nghiên cứu kỹ lưỡng và dữ liệu thu thập
một cách tỉ mỉ.

Cam đoan về Tính Độc Lập và Min Rằng: Tôi cam đoan rằng quá trình nghiên cứu và
phân tích trong đề tài này được thực hiện một cách độc lập và min rằng. Tôi đảm bảo rằng
tất cả dữ liệu và thông tin được sử dụng đều được trình bày minh bạch và không bị ảnh
hưởng bởi bất kỳ yếu tố nào từ bên thứ ba.

Cam đoan về Tính Bảo Mật của Dữ Liệu: Tôi cam đoan rằng tất cả thông tin cá nhân và
dữ liệu nghiên cứu sẽ được bảo mật và chỉ sử dụng cho mục đích nghiên cứu. Tôi cam kết
tuân thủ mọi quy định và chuẩn mực về bảo vệ dữ liệu.

i
Cam đoan về Tính Công Bằng và Không Thiên Vị: Tôi cam đoan rằng quá trình nghiên
cứu và phân tích được thực hiện một cách công bằng và không thiên vị. Tôi đảm bảo rằng
tất cả ý kiến và quan điểm được xem xét và trình bày một cách khách quan và không bị
ảnh hưởng bởi bất kỳ yếu tố nào.

Cam đoan về Tính Đáng Tin Cậy của Kết Quả: Tôi cam đoan rằng kết quả của đề tài này
được trình bày một cách minh bạch và logic, dựa trên dữ liệu và phân tích có tính đáng tin
cậy. Tôi không làm giả mạo hoặc biến tấu dữ liệu để đạt được kết quả mong muốn.

ii
MỤC LỤC

LỜI CAM ĐOAN.......................................................................................................i

MỤC LỤC.................................................................................................................ii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT...........................................iii

LỜI MỞ ĐẦU...........................................................................................................1

Chương 1: Tổng quan về nhu cầu đánh giá, cảm nhận và phản hồi trong môi trường học
tập số ................................................................................................................................................3

1.1 Giới thiệu về nhu cầu đánh giá, cảm nhận và phản hồi trong môi trường học
tập số.....................................................................................................................................3

1.2.Ứng dụng về đánh giá, cảm nhận, phản hồi trong môi trường học tập số..........6

1.2.1. Tạo sự tương tác......................................................................................6

1.2.2. Xây dựng cộng đồng học tập...................................................................7

1.2.3.Phản hồi cá nhân hoá................................................................................8

1.2.4. Theo dõi tiến trình học tập.......................................................................9

1.3. Hệ thống dữ liệu thực nghiệm cho Nghiên cứu về Cảm xúc trong Giáo dục
Đại học................................................................................................................................10

1.3.1. Giao diện thu thập dữ liệu......................................................................10

1.3.2. Hệ thống lưu trữ dữ liệu.........................................................................11

1.3.3. Công cụ phân tích dữ liệu.......................................................................12

1.3.4. Bảo mật và quản lí quyền truy cập.........................................................13

1.3.5.Giao diện thống kê và báo cáo................................................................14

1.4. Khảo sát các công bố liên quan.......................................................................15

Chương 2: Thuật toán Sentiment Analysis.........................................................................17

iii
2.1.Định nghĩa Sentiment Analysis .......................................................................17

2.2. Đóng góp của thuật toántrong môi trường học tập số....................................18

2.2.1. Về đánh gía............................................................................................18

2.2.1. Về cảm nhận..........................................................................................19

2.2.1. Về phản hồi............................................................................................19

2.3. Các phương pháp Sentiment Analysis.............................................................20

2.3.1. Naive Bayes...........................................................................................20

2.3.1.1. Nguyên lý hoạt động................................................................20

2.3.1.2. Ưu điểm và nhược điểm...........................................................22

2.3.2. Support Vector Machine (SVM)...........................................................24

2.3.2.1. Nguyên lý hoạt động................................................................24

2.3.2.2. Ưu điểm và nhược điểm...........................................................26

2.3.3. Recurrent Neural Networks (RNN).......................................................27

2.3.3.1. Nguyên lý hoạt động................................................................27

2.3.3.2. Ưu điểm và nhược điểm...........................................................28

2.3.4. Long Short-Term Memory (LSTM)......................................................30

2.3.4.1. Nguyên lý hoạt động................................................................30

2.3.4.2. Ưu điểm và nhược điểm...........................................................31

2.4. Triển khai thuật toán.......................................................................................32

2.4.1. Thu thập dữ liệu từ các nền tảng học tập trực tuyến............................32

2.4.2. Tiền xử lý dữ liệu văn bản....................................................................33

2.4.3. Xây dựng và huấn luyện mô hình Sentiment Analysis........................34

2.4.4. Áp dụng mô hình để đánh giá cảm nhận của học sinh đối với các khóa
học, tài liệu học, v.v............................................................................................................35

iv
2.4.5. Tạo ra phản hồi tự động dựa trên kết quả Sentiment Analysis để cải
thiện trải nghiệm học tập của học sinh và tương tác giữa học sinh và giáo viên...............37

Chương 3: thực nghiệm và đánh giá ....................................................................................x

3.1. Chuẩn bị Thực nghiệm......................................................................................x

3.2. Triển khai...........................................................................................................x

3.3.Thực Hiện Thử nghiệm......................................................................................x

3.4. Đánh Giá Kết Quả.............................................................................................x

3.5. Xử Lý và Báo Cáo Kết Quả...............................................................................x

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .............................................................16

TÀI LIỆU THAM KHẢO ......................................................................................17

PHỤ LỤC ...............................................................................................................18

v
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

vi
LỜI MỞ ĐẦU

Trong thời đại số hóa ngày nay, việc đánh giá, cảm nhận và phản hồi trong môi trường
học tập không chỉ là một nhu cầu mà còn là một yếu tố quan trọng giúp cải thiện chất
lượng giáo dục. Khả năng đo lường sự hài lòng, nhận xét phản biện từ sinh viên và giảng
viên không chỉ giúp hiểu rõ hơn về quá trình học tập mà còn tạo ra cơ sở để thúc đẩy sự
phát triển và cải tiến.

Phần ứng dụng về đánh giá, cảm nhận và phản hồi trong môi trường học tập số tập trung
vào các cách mà các yếu tố này được áp dụng để tạo ra trải nghiệm học tập tích cực và
hiệu quả hơn cho sinh viên. Cụ thể, phần này bao gồm các ứng dụng sau: Tạo sự tương
tác, Xây dựng cộng đồng học tập, Phản hồi cá nhân hoá và Theo dõi tiến trình học tập.
Tạo sự tương tác bao gồm các hoạt động tương tác giữa sinh viên và nội dung học tập để
thúc đẩy sự tham gia và học hỏi. Xây dựng cộng đồng học tập tạo ra một môi trường chia
sẻ thông tin và kinh nghiệm giữa sinh viên và giáo viên. Phản hồi cá nhân hoá cung cấp
phản hồi và hướng dẫn cá nhân hóa dựa trên nhu cầu và tiến trình học tập của từng sinh
viên. Cuối cùng, theo dõi tiến trình học tập giúp sinh viên tự đánh giá hiệu suất của mình
và nhận được hỗ trợ kịp thời từ giảng viên.

Trong đề tài nghiên cứu về Ứng dụng của Sentiment Analysis trong xây dựng Chuyển đổi
Số ở trường Đại học, đồ án chuyên ngành của chúng tôi không chỉ nhấn mạnh vào việc áp
dụng công nghệ để tối ưu hóa quy trình đánh giá, cảm nhận và phản hồi mà còn đề xuất
các phương pháp và công cụ mới nhằm nâng cao hiệu quả của quá trình này. Chúng tôi hy
vọng rằng nghiên cứu của mình sẽ đóng góp một phần nhỏ vào việc thúc đẩy sự tiến bộ

1
trong lĩnh vực giáo dục số và xây dựng một môi trường học tập mở, linh hoạt và hiệu quả
hơn.

Bài nghiên cứu của chúng tôi tập trung vào việc đánh giá, cảm nhận và phản hồi trong
môi trường học tập số, với sự tập trung đặc biệt vào việc hiểu sâu về cảm xúc trong giáo
dục đại học. Cấu trúc của bài nghiên cứu được tổ chức thành bốn chương chính, mỗi
chương đề cập đến một phần quan trọng của quá trình nghiên cứu và phát triển: Chương
1: Nhu cầu về đánh giá, cảm nhận, phản hồi trong môi trường học tập số - Giới thiệu về
hiểu sâu về cảm xúc trong giáo dục đại học - Ứng dụng về đánh giá, cảm nhận, phản hồi
trong môi trường học tập số - Hệ thống dữ liệu thực nghiệm cho Nghiên cứu về Cảm xúc
trong Giáo dục Đại học - Khảo sát các công bố liên quan đến nghiên cứu về cảm xúc
trong giáo dục đại học. Chương 2: Đề xuất thuật toán - Giới thiệu về thuật toán Sentiment
Analysis - Đóng góp của thuật toán. Chương 3: Thuật toán Sentiment Analysis - Mô tả
thuật toán - Thuật toán và công cụ - Tổ chức thuật toán - Triển khai thuật toán. Chương 4:
Thực nghiệm và đánh giá - Chuẩn bị Thực nghiệm - Triển khai - Thực Hiện Thử nghiệm -
Đánh Giá Kết Quả - Xử Lý và Báo Cáo Kết Quả. Với cấu trúc này, chúng tôi sẽ đi sâu
vào các khía cạnh khác nhau của vấn đề, từ việc đặt ra câu hỏi nghiên cứu và lý do quan
trọng của chủ đề, đến việc phát triển và triển khai thuật toán cũng như đánh giá kết quả và
kết luận. Điều này giúp chúng tôi cung cấp một cái nhìn toàn diện và chi tiết về quá trình
nghiên cứu và ứng dụng của nó trong thực tế.

2
Chương 1. TỔNG QUAN VỀ NHU CẦU ĐÁNH GIÁ, CẢM
NHẬN VÀ PHẢN HỒI TRONG MÔI TRƯỜNG HỌC TẬP SỐ
1.1 Giới thiệu về nhu cầu đánh giá, cảm nhận và phản hồi trong môi trường học tập số

Môi trường học tập trực tuyến đã trải qua một sự phát triển đáng kể từ những bước đầu
tiên cho đến hiện tại, với vai trò không thể phủ nhận của công nghệ thông tin và truy cập
internet trong việc cung cấp giáo dục. Trong những năm đầu của internet và công nghệ
thông tin, môi trường học tập trực tuyến bắt đầu với các hình thức đơn giản như email và
các diễn đàn trực tuyến. Giáo viên và học viên có thể giao tiếp qua email và thảo luận trên
các diễn đàn để trao đổi thông tin và ý kiến. Với sự phát triển của công nghệ, các công cụ
học tập trực tuyến đã trở nên phong phú và đa dạng hơn. Nền tảng học trực tuyến, các hệ
thống quản lý học tập (LMS), và các ứng dụng học tập đã được phát triển, cung cấp cho
giáo viên và học viên một môi trường linh hoạt và tương tác. Video học, bài giảng trực
tuyến, và các tài liệu đa phương tiện đã trở thành phổ biến, tạo điều kiện cho một trải
nghiệm học tập sâu sắc và đa chiều. Sự phổ biến của internet và truy cập rộng rãi đã mở
ra cơ hội học tập không giới hạn. Người học không còn bị giới hạn bởi thời gian và không
gian, họ có thể truy cập vào các tài liệu và tài nguyên học tập từ bất kỳ nơi đâu và bất kỳ
lúc nào chỉ cần có kết nối internet. Điều này mở ra cánh cửa cho việc học tập tự học và
liên tục, khuyến khích sự tự chủ và sự sáng tạo trong quá trình học. Công nghệ thông tin
đã trở thành một phần không thể tách rời của môi trường học tập trực tuyến. Tích hợp các
công nghệ mới như trí tuệ nhân tạo (AI), thực tế ảo (VR), và học máy đã mở ra cơ hội
mới để cá nhân hóa và tối ưu hóa quá trình học tập. Các công nghệ này giúp tạo ra trải
nghiệm học tập tương tác và hấp dẫn hơn, giúp học viên hiểu sâu hơn và áp dụng kiến
thức một cách linh hoạt và sáng tạo. Trong môi trường học tập số, đánh giá đóng vai trò
vô cùng quan trọng trong việc đo lường sự tiến bộ của học viên, định hình quá trình học

3
tập, và cung cấp phản hồi cần thiết cho cả giáo viên và học viên. Việc đánh giá không chỉ
là một phần không thể thiếu của quá trình học tập mà còn là công cụ giúp cải thiện chất
lượng giáo dục. Thứ nhất, đánh giá giúp đo lường sự tiến bộ và thành tựu của học viên.
Bằng cách đánh giá hiệu quả, giáo viên có thể định lượng được mức độ hiểu biết, kỹ năng
và khả năng áp dụng của học viên đối với nội dung học tập. Điều này giúp xác định
những điểm mạnh và điểm yếu của từng học viên, từ đó tạo điều kiện cho việc cá nhân
hóa học tập và cung cấp hỗ trợ phù hợp. Thứ hai, đánh giá là công cụ quan trọng để định
hình quá trình học tập. Dựa trên kết quả đánh giá, giáo viên có thể điều chỉnh phương
pháp giảng dạy, nội dung bài học và các hoạt động học tập để đáp ứng nhu cầu cụ thể của
từng học viên. Điều này giúp tối ưu hóa quá trình học tập và tạo điều kiện cho sự phát
triển toàn diện của học viên.Thứ ba, đánh giá cung cấp phản hồi quan trọng cho cả giáo
viên và học viên. Phản hồi từ quá trình đánh giá giúp học viên hiểu rõ hơn về điểm mạnh
và điểm yếu của mình, từ đó có thể tập trung vào việc cải thiện và phát triển. Đồng thời,
phản hồi cũng giúp giáo viên đánh giá hiệu quả của phương pháp giảng dạy và xác định
các điểm cần cải thiện để tối ưu hóa quá trình giảng dạy. Ngoài những điểm đã đề cập,
việc đánh giá trong môi trường học tập số còn đóng vai trò quan trọng trong việc đảm bảo
công bằng và minh bạch trong quá trình học tập. Khi sử dụng các hình thức đánh giá đa
dạng như bài kiểm tra trực tuyến, bài tập thảo luận, dự án nhóm, hoặc phản hồi từ cộng
đồng trực tuyến, các giáo viên có thể tạo ra một quá trình đánh giá linh hoạt và công bằng
cho tất cả học viên, không phụ thuộc vào vị trí địa lý hay điều kiện cá nhân. Đánh giá
cũng giúp tạo ra một môi trường học tập tích cực bằng cách khuyến khích sự tham gia và
sự cam kết từ phía học viên. Khi học viên nhận thức được rằng việc tham gia tích cực vào
các hoạt động đánh giá không chỉ ảnh hưởng đến điểm số mà còn là cơ hội để họ hiểu sâu
hơn về chủ đề, phát triển kỹ năng và kiến thức, họ sẽ cảm thấy được động viên và hỗ trợ
để tham gia hoạt động học tập. Một khía cạnh khác của việc đánh giá trong môi trường
học tập số là vai trò của dữ liệu trong việc cải thiện quá trình học tập. Dữ liệu thu thập từ
các hoạt động đánh giá có thể được phân tích để đo lường hiệu quả của các phương pháp
giảng dạy, xác định các khu vực mà học viên gặp khó khăn và cung cấp các giải pháp phù
4
hợp. Điều này giúp tạo ra một chu trình phản hồi liên tục, giúp cải thiện chất lượng giáo
dục theo thời gian. Đánh giá trong môi trường học tập trực tuyến không chỉ giúp xác định
mức độ hiểu biết và kỹ năng của học viên, mà còn là công cụ để đo lường sự tham gia và
tiến bộ của họ. Từ việc hoàn thành bài tập đến tham gia vào các hoạt động trao đổi trực
tuyến, các hình thức đánh giá có thể đa dạng để phản ánh đầy đủ các khía cạnh của quá
trình học tập. Điều này cung cấp cho giáo viên và học viên một cái nhìn tổng quan về
những gì đã được đạt được và những điểm cần được cải thiện, từ đó giúp họ điều chỉnh
phương pháp học tập và giảng dạy một cách hiệu quả hơn. Ngoài việc đánh giá, cảm nhận
và phản hồi từ cả hai phía cũng giúp xây dựng một môi trường học tập tích cực. Sự phản
hồi xây dựng từ giáo viên không chỉ giúp học viên hiểu được điểm mạnh và điểm yếu của
mình mà còn cung cấp hướng dẫn và khuyến khích để họ phát triển và nâng cao kỹ năng.
Ngược lại, sự phản hồi từ học viên giúp giáo viên hiểu rõ hơn về nhu cầu và mong muốn
của họ, từ đó có thể tùy chỉnh quy trình giảng dạy và cung cấp hỗ trợ cá nhân hóa.

Áp dụng phản hồi và điều chỉnh trong môi trường học tập số đóng vai trò quan trọng
trong việc tạo ra một quá trình học tập linh hoạt, tích cực và hiệu quả. Phản hồi không chỉ
giúp học viên hiểu rõ hơn về điểm mạnh và điểm yếu của mình mà còn cung cấp hướng
dẫn cụ thể để họ cải thiện và phát triển. Đồng thời, phản hồi cũng là công cụ quan trọng
giúp giáo viên điều chỉnh quá trình giảng dạy và nội dung học tập để đáp ứng nhu cầu cụ
thể của từng học viên. Một trong những tầm quan trọng lớn nhất của việc áp dụng phản
hồi và điều chỉnh trong môi trường học tập số là khả năng cá nhân hóa học tập. Dựa trên
phản hồi từ học viên, giáo viên có thể tùy chỉnh nội dung và phương pháp giảng dạy để
đáp ứng nhu cầu học tập cụ thể của từng học viên. Việc này giúp tạo ra một quá trình học
tập linh hoạt và phù hợp với đặc điểm và năng lực của từng cá nhân, từ đó tối ưu hóa hiệu
quả học tập. Ngoài ra, áp dụng phản hồi và điều chỉnh cũng giúp tạo ra một môi trường
học tập tích cực và động viên. Bằng cách cung cấp phản hồi xây dựng và khuyến khích,
giáo viên có thể thúc đẩy sự tự tin và sự cam kết từ phía học viên. Học viên sẽ cảm thấy

5
được động viên để tiếp tục nỗ lực và cải thiện khi họ nhận thấy rằng những nỗ lực của
mình được đánh giá và đánh giá một cách công bằng và xây dựng. Cuối cùng, việc áp
dụng phản hồi và điều chỉnh giúp tạo ra một quá trình học tập không ngừng phát triển và
cải thiện. Thông qua việc phân tích kết quả đánh giá và phản hồi từ học viên, giáo viên có
thể xác định các điểm mạnh và điểm yếu của quá trình giảng dạy, từ đó điều chỉnh và cải
thiện quá trình đào tạo theo thời gian. Điều này giúp duy trì sự linh hoạt và tích cực trong
môi trường học tập số, đồng thời đảm bảo rằng quá trình học tập luôn đáp ứng được
những thay đổi và yêu cầu của học viên.

1.2 Ứng dụng về đánh giá, cảm nhận, phản hồi trong môi trường học tập số

1.2.1. Tạo sự tương tác

Trong môi trường học tập số, tạo sự tương tác trong quá trình đánh giá, cảm nhận và phản
hồi là một yếu tố quan trọng giúp tăng cường sự tham gia và hiệu quả học tập của học
viên. Phản hồi tức thì trên các bài tập và bài kiểm tra giúp học viên nhận biết được điểm
mạnh và điểm yếu của mình, từ đó khuyến khích họ tiếp tục nỗ lực và cải thiện.

Việc sử dụng các công cụ tương tác trực tuyến như diễn đàn thảo luận và phòng trò
chuyện tạo ra một không gian cho sự trao đổi ý kiến và kinh nghiệm giữa giáo viên và học
viên, cũng như giữa các học viên với nhau. Điều này giúp họ cảm thấy được động viên và
hỗ trợ, từ đó tạo ra một môi trường học tập đa dạng và phong phú.

Phản hồi cá nhân hóa từ giáo viên giúp tạo sự tương tác cá nhân, động viên và hướng dẫn
riêng cho từng học viên, từ đó khuyến khích sự độc lập và trách nhiệm cá nhân trong quá
trình học.

6
Sử dụng các công cụ tương tác như trò chơi giáo dục và bài giảng tương tác giúp tạo ra
một môi trường học tập thú vị và kích thích. Những công cụ này không chỉ giúp học viên
hấp thụ thông tin một cách hiệu quả mà còn tạo ra cơ hội cho sự tương tác và hợp tác giữa
các học viên.

Tóm lại, tạo sự tương tác trong quá trình đánh giá, cảm nhận và phản hồi là chìa khóa để
tạo ra một môi trường học tập số tích cực và hỗ trợ cho học viên. Sự tương tác này
khuyến khích sự tham gia, động viên và tạo ra một trải nghiệm học tập đa dạng và phong
phú.

1.2.2. Xây dựng cộng đồng học tập

Trong môi trường học tập số, việc xây dựng cộng đồng học tập từ việc đánh giá, cảm
nhận và phản hồi đóng vai trò quan trọng trong việc tạo ra một môi trường học tập tích
cực và động viên. Bằng cách thúc đẩy sự tương tác và hợp tác giữa giáo viên và học viên,
cũng như giữa các học viên với nhau, một cộng đồng học tập đa dạng và phong phú được
hình thành.

Việc tạo ra các diễn đàn thảo luận và phòng trò chuyện trực tuyến là một cách hiệu quả để
khuyến khích sự giao tiếp và chia sẻ thông tin giữa các thành viên trong cộng đồng.
Thông qua việc trao đổi ý kiến, hỏi đáp và chia sẻ kinh nghiệm, học viên có thể học hỏi
và hỗ trợ lẫn nhau, từ đó tạo ra một không khí tích cực và hỗ trợ.

Đồng thời, việc cung cấp phản hồi cá nhân hóa giúp mỗi học viên cảm thấy được quan
tâm và động viên. Phản hồi cụ thể và hướng dẫn riêng cho từng học viên dựa trên nhu cầu

7
và mức độ hiểu biết của họ giúp họ cảm thấy được đánh giá và động viên, từ đó tạo ra
một cảm giác thuộc về một cộng đồng học tập chân thành và hỗ trợ.

Ngoài ra, việc thúc đẩy các hoạt động học tập nhóm và các dự án thực hành giúp tạo ra
một môi trường học tập tương tác và hợp tác. Thông qua việc làm việc cùng nhau và giải
quyết các vấn đề thực tiễn, học viên có cơ hội phát triển kỹ năng giao tiếp và làm việc
nhóm, từ đó xây dựng một cộng đồng học tập mạnh mẽ và sôi động.

Việc tạo sự tương tác và hợp tác trong việc đánh giá, cảm nhận và phản hồi không chỉ
giúp cải thiện hiệu suất học tập mà còn tạo ra một môi trường học tập tích cực và động
viên. Sự tương tác này giúp xây dựng một cộng đồng học tập đa dạng và phong phú, nơi
mỗi thành viên đều cảm thấy được đánh giá và hỗ trợ.

1.2.3. Phản hồi cá nhân hoá

Việc áp dụng phản hồi cá nhân hoá từ việc đánh giá và cảm nhận đóng vai trò quan trọng
trong việc tối ưu hóa trải nghiệm học tập của học viên. Thay vì tiếp cận một cách chuẩn
mực, phản hồi cá nhân hoá cho phép giáo viên tùy chỉnh quá trình đánh giá và phản hồi
dựa trên nhu cầu và mức độ hiểu biết của từng học viên cụ thể.

Bằng cách cung cấp phản hồi cụ thể và hướng dẫn cá nhân hóa, giáo viên có thể tạo ra
một môi trường học tập linh hoạt và phản ánh nhu cầu riêng của từng học viên. Điều này
không chỉ giúp học viên cảm thấy được đánh giá và quan trọng, mà còn khuyến khích họ
tham gia tích cực hơn vào quá trình học tập.

Hơn nữa, phản hồi cá nhân hoá tạo ra một cảm giác của sự quan tâm và hỗ trợ từ phía
giáo viên. Việc giáo viên hiểu rõ nhu cầu và điểm mạnh, yếu của học viên giúp tạo ra một

8
môi trường học tập đồng cảm và động viên. Điều này có thể giúp học viên phát triển sự tự
tin và lòng tin vào khả năng của bản thân, từ đó tăng cường sự cam kết và hiệu suất học
tập.

Cuối cùng, phản hồi cá nhân hoá không chỉ là công cụ để cải thiện hiệu suất học tập mà
còn là yếu tố quan trọng trong việc xây dựng một môi trường học tập tích cực và đồng
cảm. Sự tương tác giữa giáo viên và học viên trong quá trình cung cấp và nhận phản hồi
cá nhân hoá là chìa khóa để tạo ra một môi trường học tập đa dạng và phong phú, nơi mỗi
học viên đều được đánh giá và hỗ trợ theo cách riêng của họ.

1.2.4. Theo dõi tiến trình học tập

Việc theo dõi tiến trình học tập thông qua đánh giá, cảm nhận và phản hồi đóng vai trò
quan trọng trong việc đảm bảo sự tiến bộ và thành công của học viên. Thông qua việc liên
tục đánh giá và cung cấp phản hồi, giáo viên có thể định hình và điều chỉnh quá trình học
tập theo hướng phù hợp nhất cho từng học viên.

Điều này mang lại lợi ích lớn cho học viên khi họ nhận ra được điểm mạnh và điểm yếu
của mình. Những phản hồi cụ thể và chi tiết từ giáo viên giúp họ hiểu rõ hơn về tiến trình
học tập của mình và xác định được những mục tiêu cụ thể để phát triển.

Sử dụng công nghệ trong việc theo dõi tiến trình học tập cũng là một phương tiện hiệu
quả. Các hệ thống quản lý học tập và phần mềm theo dõi tiến trình giúp tự động hóa quá
trình đánh giá và cung cấp phản hồi. Điều này không chỉ giúp giảm bớt gánh nặng công
việc cho giáo viên mà còn tạo ra cơ hội cho học viên nhận phản hồi nhanh chóng và có cơ
hội cải thiện ngay lập tức.

9
Ngoài ra, việc liên tục theo dõi tiến trình học tập cũng giúp học viên phát triển kỹ năng tự
quản lý học tập. Họ học cách tự đánh giá và tự phản hồi, từ đó trở nên tự tin hơn trong
việc đặt ra mục tiêu và quản lý thời gian học tập của mình.

Tóm lại, việc theo dõi tiến trình học tập thông qua đánh giá, cảm nhận và phản hồi không
chỉ giúp học viên tiến bộ mà còn giúp họ phát triển kỹ năng tự quản lý học tập. Điều này
đóng vai trò quan trọng trong việc xây dựng một môi trường học tập tích cực và đồng
cảm, nơi mỗi học viên đều được đánh giá và hỗ trợ theo cách riêng của họ.

1.3 Hệ thống dữ liệu thực nghiệm cho Nghiên cứu về Cảm xúc trong Giáo dục Đại học

1.3.1. Giao diện thu thập dữ liệu

Giao diện thu thập dữ liệu là một phần quan trọng của hệ thống, cung cấp một giao diện
trực tuyến hoặc ứng dụng di động để sinh viên hoặc người tham gia nghiên cứu có thể
cung cấp thông tin về cảm xúc của họ trong quá trình học tập. Giao diện này được thiết kế
một cách tự nhiên và dễ sử dụng, đồng thời tạo ra một không gian an toàn và thuận tiện
cho việc chia sẻ cảm xúc.

Trong giao diện này, thông tin về cảm xúc có thể được thu thập thông qua các phương
tiện khác nhau như câu hỏi, bảng điểm cảm xúc hoặc các phương pháp thu thập dữ liệu
khác như hình ảnh, video hoặc âm thanh. Các câu hỏi có thể được thiết kế một cách cụ thể
và chi tiết để thu thập thông tin chính xác về cảm xúc của người dùng, bao gồm cảm xúc
tích cực và tiêu cực, mức độ của chúng và nguyên nhân gây ra.

10
Đối với các phương pháp thu thập dữ liệu khác như hình ảnh, video hoặc âm thanh, giao
diện thu thập dữ liệu có thể cung cấp các công cụ cho phép người dùng tải lên hoặc ghi lại
các tình huống hoặc biểu hiện cảm xúc của họ. Điều này giúp tạo ra một bức tranh toàn
diện hơn về cảm xúc của người dùng và cung cấp thông tin chính xác và đáng tin cậy cho
quá trình nghiên cứu.

1.3.2. Hệ thống lưu trữ dữ liệu

Hệ thống lưu trữ dữ liệu cũng là một phần quan trọng của hệ thống, giúp lưu trữ thông tin
về cảm xúc được thu thập từ giao diện thu thập dữ liệu một cách an toàn và có tổ chức.
Trong hệ thống này, dữ liệu cảm xúc được lưu trữ trong một cơ sở dữ liệu có cấu trúc, cho
phép truy xuất và quản lý dữ liệu một cách hiệu quả.

Cơ sở dữ liệu được thiết kế để lưu trữ các thông tin liên quan đến cảm xúc, bao gồm các
biến cảm xúc khác nhau như niềm vui, lo lắng, sự hứng khởi, hay cảm xúc tiêu cực khác.
Mỗi bản ghi trong cơ sở dữ liệu có thể chứa các thông tin chi tiết về cảm xúc của một
người dùng trong một thời điểm cụ thể, bao gồm ngày giờ, loại cảm xúc, mức độ của nó
và các thông tin khác nếu cần thiết.

Hệ thống lưu trữ dữ liệu cần được bảo vệ một cách an toàn và bảo mật để đảm bảo rằng
dữ liệu không bị mất hoặc rò rỉ thông tin. Điều này có thể bao gồm việc sử dụng các biện
pháp bảo mật như mã hóa dữ liệu, kiểm soát truy cập và giám sát hoạt động của người
dùng.

Bên cạnh đó, hệ thống cũng cần có khả năng mở rộng để có thể chứa lượng dữ liệu lớn và
đáp ứng được nhu cầu sử dụng trong tương lai. Việc tối ưu hóa hiệu suất và khả năng mở

11
rộng của cơ sở dữ liệu là rất quan trọng để đảm bảo tính linh hoạt và hiệu quả của hệ
thống.

1.3.3. Công cụ phân tích dữ liệu

Công cụ phân tích dữ liệu là một thành phần cung cấp các công cụ và kỹ thuật để nghiên
cứu viên có thể khám phá và phân tích các mẫu, xu hướng và mối quan hệ trong dữ liệu
cảm xúc. Công cụ này giúp chuyển đổi dữ liệu thô thành thông tin hữu ích và hiểu biết
sâu hơn về cảm xúc của người dùng.

Công cụ phân tích dữ liệu có thể bao gồm các kỹ thuật thống kê như phân tích biến thống
kê, kiểm định giả thuyết, và phân tích tương quan để phát hiện và đo lường mối quan hệ
giữa các biến cảm xúc. Những phân tích này có thể giúp nghiên cứu viên xác định các
mẫu hoặc xu hướng trong dữ liệu, như sự thay đổi của cảm xúc theo thời gian hoặc sự
tương quan giữa các loại cảm xúc khác nhau.

Ngoài ra, công cụ phân tích dữ liệu cũng có thể sử dụng các kỹ thuật phân tích ngôn ngữ
tự nhiên để hiểu và phân tích nội dung văn bản hoặc ý kiến của người dùng. Điều này có
thể bao gồm việc sử dụng các thuật toán máy học và học máy để phân loại, phân tích ý
kiến hoặc phát hiện các đặc điểm ngôn ngữ đặc biệt trong dữ liệu.

Các công cụ phân tích dữ liệu cũng có thể hỗ trợ việc phân tích dữ liệu hình ảnh và video
để hiểu và phân tích biểu hiện khuôn mặt hoặc hành vi của người dùng. Điều này có thể
giúp nghiên cứu viên hiểu rõ hơn về cảm xúc được biểu hiện thông qua các phương tiện
trực quan.

12
1.3.4. Bảo mật và quản lí quyền truy cập

Bảo mật và quản lý quyền truy cập là một phần không thể thiếu của hệ thống, đặc biệt
quan trọng trong việc bảo vệ dữ liệu cảm xúc nhạy cảm được thu thập từ người dùng. Để
đảm bảo tính an toàn và bảo mật của dữ liệu, hệ thống cần triển khai các biện pháp bảo
mật mạnh mẽ và hiệu quả.

Một trong những biện pháp bảo mật quan trọng là mã hóa dữ liệu, tức là việc chuyển đổi
dữ liệu thành dạng không đọc được mà chỉ có những người được ủy quyền mới có thể
truy cập. Cơ chế này giúp đảm bảo rằng dữ liệu cảm xúc không bị lộ ra ngoài khi truyền
qua các kênh truyền thông không an toàn.

Quản lý quyền truy cập là một phần khác của bảo mật, đảm bảo rằng chỉ những người
được phép mới có thể truy cập vào dữ liệu. Hệ thống cần có các cơ chế xác thực và ủy
quyền mạnh mẽ để kiểm soát quyền truy cập của người dùng. Điều này bao gồm việc xác
định và quản lý vai trò, phân quyền và các chính sách quản lý quyền truy cập.

Bên cạnh đó, việc giám sát hoạt động của người dùng là một phần quan trọng của bảo
mật. Hệ thống cần có các công cụ và cơ chế giám sát để theo dõi các hoạt động truy cập
và sử dụng dữ liệu, từ đó phát hiện và ngăn chặn các hành vi bất thường hoặc đe dọa đến
bảo mật dữ liệu.

Cuối cùng, việc đào tạo và nâng cao nhận thức về bảo mật cho nhân viên cũng là một yếu
tố quan trọng. Đảm bảo rằng tất cả nhân viên có kiến thức và hiểu biết về các biện pháp
bảo mật và quy trình, giúp tăng cường sự nhận thức và chủ động trong việc bảo vệ dữ liệu
cảm xúc của người dùng.

13
1.3.5. Giao diện thống kê và báo cáo

Giao diện thống kê và báo cáo là phần của hệ thống cung cấp một giao diện trực quan và
dễ sử dụng để trực quan hóa và phân tích dữ liệu cảm xúc. Giao diện này giúp nghiên cứu
viên và quản trị viên có thể hiểu rõ hơn về cảm xúc của người dùng và chia sẻ thông tin
kết quả của nghiên cứu với cộng đồng.

Giao diện thống kê cung cấp các công cụ và biểu đồ để trực quan hóa dữ liệu cảm xúc
một cách rõ ràng và dễ hiểu. Các biểu đồ có thể bao gồm biểu đồ cột, biểu đồ đường, biểu
đồ tròn, hoặc các biểu đồ khác tùy thuộc vào loại dữ liệu và mục đích phân tích. Các công
cụ này giúp nghiên cứu viên nhìn nhận tổng quan về phân phối và xu hướng của cảm xúc
trong dữ liệu.

Ngoài ra, giao diện cũng cung cấp các tính năng tương tác để người dùng có thể tùy chỉnh
và lọc dữ liệu theo nhu cầu cụ thể của họ. Điều này giúp tạo ra các báo cáo cá nhân hóa và
phù hợp với nhu cầu cụ thể của từng người dùng.

Bên cạnh giao diện thống kê, hệ thống cũng cần cung cấp các công cụ báo cáo để người
dùng có thể tạo ra các báo cáo chi tiết và tổng kết về dữ liệu cảm xúc. Các báo cáo này có
thể bao gồm các thông tin về phân tích cảm xúc, xu hướng thay đổi, điểm mạnh và điểm
yếu của dữ liệu, và các kết luận và đề xuất cho quá trình học tập và nghiên cứu tiếp theo.

1.4 Khảo sát các công bố liên quan

Để khảo sát các công bố liên quan đến đánh giá, cảm nhận và phản hồi trong môi trường
học tập số, bạn có thể tham khảo các hội nghị, tạp chí và tài liệu nghiên cứu trong các lĩnh

14
vực như giáo dục, công nghệ giáo dục, khoa học máy tính, và tâm lý học giáo dục. Dưới
đây là một số hội nghị và tạp chí phổ biến có thể chứa các công bố liên quan:

Hội nghị ACM Learning at Scale (L@S): Hội nghị này thường tập trung vào các phương
pháp và công nghệ hỗ trợ học tập trực tuyến và quy mô lớn, có thể có các công bố về
đánh giá và phản hồi trong môi trường học tập số.

Hội nghị ACM SIGCHI (Special Interest Group on Computer-Human Interaction): Hội
nghị này thường tổ chức các phiên trình bày về tương tác người-máy, bao gồm các công
nghệ và phương pháp đánh giá và phản hồi trong môi trường học tập số.

Tạp chí Computers & Education: Tạp chí này thường đăng tải các nghiên cứu về ứng
dụng công nghệ trong giáo dục, bao gồm các phương pháp đánh giá và phản hồi trong
môi trường học tập số.

Tạp chí Educational Technology & Society: Tạp chí này chuyên về nghiên cứu và ứng
dụng công nghệ trong giáo dục, có thể chứa các công bố liên quan đến đánh giá và cảm
nhận trong môi trường học tập số.

Hội nghị International Conference on Learning Analytics and Knowledge (LAK): Là một
hội nghị quốc tế về phân tích dữ liệu học tập, có thể có các công bố về phương pháp đánh
giá và phản hồi trong môi trường học tập số.

15
Tạp chí Journal of Educational Computing Research: Tạp chí này chuyên đề cập đến các
nghiên cứu và phát triển về sự kết hợp giữa giáo dục và công nghệ thông tin, có thể bao
gồm các công bố về đánh giá, cảm nhận và phản hồi trong môi trường học tập số.

Chương 1 của tài liệu tập trung vào nhu cầu và ứng dụng của việc đánh giá, cảm nhận và
phản hồi trong môi trường học tập số. Phần giới thiệu cung cấp cái nhìn tổng quan về tầm
quan trọng của các yếu tố này và giới thiệu các nội dung cụ thể được thảo luận trong
chương. Phần sau đi sâu vào các ứng dụng cụ thể của đánh giá, cảm nhận và phản hồi,
bao gồm việc tạo sự tương tác, xây dựng cộng đồng học tập, phản hồi cá nhân hoá và theo
dõi tiến trình học tập. Chương cũng trình bày về hệ thống dữ liệu thực nghiệm cho nghiên
cứu về cảm xúc trong giáo dục đại học, bao gồm các phần như giao diện thu thập dữ liệu,
hệ thống lưu trữ dữ liệu, công cụ phân tích dữ liệu, bảo mật và quản lý quyền truy cập,
cùng với giao diện thống kê và báo cáo. Cuối cùng, chương kết thúc bằng một phần khảo
sát các công bố liên quan, mở ra các hướng nghiên cứu và thảo luận tiềm năng trong
tương lai.

16
Chương 2. THUẬT TOÁN SENTIMENT ANALYSIS
2.1. Định nghĩa Sentiment Analysis

Sentiment analysis, hay còn được gọi là phân tích cảm xúc, là một lĩnh vực nghiên cứu
trong máy học và xử lý ngôn ngữ tự nhiên (NLP) tập trung vào việc nhận dạng, phân loại
và đo lường cảm xúc trong văn bản. Mục tiêu chính của sentiment analysis là xác định
xem một đoạn văn bản có chứa cảm xúc tích cực, tiêu cực hay trung tính. Để thực hiện
điều này, các thuật toán sentiment analysis thường sử dụng các kỹ thuật từ lĩnh vực
machine learning và deep learning. Thuật toán sentiment analysis thường bắt đầu với quá
trình tiền xử lý dữ liệu, trong đó các ký tự không cần thiết, dấu câu và từ dừng được loại
bỏ để làm sạch văn bản và chuẩn bị cho việc xử lý tiếp theo. Sau đó, văn bản được biểu
diễn dưới dạng các vectơ số hóa, thông thường sử dụng các biểu diễn như vectơ từ (word
vectors) được tạo ra từ các mô hình như Word2Vec, GloVe hoặc BERT. Tiếp theo, các
mô hình máy học được xây dựng và huấn luyện bằng cách sử dụng dữ liệu huấn luyện đã
được gán nhãn. Các mô hình này có thể là các mô hình cổ điển như máy vector hỗ trợ
(Support Vector Machines) và Naive Bayes, hoặc các mô hình sâu hơn như mạng nơ-ron
hồi tiếp (Recurrent Neural Networks - RNNs) và mạng nơ-ron hồi tiếp dài ngắn (Long
Short-Term Memory Networks - LSTM). Sau khi mô hình được huấn luyện, chúng được
đánh giá trên các tập dữ liệu kiểm tra để đo lường hiệu suất của chúng. Các phép đo như
độ chính xác (accuracy), độ chính xác cân bằng (balanced accuracy), precision, recall và
F1-score thường được sử dụng để đánh giá mô hình. Cuối cùng, sau khi mô hình được
đánh giá, các điều chỉnh có thể được thực hiện để cải thiện hiệu suất của chúng. Điều này
có thể bao gồm việc điều chỉnh các siêu tham số của mô hình hoặc thay đổi kiến trúc của
mô hình. Ứng dụng của sentiment analysis rất đa dạng, bao gồm phân tích ý kiến trên
mạng xã hội, đánh giá sản phẩm trong thương mại điện tử, phát hiện cảm xúc trong phản
hồi của khách hàng và nhiều lĩnh vực khác. Điều này làm cho sentiment analysis trở thành
một công cụ quan trọng trong việc hiểu và phân tích ý kiến và cảm xúc của con người
trong văn bản.

17
2.2. Định nghĩa Sentiment Analysis và ý nghĩa trong giáo dục số

2.2.1. Về đánh giá

Sentiment Analysis, còn được gọi là opinion mining, là quá trình phân tích và nhận biết
cảm xúc, ý kiến hoặc tư duy trong văn bản tự nhiên. Mục tiêu của Sentiment Analysis là
xác định xem một phần văn bản cụ thể (như một đoạn văn, một bài đăng trên mạng xã
hội, hoặc một đánh giá sản phẩm) diễn đạt ý kiến tích cực, tiêu cực hoặc trung tính. Trong
môi trường học tập số, Sentiment Analysis đóng một vai trò quan trọng trong việc đánh
giá, cảm nhận và thu thập phản hồi từ học viên. Đây là một phân tích chi tiết về cách
Sentiment Analysis được áp dụng trong các hoạt động này.

Trong môi trường học tập số, Sentiment Analysis đóng vai trò quan trọng trong việc cảm
nhận, đánh giá và thu thập phản hồi từ học viên. Sentiment Analysis có thể được áp dụng
để phân tích cảm xúc và ý kiến của học viên khi thực hiện các bài kiểm tra, bài tập hoặc
báo cáo. Bằng cách này, giáo viên có thể đánh giá không chỉ về mặt kỹ thuật mà còn về
mặt tâm trạng và tư duy của học viên đối với nội dung học tập. Đồng thời, Sentiment
Analysis cũng giúp xác định mức độ hài lòng và sự thụ động của học viên đối với các
khóa học, bài giảng hoặc hoạt động giáo dục khác. Điều này giúp cho việc cải thiện chất
lượng dịch vụ giáo dục và tăng cường sự tham gia của học viên.

Bên cạnh đó, Sentiment Analysis có thể theo dõi tâm trạng và cảm xúc của học viên trong
quá trình học tập trực tuyến. Bằng cách phân tích các bình luận, phản hồi hoặc thảo luận,
giáo viên có thể nhận biết được các vấn đề mà học viên đang gặp phải và cung cấp hỗ trợ
phù hợp. Ngoài ra, công nghệ này cũng giúp phát hiện thái độ tích cực và tiêu cực của học
viên đối với các chủ đề, nội dung hoặc phương pháp giảng dạy cụ thể. Điều này giúp giáo

18
viên hiểu rõ hơn về sự hứng thú và động lực của học viên và điều chỉnh phương pháp
giảng dạy phù hợp.

2.2.1. Về cảm nhận

Sentiment Analysis có thể tổng hợp phản hồi từ học viên từ các bình luận, đánh giá hoặc
khảo sát. Bằng cách này, các tổ chức giáo dục có thể hiểu được ý kiến và nhận xét của
học viên và đáp ứng nhanh chóng các nhu cầu và yêu cầu của họ. Đồng thời, công nghệ
này cũng phân loại phản hồi từ học viên theo các loại khác nhau như khen ngợi, phê bình,
hoặc yêu cầu hỗ trợ, giúp tổ chức giáo dục hiểu rõ hơn về các vấn đề và mong muốn của
học viên và đưa ra các biện pháp cải thiện thích hợp.

2.2.2. Về phản hồi

Trong phần phản hồi, sentiment analysis có thể tự động phân tích và đánh giá cảm xúc
của sinh viên trong các bài viết, bình luận hoặc phản hồi. Nhờ vào điều này, giáo viên có
thể nhanh chóng nhận ra các mô hình cảm xúc, nhận định các vấn đề và mối quan ngại
của sinh viên, và phản ứng một cách linh hoạt và đáng tin cậy. Bằng cách tự động phân
loại cảm xúc, sentiment analysis giúp giáo viên tiết kiệm thời gian và công sức trong việc
đánh giá phản hồi từ sinh viên. Nó cung cấp cái nhìn tổng quan về sự hài lòng, thái độ và
cảm xúc tổng thể của sinh viên đối với các khía cạnh khác nhau của trải nghiệm học tập.
Điều này giúp giáo viên dễ dàng xác định những điểm mạnh và yếu của quy trình giảng
dạy và tạo ra các biện pháp cải tiến phù hợp. Thêm vào đó, sentiment analysis cũng có thể
phát hiện ra những vấn đề phổ biến hoặc mối quan ngại của sinh viên, giúp giáo viên có
cái nhìn sâu sắc và chi tiết hơn về những thách thức mà sinh viên đang phải đối mặt. Dựa
trên thông tin này, họ có thể cung cấp phản hồi cá nhân hóa và các giải pháp cụ thể để hỗ
trợ sinh viên vượt qua những khó khăn và cải thiện hiệu suất học tập. Sentiment analysis
cung cấp cho giáo viên cơ hội tạo ra một môi trường học tập đáng tin cậy và hỗ trợ, nơi

19
mà sự cảm thấy được lắng nghe và quan tâm của sinh viên được đánh giá cao và đáp ứng
một cách hiệu quả. Điều này có thể tạo ra một tác động tích cực đến sự cam kết và sự
tham gia của sinh viên trong quá trình học tập và giúp họ đạt được thành công.

Sentiment analysis không chỉ giúp giáo viên tiết kiệm thời gian trong việc đánh giá phản
hồi sinh viên, mà còn mở ra cơ hội cho việc tạo ra các phản hồi có ý nghĩa và hiệu quả
hơn. Bằng cách phân tích cảm xúc và ý kiến của sinh viên từ các bài viết và bình luận,
sentiment analysis cho phép giáo viên hiểu rõ hơn về nhu cầu và mong muốn của sinh
viên, từ đó tạo ra các phản hồi cá nhân hóa và phù hợp. Ngoài ra, sentiment analysis còn
giúp giáo viên xác định được các xu hướng và mô hình cảm xúc của sinh viên theo thời
gian. Bằng cách theo dõi và phân tích sự thay đổi trong cảm xúc và ý kiến của sinh viên,
giáo viên có thể đưa ra các biện pháp can thiệp kịp thời để giải quyết các vấn đề và mối
quan ngại, từ đó tạo ra một môi trường học tập tích cực và hỗ trợ. Sentiment analysis cung
cấp cho giáo viên thông tin phản hồi dựa trên dữ liệu một cách khách quan và không thiên
vị. Thay vì dựa vào sự nhận định cá nhân, giáo viên có thể dựa vào dữ liệu phân tích để
đưa ra quyết định và hành động một cách có căn cứ và hiệu quả hơn. Cuối cùng, sử dụng
sentiment analysis trong phản hồi giúp tạo ra một quy trình đánh giá liên tục và không
ngừng cải thiện. Bằng cách phân tích và đánh giá cảm xúc và ý kiến của sinh viên, giáo
viên có thể liên tục điều chỉnh và cải thiện các phương pháp giảng dạy và phản hồi của
mình, từ đó nâng cao chất lượng của trải nghiệm học tập và đạt được mục tiêu giáo dục
một cách hiệu quả.

2.3. Các phương pháp Sentiment Analysis

2.3.1. Naive Bayes

2.3.1.1. Nguyên lý hoạt động

Nguyên lý hoạt động của Naive Bayes dựa trên nguyên tắc của định lý Bayes và giả định
"ngây thơ" (naive). Trong mô hình Naive Bayes, mỗi đặc trưng được coi là độc lập với

20
nhau khi đã biết lớp của dữ liệu. Dựa trên nguyên lý Bayes, Naive Bayes tính xác suất của
một lớp cụ thể cho một mẫu dữ liệu bằng cách sử dụng xác suất của các đặc trưng đó.
Mặc dù giả định về tính độc lập giữa các đặc trưng thường không được thỏa mãn hoàn
toàn trong thực tế, nhưng mô hình vẫn thường hoạt động hiệu quả trong nhiều tình huống
thực tế. Naive Bayes được sử dụng rộng rãi trong phân loại văn bản, phân loại email
(spam vs. không spam), phân loại tin tức và nhiều ứng dụng khác trong lĩnh vực phân loại
và dự đoán. Naive Bayes là một thuật toán phân loại cơ bản trong machine learning, được
sử dụng rộng rãi với các bài toán phân loại văn bản, email spam, và nhiều ứng dụng khác.
Điểm mạnh của Naive Bayes là tính đơn giản và hiệu quả, đặc biệt là với các tập dữ liệu
lớn và có số lượng đặc trưng lớn. Tuy nhiên, giả định về tính độc lập có thể làm giảm độ
chính xác của mô hình trong những trường hợp mà các đặc trưng không độc lập hoặc có
mối quan hệ phức tạp với nhau.

Trong quá trình huấn luyện, Naive Bayes tính toán các xác suất tiên nghiệm của các lớp
và các xác suất của từng đặc trưng dựa trên dữ liệu huấn luyện. Khi có một mẫu dữ liệu
mới, thuật toán sử dụng định lý Bayes để tính toán xác suất của mỗi lớp dựa trên dữ liệu
mới và chọn lớp có xác suất cao nhất là kết quả phân loại.

Mặc dù Naive Bayes có giả định "ngây thơ" về tính độc lập giữa các đặc trưng, nhưng
trong thực tế, mô hình này vẫn cho kết quả tốt trong nhiều tình huống. Nếu dữ liệu thực tế
phù hợp với giả định này hoặc nếu cân bằng được sự đơn giản của mô hình và độ chính
xác của dự đoán, Naive Bayes có thể là một lựa chọn phù hợp và mạnh mẽ trong nhiều
bài toán phân loại.

Naive Bayes tính toán xác suất của mỗi lớp cho một mẫu dữ liệu mới bằng cách sử dụng
công thức Bayes:

21
P(x∨C x )∗ p (C k )
P(C x ∨x )=
P(x)

Trong đó :

P(C x ∨x ) là xác suất của lớp C k khi biết dữ liệu x

P(x∨C x ) là xác suất của dữ liệu x khi biết lớp C k

p(C k ) là xác xuất tiên nghiệm của lớp C k

P(x ) là xác suất của dữ liệu x

Naive Bayes thường đơn giản và nhanh chóng, nó có thể cho kết quả tốt trong nhiều tình
huống thực tế, đặc biệt là trong các bài toán với dữ liệu lớn và số lượng đặc trưng lớn.
Tuy nhiên, giả định về tính độc lập có thể làm giảm độ chính xác của mô hình trong các
trường hợp mà các đặc trưng không độc lập hoặc có mối quan hệ phức tạp với nhau.

Naive Bayes có thể được sử dụng để phân loại các phản hồi từ sinh viên vào các nhóm
khác nhau dựa trên nội dung và cảm xúc của chúng. Ví dụ, một mô hình Naive Bayes có
thể được huấn luyện để phân loại phản hồi của sinh viên thành các nhóm như "thích",
"không thích" hoặc "cần cải thiện". Điều này giúp nhà giáo viên tổ chức và phân tích phản
hồi sinh viên một cách hiệu quả hơn. Cũng có thể được sử dụng để phát hiện cảm xúc
trong các bài viết, bình luận hoặc thảo luận trực tuyến của sinh viên. Bằng cách phân loại
các bài viết thành các loại cảm xúc như tích cực, tiêu cực hoặc trung tính, Naive Bayes có
thể giúp nhà giáo viên hiểu rõ hơn về cảm nhận và quan điểm của sinh viên đối với các
chủ đề và vấn đề học tập.

2.3.1.2. Ưu điểm và nhược điểm

Ưu điểm của thuật toán Naive Bayes là nó đơn giản và dễ triển khai. Với tính đơn giản
này, Naive Bayes thích hợp cho các bài toán phân loại đơn giản và không yêu cầu nhiều
tài nguyên tính toán. Điều này làm cho nó trở thành một lựa chọn phù hợp cho các dự án
với tập dữ liệu lớn hoặc có số lượng đặc trưng lớn. Mặt khác, Naive Bayes cũng hoạt

22
động tốt với các bài toán phân loại đa lớp, nơi có nhiều hơn hai lớp cần phân loại. Ngoài
ra, Naive Bayes xử lý tốt với các biến độc lập. Mặc dù giả định về tính độc lập giữa các
đặc trưng có thể không hoàn toàn chính xác trong thực tế, nhưng trong nhiều trường hợp,
Naive Bayes vẫn cho kết quả tốt đối với các bài toán thực tế. Đặc biệt, với các bài toán
phân loại văn bản, Naive Bayes thường mang lại hiệu suất tốt do dữ liệu văn bản thường
có tính chất phù hợp với giả định về tính độc lập này. Ngoài các ưu điểm đã đề cập, Naive
Bayes cũng có thể được áp dụng thành công trong các tình huống mà dữ liệu không hoàn
toàn tuân theo phân phối chuẩn. Trong thực tế, Naive Bayes thường hoạt động tốt đối với
các tập dữ liệu thưa và có thể xử lý được dữ liệu có các giá trị bị thiếu một cách linh hoạt.
Điều này làm cho nó trở thành một lựa chọn hợp lý trong nhiều trường hợp thực tế, nơi dữ
liệu thường không hoàn toàn đồng nhất và không hoàn toàn tuân theo phân phối chuẩn.

Bên cạnh đó, Naive Bayes cũng có thể được cập nhật dễ dàng khi có dữ liệu mới được
thêm vào. Quá trình cập nhật này không đòi hỏi việc huấn luyện lại toàn bộ mô hình, mà
chỉ cần cập nhật các tham số xác suất dựa trên dữ liệu mới. Điều này giúp Naive Bayes
linh hoạt và dễ dàng áp dụng trong các môi trường đòi hỏi cập nhật thường xuyên. Tuy
nhiên, cũng cần lưu ý rằng Naive Bayes có thể không phù hợp trong các tình huống mà
mối quan hệ giữa các đặc trưng quan trọng và phức tạp, hoặc trong các trường hợp mà giả
định về tính độc lập giữa các đặc trưng không được đáp ứng. Điều này có thể dẫn đến các
dự đoán không chính xác hoặc mô hình không thể áp dụng được.

Tóm lại, ưu điểm chính của Naive Bayes là tính đơn giản, dễ triển khai, hoạt động tốt với
dữ liệu lớn và có số lượng đặc trưng lớn, cũng như khả năng xử lý các biến độc lập. Điều
này làm cho Naive Bayes trở thành một lựa chọn phổ biến và hữu ích trong nhiều ứng
dụng thực tế.

23
Một trong những nhược điểm chính của Naive Bayes là giả định về tính độc lập giữa các
đặc trưng. Trong thực tế, rất ít dữ liệu có các đặc trưng hoàn toàn độc lập với nhau. Do
đó, khi dữ liệu không tuân theo giả định này, Naive Bayes có thể tạo ra các dự đoán
không chính xác. Đặc biệt, nếu có sự phụ thuộc mạnh mẽ giữa các đặc trưng, Naive Bayes
có thể bỏ lỡ các mối quan hệ quan trọng này và dẫn đến kết quả không chính xác. Một
nhược điểm khác của Naive Bayes là nếu có các đặc trưng không quan trọng hoặc không
ảnh hưởng đến kết quả, mô hình có thể bị ảnh hưởng bởi những đặc trưng này. Trong một
số trường hợp, các đặc trưng này có thể làm giảm hiệu suất của mô hình bằng cách làm
nhiễu dữ liệu và làm mất đi sự phân biệt giữa các lớp. Thêm vào đó, Naive Bayes cũng
không phù hợp với các tập dữ liệu mà phân phối của các lớp không cân bằng. Khi một lớp
có số lượng mẫu lớn hơn đáng kể so với các lớp khác, mô hình có thể bị chệch và dự đoán
không chính xác cho các lớp thiểu số. Cuối cùng, một nhược điểm của Naive Bayes là nó
không cung cấp một ước lượng xác suất tốt cho các dự đoán của mình, đặc biệt khi phân
loại các trường hợp mà các lớp không được tương đồng trong phân phối của chúng.

2.3.2. Support Vector Machine (SVM)

2.3.2.1. Nguyên lý hoạt động

Nguyên lý hoạt động của Support Vector Machine (SVM) dựa trên việc tìm ra ranh giới
phân chia tối ưu giữa các nhóm dữ liệu trong không gian đa chiều. SVM cố gắng tìm ra
ranh giới phân chia sao cho khoảng cách từ các điểm dữ liệu gần nhất của các nhóm tới
ranh giới này là lớn nhất có thể. Điều này được gọi là ranh giới phân chia tối ưu hoặc ranh
giới "phân chia rộng" (margin). Cụ thể, SVM là một thuật toán phân loại nhị phân, nghĩa
là nó phân loại dữ liệu thành hai lớp. Thuật toán này hoạt động bằng cách tìm ra ranh giới
phân chia tối ưu giữa hai lớp dữ liệu. Ranh giới này thường được xác định bởi một tập
hợp các điểm dữ liệu được gọi là các vector hỗ trợ (support vectors). Các vector hỗ trợ

24
này là các điểm dữ liệu nằm gần nhất với ranh giới phân chia và có ảnh hưởng lớn nhất
đến vị trí của ranh giới.

Thuật toán SVM cố gắng tối ưu hóa ranh giới phân chia bằng cách giải quyết một bài toán
tối ưu hóa có mục tiêu là tối đa hóa margin và đồng thời đảm bảo rằng các điểm dữ liệu
đều được phân loại đúng. Điều này thường được thực hiện bằng cách sử dụng các kỹ thuật
tối ưu hóa và các hàm mất mát (loss functions) như hàm mất mát hinge. Khi một dữ liệu
mới được đưa vào, SVM sử dụng ranh giới phân chia đã được học để phân loại nó vào
một trong hai lớp. Điều này thường được thực hiện bằng cách đo khoảng cách từ điểm dữ
liệu đến ranh giới phân chia và xác định lớp dữ liệu dựa trên khoảng cách này.

Trong môi trường học tập số, Support Vector Machine (SVM) có thể được áp dụng để
thực hiện nhiều nhiệm vụ quan trọng. SVM có khả năng phân loại học sinh vào các nhóm
dựa trên các yếu tố như kết quả học tập, hành vi, hoặc các thông tin liên quan khác, giúp
giáo viên và nhà quản lý trường học hiểu rõ hơn về các nhóm học sinh và tạo ra các biện
pháp hỗ trợ phù hợp. SVM cũng có thể dùng để dự đoán kết quả học tập của học sinh dựa
trên các yếu tố như kết quả kiểm tra, sự tham gia vào lớp học, hoặc lịch sử học tập trước
đó, từ đó giúp đưa ra các biện pháp hỗ trợ sớm cho những học sinh có nguy cơ thấp hoặc
cao. Ngoài ra, SVM có thể được áp dụng để phân loại các phản hồi của sinh viên từ các
bài viết, bình luận, hoặc các phiếu khảo sát thành các nhóm khác nhau như "tích cực",
"tiêu cực", hoặc "trung lập", giúp tổ chức và phân tích phản hồi sinh viên một cách hiệu
quả hơn. SVM cũng có thể dùng để dự đoán mức độ quan tâm và hài lòng của sinh viên
đối với các khóa học, môn học hoặc dịch vụ giáo dục khác, từ đó giúp đưa ra các biện
pháp cải thiện trải nghiệm học tập của sinh viên. Cuối cùng, SVM có thể được sử dụng để
xác định học sinh có nhu cầu đặc biệt hoặc đang gặp khó khăn trong học tập, giúp nhà
trường và giáo viên nhận biết và cung cấp hỗ trợ cho những học sinh cần thiết.

25
2.3.2.2. Ưu điểm và nhược điểm

Ưu điểm của Support Vector Machine (SVM) bao gồm hiệu suất cao trong không gian
chiều cao, hiệu quả với các tập dữ liệu nhỏ và trung bình, khả năng xử lý các biên quyết
định phi tuyến tính, khả năng xử lý dữ liệu nhiễu và khả năng tìm ra ranh giới phân chia
tối ưu. SVM hoạt động tốt trong không gian chiều cao và khi số lượng đặc trưng lớn.
Điều này làm cho SVM phù hợp với các bài toán với dữ liệu có số chiều lớn như xử lý
hình ảnh, văn bản hay dữ liệu di truyền. SVM cũng có tính chất chống overfitting tốt,
giúp giảm thiểu ảnh hưởng của dữ liệu nhiễu đối với quá trình phân loại. Khả năng xử lý
các biên quyết định phi tuyến tính của SVM được cải thiện thông qua việc sử dụng các
hàm kernel, giúp phân loại các lớp dữ liệu không tuyến tính. Đồng thời, SVM cũng tối đa
hóa margin, tạo ra các ranh giới phân chia tối ưu và đảm bảo tính chính xác của mô hình.
Tóm lại, SVM là một trong những phương pháp phân loại mạnh mẽ và linh hoạt, được sử
dụng rộng rãi trong nhiều lĩnh vực machine learning với nhiều ưu điểm vượt trội.

Trong môi trường học tập số, Support Vector Machine (SVM) mang lại một số ưu điểm
quan trọng khi được sử dụng trong các tác vụ đánh giá, cảm nhận và phản hồi. Đầu tiên,
SVM có hiệu suất phân loại cao, giúp nhà trường hiểu rõ hơn về sự tiến bộ và nhu cầu của
từng học sinh. Thứ hai, SVM hoạt động tốt trong không gian chiều cao và với các tập dữ
liệu lớn, là lựa chọn lý tưởng để phân tích và đưa ra dự đoán với dữ liệu phức tạp. SVM
cũng cố gắng tối đa hóa margin, giúp tạo ra các ranh giới phân loại tối ưu giữa các nhóm
dữ liệu, nhận diện được các mẫu và xu hướng quan trọng trong dữ liệu học tập. Ngoài ra,
SVM có khả năng xử lý các biên quyết định phi tuyến tính, không cần phải giả định về sự
tuyến tính của chúng. Cuối cùng, SVM không chỉ có khả năng phân loại mà còn có thể
dùng để dự đoán các kết quả học tập, đánh giá hiệu suất học tập của học sinh, và đưa ra
các phản hồi cụ thể và cá nhân hóa dựa trên các dự đoán này. Tóm lại, SVM mang lại

26
nhiều ưu điểm quan trọng trong đánh giá, cảm nhận và phản hồi trong môi trường học tập
số, giúp tạo ra một môi trường học tập tích cực và hiệu quả cho cả học sinh và giáo viên.

Mặc dù Support Vector Machine (SVM) mang lại nhiều ưu điểm, nhưng cũng có nhược
điểm cần được xem xét. Một trong những nhược điểm chính là SVM có thể trở nên phức
tạp khi áp dụng vào các tập dữ liệu lớn, đặc biệt là khi số lượng đặc trưng lớn. Điều này
có thể làm tăng thời gian huấn luyện và đòi hỏi nhiều tài nguyên tính toán. Thứ hai, SVM
có thể không hiệu quả với các tập dữ liệu có nhiều nhiễu hoặc không hoàn toàn tách biệt
tuyến tính giữa các lớp, điều này có thể dẫn đến overfitting và làm giảm hiệu suất của mô
hình. Ngoài ra, SVM không cung cấp các ước lượng xác suất trực tiếp cho các dự đoán
của mình, điều này có thể làm giảm sự tin cậy của kết quả, đặc biệt trong các bài toán yêu
cầu đánh giá xác suất. Cuối cùng, SVM cũng có thể không phù hợp với các tập dữ liệu
không cân bằng, nơi một số lớp có số lượng mẫu lớn hơn đáng kể so với các lớp khác, có
thể dẫn đến mô hình bị chệch và kết quả phân loại không chính xác cho các lớp thiểu số.
Tóm lại, mặc dù SVM có nhiều ưu điểm, nhưng cũng cần xem xét các nhược điểm này
khi áp dụng vào các tác vụ đánh giá, cảm nhận và phản hồi trong môi trường học tập số.

2.3.3. Recurrent Neural Networks (RNN)

2.3.3.1. Nguyên lý hoạt động

Recurrent Neural Networks (RNN) là một loại mạng nơ-ron trong deep learning được
thiết kế đặc biệt để làm việc với dữ liệu tuần tự hoặc chuỗi. Nguyên lý hoạt động của
RNN dựa trên khả năng lưu trữ thông tin trước đó và sử dụng nó để đưa ra dự đoán cho
các dữ liệu tiếp theo trong chuỗi. RNN có các đặc điểm chính sau: tính tái phát
(Recurrence), tham số chia sẻ (Parameter Sharing), hàm mất mát (Loss Function), và cơ
chế cổng (Gating Mechanism). Điều này giúp RNN nhận biết và phản ứng linh hoạt với
các mẫu dữ liệu tuần tự và chuỗi, làm cho chúng trở thành một công cụ mạnh mẽ trong

27
nhiều ứng dụng như dự đoán chuỗi thời gian, xử lý ngôn ngữ tự nhiên và nhiều lĩnh vực
khác trong machine learning.

Recuurent Neural Networks (RNN) trong đánh giá, cảm nhận và phản hồi trong môi
trường học tập số là phương pháp sử dụng kiến trúc mạng nơ-ron đặc biệt này để xử lý dữ
liệu tuần tự và chuỗi trong ngữ cảnh giáo dục. Nguyên lý hoạt động của RNN là dựa vào
khả năng lưu trữ và tái sử dụng thông tin từ các bước trước đó trong chuỗi dữ liệu. Điều
này cho phép RNN nhận biết mẫu, xu hướng và tương quan trong dữ liệu chuỗi, từ đó hỗ
trợ các tác vụ như dự đoán kết quả học tập, phát hiện hành vi học tập, và đánh giá hiệu
suất của sinh viên. RNN có khả năng tự động học và điều chỉnh dựa trên các phản hồi và
dữ liệu mới, giúp tạo ra các mô hình đánh giá và phản hồi linh hoạt và tiên tiến. Với khả
năng xử lý các dữ liệu tuần tự phức tạp và khả năng nhớ thông tin từ quá khứ, RNN có thể
giúp cải thiện quá trình đánh giá và cung cấp phản hồi cá nhân hóa và hiệu quả trong môi
trường học tập số.

2.3.3.2. Ưu điểm và nhược điểm

Recuurent Neural Networks (RNN) có nhiều ưu điểm đáng chú ý. Đầu tiên, RNN có khả
năng xử lý dữ liệu tuần tự và chuỗi một cách hiệu quả, giúp nắm bắt thông tin liên tục và
xu hướng trong dữ liệu. Thứ hai, RNN có khả năng "nhớ" thông tin từ các bước trước đó
trong chuỗi, giúp nắm bắt các mẫu phức tạp và tương quan trong dữ liệu. Điều này làm
cho RNN phù hợp cho các ứng dụng đòi hỏi việc lưu trữ thông tin trạng thái và cập nhật
thông tin từ quá khứ. Thứ ba, RNN có khả năng tạo ra các mô hình dự đoán và phản hồi
linh hoạt, có thể điều chỉnh dựa trên phản hồi và dữ liệu mới. Cuối cùng, RNN có thể tự
động học và điều chỉnh, giúp tạo ra các mô hình dự đoán và phản hồi ngày càng tốt hơn
theo thời gian và dữ liệu mới. Tóm lại, RNN là một công cụ mạnh mẽ và linh hoạt trong

28
việc xử lý dữ liệu tuần tự và chuỗi, có nhiều ưu điểm đáng chú ý trong nhiều ứng dụng,
bao gồm cả trong môi trường học tập số.

Recuurent Neural Networks (RNN) mang lại nhiều ưu điểm quan trọng trong đánh giá,
cảm nhận và phản hồi trong môi trường học tập số. Đầu tiên, RNN có khả năng xử lý dữ
liệu tuần tự và chuỗi một cách hiệu quả, giúp nhận biết các mẫu thời gian và xu hướng
trong dữ liệu học tập. Thứ hai, RNN có khả năng "nhớ" thông tin từ các bước trước đó
trong chuỗi, từ đó hỗ trợ quá trình đánh giá hiệu suất học tập và phản hồi cá nhân hóa.
Thứ ba, RNN có khả năng tạo ra các mô hình dự đoán linh hoạt, có thể điều chỉnh dựa
trên phản hồi và dữ liệu mới, giúp cải thiện quá trình đánh giá và cung cấp phản hồi chính
xác và hiệu quả cho sinh viên. Cuối cùng, RNN có thể tự động học và điều chỉnh, giúp tạo
ra các mô hình đánh giá và phản hồi ngày càng tốt hơn theo thời gian và dữ liệu mới, làm
tăng tính linh hoạt và khả năng đáp ứng của mô hình. Tóm lại, RNN đóng vai trò quan
trọng trong việc tăng cường quá trình đánh giá, cảm nhận và phản hồi trong môi trường
học tập số bằng cách sử dụng khả năng xử lý dữ liệu tuần tự và chuỗi cùng với khả năng
học và điều chỉnh linh hoạt.

Recurrent Neural Networks (RNN) tồn tại một số nhược điểm cần được xem xét khi áp
dụng vào đánh giá, cảm nhận và phản hồi trong môi trường học tập số. Một trong những
nhược điểm chính của RNN là vấn đề biến mất hoặc nổ (vanishing or exploding
gradients) trong quá trình huấn luyện. Điều này có thể xảy ra khi chuỗi dữ liệu quá dài
hoặc khi mô hình gặp các đặc điểm nhất định của dữ liệu. Nhược điểm này có thể làm
giảm hiệu suất của mạng, đặc biệt là khi cần phải nhớ thông tin từ khoảng cách xa trong
quá trình đánh giá và phản hồi. Thứ hai, RNN thường khá tốn kém về tài nguyên tính toán
so với một số mạng nơ-ron khác, đặc biệt là khi áp dụng vào các tập dữ liệu lớn và phức
tạp. Điều này có thể làm cho việc triển khai và sử dụng RNN trong môi trường học tập số
trở nên khó khăn hơn. Cuối cùng, RNN có thể không hiệu quả khi xử lý các mô hình dự
29
đoán dài hạn hoặc trong các trường hợp yêu cầu sự linh hoạt cao hơn trong việc nhận biết
và đưa ra dự đoán. Tóm lại, mặc dù RNN mang lại nhiều ưu điểm, nhưng cũng cần xem
xét các nhược điểm này khi áp dụng vào đánh giá, cảm nhận và phản hồi trong môi
trường học tập số.

2.3.4. Long Short-Term Memory (LSTM)

2.3.4.1. Nguyên lý hoạt động

Long Short-Term Memory (LSTM) là một dạng đặc biệt của mạng nơ-ron hồi tiếp (RNN)
được thiết kế để giải quyết vấn đề biến mất hoặc nổ gradient trong việc xử lý dữ liệu tuần
tự và chuỗi. Nguyên lý hoạt động của LSTM dựa trên ba cổng quan trọng: cổng quên
(forget gate), cổng đầu vào (input gate), và cổng đầu ra (output gate). Cổng quên quyết
định thông tin nào sẽ được giữ lại từ trạng thái tế bào trước đó. Cổng đầu vào quyết định
thông tin mới nào sẽ được lưu trữ vào trạng thái tế bào. Cuối cùng, cổng đầu ra quyết định
thông tin nào sẽ được đưa ra từ trạng thái tế bào đến đầu ra của mạng. Các cổng này cho
phép LSTM học và lưu trữ thông tin từ lâu dài đến ngắn hạn trong quá trình xử lý dữ liệu
tuần tự, giúp nó mạnh mẽ và linh hoạt trong việc xử lý các chuỗi dữ liệu có độ dài và độ
phức tạp khác nhau.

Long Short-Term Memory (LSTM) trong đánh giá, cảm nhận và phản hồi trong môi
trường học tập số là một công cụ mạnh mẽ cho việc xử lý dữ liệu tuần tự và chuỗi trong
ngữ cảnh giáo dục. Nguyên lý hoạt động của LSTM dựa trên việc sử dụng các cổng quan
trọng như cổng quên, cổng đầu vào và cổng đầu ra. Cổng quên cho phép LSTM quyết
định thông tin nào cần được giữ lại từ trạng thái tế bào trước đó. Cổng đầu vào quyết định
thông tin mới nào sẽ được lưu trữ vào trạng thái tế bào, trong khi cổng đầu ra quyết định
thông tin nào sẽ được đưa ra từ trạng thái tế bào đến đầu ra của mạng. Nhờ các cổng này,
LSTM có khả năng học và lưu trữ thông tin từ lâu dài đến ngắn hạn, giúp nó nhận biết và

30
phản hồi linh hoạt với các mẫu và xu hướng trong dữ liệu học tập. Điều này làm cho
LSTM trở thành một công cụ hiệu quả cho việc dự đoán kết quả học tập, phát hiện hành
vi học tập và đưa ra phản hồi cá nhân hóa cho sinh viên. Tóm lại, LSTM cung cấp một
cách tiếp cận mạnh mẽ và linh hoạt để đánh giá, cảm nhận và phản hồi trong môi trường
học tập số, nhờ vào khả năng xử lý dữ liệu tuần tự và chuỗi một cách hiệu quả.

2.3.4.2. Ưu điểm và nhược điểm

Long Short-Term Memory (LSTM) mang lại nhiều ưu điểm trong đánh giá, cảm nhận và
phản hồi trong môi trường học tập số. Đầu tiên, LSTM có khả năng xử lý dữ liệu tuần tự
và chuỗi một cách hiệu quả, giúp nhận biết các mẫu thời gian và xu hướng trong dữ liệu
học tập. Thứ hai, LSTM có khả năng "nhớ" thông tin từ các bước trước đó trong chuỗi, từ
đó hỗ trợ quá trình đánh giá hiệu suất học tập và phản hồi cá nhân hóa. Thứ ba, LSTM có
khả năng tạo ra các mô hình dự đoán linh hoạt, có thể điều chỉnh dựa trên phản hồi và dữ
liệu mới, giúp cải thiện quá trình đánh giá và cung cấp phản hồi chính xác và hiệu quả
cho sinh viên. Cuối cùng, LSTM có thể tự động học và điều chỉnh, giúp tạo ra các mô
hình đánh giá và phản hồi ngày càng tốt hơn theo thời gian và dữ liệu mới, làm tăng tính
linh hoạt và khả năng đáp ứng của mô hình. Tóm lại, LSTM đóng vai trò quan trọng trong
việc tăng cường quá trình đánh giá, cảm nhận và phản hồi trong môi trường học tập số
bằng cách sử dụng khả năng xử lý dữ liệu tuần tự và chuỗi cùng với khả năng học và điều
chỉnh linh hoạt.

Nhược điểm cần được xem xét khi áp dụng vào đánh giá, cảm nhận và phản hồi trong môi
trường học tập số. Một trong những nhược điểm chính là sự phức tạp của mô hình LSTM,
đặc biệt là khi cần phải điều chỉnh nhiều siêu tham số để đạt được hiệu suất tốt. Điều này
có thể làm tăng thời gian và công sức cần thiết cho quá trình huấn luyện và tinh chỉnh mô
hình. Thứ hai, LSTM có thể dễ dàng bị overfitting khi áp dụng vào các tập dữ liệu nhỏ

31
hoặc có nhiều biến thể, đặc biệt là khi dữ liệu không cân bằng. Điều này có thể làm giảm
khả năng tổng quát hóa của mô hình, làm cho các dự đoán và phản hồi không chính xác
trên dữ liệu mới. Cuối cùng, một nhược điểm khác của LSTM là khả năng xử lý dữ liệu
tuần tự trong thời gian thực có thể gặp rắc rối, đặc biệt là khi cần phải xử lý dữ liệu có tốc
độ cao và liên tục. Điều này có thể làm giảm tính khả dụng của LSTM trong môi trường
học tập số nếu không có sự xử lý và tối ưu hóa phù hợp. Tóm lại, mặc dù LSTM có nhiều
ưu điểm, nhưng cũng cần xem xét các nhược điểm này khi áp dụng vào đánh giá, cảm
nhận và phản hồi trong môi trường học tập số.

2.4. Triển khai thuật toán

2.4.1. Thu thập dữ liệu từ các nền tảng học tập trực tuyến

Trong quá trình triển khai thuật toán sentiment analysis, việc thu thập dữ liệu từ các nền
tảng học trực tuyến là bước quan trọng nhằm đảm bảo mô hình có khả năng phản ánh
chính xác và đáp ứng nhu cầu cụ thể của người dùng. Có một số phương pháp để thu thập
dữ liệu từ các nền tảng này. Đầu tiên, bạn có thể sử dụng API được cung cấp bởi các nền
tảng học trực tuyến như Coursera, edX, Udemy để truy cập thông tin về các khóa học, bài
giảng, bài tập và phản hồi từ học viên. Thứ hai, sử dụng các công cụ crawler và scraping
để tự động thu thập dữ liệu từ các trang web của các nền tảng học trực tuyến. Bạn cũng có
thể tìm kiếm và sử dụng dữ liệu mở được chia sẻ trên các diễn đàn, blog hoặc kho dữ liệu
công cộng. Hơn nữa, có thể liên hệ trực tiếp với các tổ chức giáo dục và doanh nghiệp
hoặc các nhà cung cấp dịch vụ học trực tuyến để yêu cầu cung cấp dữ liệu hoặc hợp tác
trong việc thu thập dữ liệu. Tổ chức các khảo sát hoặc phỏng vấn với học viên cũng là
cách thu thập dữ liệu hiệu quả. Trong quá trình thu thập dữ liệu, cần chú ý đến việc bảo
mật và tuân thủ các quy định pháp lý liên quan, đồng thời xác định rõ mục đích sử dụng
dữ liệu và đảm bảo quá trình thu thập diễn ra có trách nhiệm và minh bạch.

32
Bên cạnh đó, khi thu thập dữ liệu từ các nền tảng học trực tuyến, cần lưu ý đến việc xác
định đối tượng mục tiêu cụ thể mà bạn muốn nghiên cứu. Điều này giúp định hình rõ ràng
mục đích và phạm vi của dự án, từ đó tối ưu hóa quá trình thu thập dữ liệu. Hãy xem xét
việc thu thập dữ liệu từ một loạt các nguồn khác nhau để có cái nhìn toàn diện về cảm
nhận của người dùng đối với các khóa học, tài liệu học và trải nghiệm học tập trên các
nền tảng học trực tuyến khác nhau. Đồng thời, cần chú ý đến việc xử lý và lưu trữ dữ liệu
một cách an toàn và hiệu quả, đảm bảo tính nhất quán và khả năng tái sử dụng trong quá
trình phân tích và ứng dụng thuật toán sentiment analysis sau này. Quan trọng nhất, hãy
luôn thực hiện việc thu thập dữ liệu một cách đạo đức và tuân thủ các nguyên tắc đạo đức
nghiên cứu để đảm bảo tính minh bạch và công bằng trong quá trình nghiên cứu và phát
triển.

2.4.2. Tiền xử lý dữ liệu văn bản

Trong quá trình triển khai thuật toán sentiment analysis, việc tiền xử lý dữ liệu văn bản
đóng vai trò quan trọng để chuẩn bị dữ liệu cho quá trình xây dựng và huấn luyện mô
hình. Đây là bước đầu tiên và quan trọng nhất trong quy trình phân tích cảm xúc, vì dữ
liệu văn bản thường không được "sạch" và đồng nhất từ các nguồn khác nhau. Bằng cách
loại bỏ dấu câu và ký tự đặc biệt, chuyển đổi văn bản về chữ thường, loại bỏ stop words,
tokenization, chuẩn hóa từ vựng, stemming và lemmatization, cùng với việc vector hóa,
chúng ta có thể tinh chỉnh và làm sạch dữ liệu để đảm bảo rằng mô hình sentiment
analysis sẽ có khả năng xử lý và phân tích dữ liệu một cách chính xác và hiệu quả.

Các phương pháp tiền xử lý này giúp tạo ra một bộ dữ liệu thống nhất, loại bỏ các yếu tố
không cần thiết và tối ưu hóa dữ liệu cho mô hình phân tích cảm xúc. Bằng cách này,
chúng ta có thể đảm bảo rằng kết quả phân tích sẽ phản ánh chính xác cảm xúc của người

33
dùng đối với các khóa học, tài liệu học và trải nghiệm học tập trên các nền tảng học trực
tuyến. Điều này không chỉ cung cấp thông tin cảm xúc chính xác và ý nghĩa, mà còn giúp
tăng cường khả năng phản hồi và tương tác giữa học sinh và giáo viên, từ đó cải thiện trải
nghiệm học tập và chất lượng giảng dạy. Đồng thời, việc thu thập và tiền xử lý dữ liệu
văn bản từ các nền tảng học trực tuyến cũng mở ra cơ hội cho nghiên cứu và phát triển
trong lĩnh vực phân tích cảm xúc và học máy trong giáo dục.

2.4.3. Xây dựng và huấn luyện mô hình Sentiment Analysis

Trong quá trình triển khai thuật toán sentiment analysis, việc xây dựng và huấn luyện mô
hình sentiment analysis đóng vai trò quan trọng trong việc đảm bảo rằng mô hình có khả
năng phân loại cảm xúc từ dữ liệu văn bản một cách chính xác và hiệu quả. Bước này
không chỉ đòi hỏi kiến thức chuyên sâu về các phương pháp và thuật toán trong lĩnh vực
máy học và xử lý ngôn ngữ tự nhiên, mà còn đòi hỏi sự kiên nhẫn và kỹ năng tinh chỉnh
mô hình để đạt được hiệu suất tối ưu.

Một trong những bước quan trọng nhất khi xây dựng mô hình sentiment analysis là chọn
lựa một kiến trúc mô hình phù hợp. Có nhiều loại mô hình khác nhau có thể được sử
dụng, bao gồm mô hình truyền thống như Naive Bayes và Support Vector Machines
(SVM), cũng như các mô hình dựa trên mạng nơ-ron như Recurrent Neural Networks
(RNN), Long Short-Term Memory (LSTM), và các biến thể khác của chúng. Sự lựa chọn
của mô hình phụ thuộc vào nhiều yếu tố như loại dữ liệu, kích thước tập dữ liệu, và yêu
cầu của bài toán cụ thể.

Sau khi chọn được mô hình phù hợp, bước tiếp theo là chuẩn bị dữ liệu cho quá trình
huấn luyện. Dữ liệu văn bản thường cần được biểu diễn dưới dạng các vectơ số để có thể
đưa vào mô hình máy học. Phương pháp phổ biến nhất để biểu diễn dữ liệu văn bản là sử

34
dụng biểu diễn nhúng từ (word embeddings) như Word2Vec hoặc GloVe để chuyển đổi
từng từ trong câu thành các vectơ có chiều thấp.

Tiếp theo, mô hình được xây dựng và huấn luyện trên tập dữ liệu huấn luyện đã được
chuẩn bị. Quá trình huấn luyện này thường được thực hiện thông qua việc tối ưu hóa hàm
mất mát sử dụng các thuật toán tối ưu hóa như Gradient Descent hoặc Adam. Trong quá
trình huấn luyện, các siêu tham số của mô hình cũng được điều chỉnh để tối ưu hóa hiệu
suất của mô hình.

Sau khi hoàn thành quá trình huấn luyện, mô hình được đánh giá trên tập kiểm tra để đánh
giá độ chính xác và hiệu suất của nó. Các phương pháp đánh giá phổ biến bao gồm độ
chính xác, độ phủ (recall), độ chính xác nhị phân (precision), và F1-score. Điều này giúp
đánh giá khả năng của mô hình trong việc phân loại cảm xúc từ dữ liệu mới.

Cuối cùng, dựa trên kết quả đánh giá, mô hình có thể được tinh chỉnh và cải thiện để đạt
được hiệu suất tốt nhất có thể. Việc này bao gồm việc điều chỉnh các siêu tham số của mô
hình, thay đổi kiến trúc mô hình, hoặc thậm chí là thay đổi phương pháp biểu diễn dữ
liệu. Quá trình này thường cần sự lặp lại và thử nghiệm để đảm bảo rằng mô hình đạt
được hiệu suất tối ưu trước khi triển khai vào môi trường thực tế.

2.4.4. Áp dụng mô hình để đánh giá cảm nhận của học sinh đối với các khóa học, tài
liệu học, v.v

Áp dụng mô hình để đánh giá cảm nhận của học sinh đối với các khóa học, tài liệu học và
các yếu tố khác trong môi trường học tập số là một phần quan trọng trong quá trình ứng

35
dụng sentiment analysis. Bằng cách này, chúng ta có thể hiểu rõ hơn về cảm nhận của học
sinh đối với các yếu tố này và cung cấp phản hồi tự động để cải thiện trải nghiệm học tập.

Đầu tiên, để áp dụng mô hình, chúng ta cần thu thập dữ liệu từ các nguồn khác nhau trong
môi trường học tập số. Điều này có thể bao gồm các bài đăng trên diễn đàn, bình luận từ
các bài giảng trực tuyến, phản hồi từ các bài kiểm tra hoặc bài tập, và thậm chí là các bài
đăng trên mạng xã hội hoặc các nền tảng phản hồi của học sinh.

Tiếp theo, chúng ta sẽ sử dụng mô hình đã được xây dựng và huấn luyện từ các dữ liệu
thu thập để phân tích cảm nhận của học sinh. Mô hình sẽ phân loại các phản hồi từ học
sinh thành các nhãn cảm xúc như tích cực, tiêu cực hoặc trung tính. Điều này cho phép
chúng ta đánh giá mức độ hài lòng, sự quan tâm và cảm nhận của học sinh đối với các
khóa học, tài liệu học và các yếu tố khác trong môi trường học tập số.

Sau khi mô hình đã phân loại cảm nhận của học sinh, chúng ta có thể sử dụng kết quả này
để tạo ra phản hồi tự động. Ví dụ, nếu một số học sinh cho phản hồi tích cực về một khóa
học cụ thể, chúng ta có thể sử dụng phản hồi này để đánh giá và cải thiện chất lượng của
khóa học đó. Ngược lại, nếu có phản hồi tiêu cực, chúng ta có thể xem xét những điểm
yếu và cố gắng cải thiện chất lượng của khóa học hoặc tài liệu.

Trong môi trường học tập số, việc áp dụng mô hình sentiment analysis không chỉ giúp
chúng ta hiểu được ý kiến của học sinh một cách tổng quát mà còn giúp chúng ta cung
cấp phản hồi cụ thể và có ý nghĩa, từ đó cải thiện trải nghiệm học tập và tương tác giữa
học sinh và giáo viên. Điều này có thể giúp tạo ra một môi trường học tập tích cực và
đồng thời thúc đẩy sự phát triển và tiến bộ trong giáo dục.

36
2.4.5. Tạo ra phản hồi tự động dựa trên kết quả Sentiment Analysis để cải thiện trải
nghiệm học tập của học sinh và tương tác giữa học sinh và giáo viên

Trong quá trình triển khai thuật toán sentiment analysis, việc tạo ra phản hồi tự động dựa
trên kết quả của mô hình sentiment analysis đóng vai trò quan trọng trong việc cải thiện
trải nghiệm học tập của học sinh và tương tác giữa học sinh và giáo viên. Quá trình này
bắt đầu bằng việc phân loại cảm xúc của học sinh từ các phản hồi của họ đối với các yếu
tố trong môi trường học tập số, như các khóa học, tài liệu học, và các hoạt động học tập
khác.

Sau khi cảm xúc của học sinh đã được phân loại, các mẫu và quy tắc được xác định để tạo
ra phản hồi tự động. Các mẫu này phản ánh sự đa dạng và cá nhân hóa, giúp tạo ra phản
hồi có ý nghĩa và phù hợp với mỗi trường hợp cụ thể. Phản hồi này không chỉ đưa ra nhận
định về cảm xúc của học sinh mà còn cung cấp thông tin và hỗ trợ để cải thiện trải
nghiệm học tập.

Tích hợp phản hồi vào hệ thống học tập là một bước quan trọng khác. Việc này đảm bảo
rằng phản hồi có thể được truy cập và sử dụng bởi học sinh và giáo viên một cách thuận
tiện. Đồng thời, quá trình này cũng cung cấp một cơ hội để đánh giá và tinh chỉnh hệ
thống phản hồi tự động dựa trên phản hồi từ người dùng, từ đó tối ưu hóa hiệu suất và
hiệu quả của nó.

Từ những quy trình trên, việc áp dụng mô hình sentiment analysis để tạo ra phản hồi tự
động không chỉ giúp cải thiện trải nghiệm học tập của học sinh mà còn tạo ra một môi
trường tương tác tích cực giữa học sinh và giáo viên. Điều này có thể thúc đẩy sự tham

37
gia và tiến bộ trong quá trình học tập, đồng thời tạo ra một cộng đồng học tập tích cực và
hỗ trợ.

38
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

39
TÀI LIỆU THAM KHẢO
[1]. Liu, Bing, “Sentiment analysis and opinion mining”, Synthesis Lectures on Human
Language Technologies, 2012.
[2]. Bo Pang, Lillian Lee, “Opinion mining and sentiment analysis”, Foundations and
Trends® in Information Retrieval, Now Publishers Inc,2008.
[3]. Maite Taboada, Julian Brooke, Milan Tofiloski, Kimberly Voll, Manfred Stede,
“Lexicon-based methods for sentiment analysis”, Computational Linguistics, MIT
Press,2011.

40
PHỤ LỤC
(nếu có)

41

You might also like