Professional Documents
Culture Documents
Bài Tập Nhóm Powerpoint
Bài Tập Nhóm Powerpoint
ĐỀ TÀI:
Internet of thing và Voice activation
Hà Nội – 2023
[1]
ST
Họ và tên Mã sinh viên Phần công việc
T
[2]
A. LỜI MỞ ĐẦU
[3]
B. TỔNG QUAN VỀ IOT
.
[4]
C. Công nghệ điều khiển bằng giọng nói (voice
activation)
I. Tổng quan về voice activation
1. Khái niệm
- Thiết bị nhận diện giọng nói là một phần mềm có khả năng giải mã
giọng nói của con người, giúp người dùng có thể tương tác với các thiết bị điện
tử qua giọng nói. Công nghệ này được kết hợp cùng với các thiết bị khác như
điện thoại hay nhà thông minh để giúp người dùng có thể ra lệnh, tìm kiếm
thông tin một cách dễ dàng. Một số ví dụ có thể kể đến là Siri, Cotana,…
+ Phục hồi nguyên thể từ: quá trình phục hồi rút gọn từ về dạng
gốc của chúng. Ví dụ từ “sucked” sau quá trình này sẽ trở thành “suck”.
+ Loại bỏ từ dừng: quá trình loại bỏ các từ xuất hiện thường xuyên
trong ngôn ngữ nhưng mang ít hoặc không có nghĩa – từ dừng vd: a, the,
in,… Quá trình này đảm bảo độ chính xác và giảm thiểu số lượng tài
nguyên tính toán cần thiết cho các bước tiếp theo.
- Tiếp theo, các nhà phát triển sử dụng các dữ liệu đã được xử lý trước để
đào tạo các mô hình NLP tuy theo công việc cụ thể dựa trên thông tin lời nói
được cung cấp.
- Cuối cùng, NLP được triển khai và tích hợp, NLP nhận dữ liệu đầu vào
và đưa ra phản hồi tuy vào trường hợp sử dụng cụ thể mà nó được thiết kế.
2.2, Hệ thống điều khiển bằng giọng nói
- Công nghệ điều khiển bằng giọng nói thường được kết hợp cùng các
công nghệ khác vì vây để hiểu hơn cách hoạt động của nó ta sẽ phân tích ví dụ
về trợ lý giọng nói như sau:
- Ví dụ : bạn mở điện thoại và yêu cầu trợ lý giọng nói của bạn giới thiệu
một nhà hàng Ý tốt gần đây. Đây là cách trợ lý giọng nói sử dụng công nghệ
điều khiển giọng nói để thực hiện yêu cầu của bạn, trích xuất thông tin liên quan
và cung cấp một phản hồi phù hợp.
Chuyển đổi: trợ lý giọng nói chuyển đổi các từ nói của bạn thành văn bản
bằng công nghệ nhận dạng giọng nói. Quá trình này cho phép trợ lý giọng
nói làm việc với biểu diễn văn bản của yêu cầu của bạn.
Nhận biết ý định NLP giúp trợ lý giọng nói nhận biết ý định đằng sau yêu
cầu của bạn, trong trường hợp này là tìm một nhà hàng Ý tốt gần đây.
[7]
NLP xác định các thực thể có tên quan trọng trong truy vấn của bạn,
chẳng hạn như “Ý” và “nhà hàng,” giúp trợ lý giọng nói hiểu được lĩnh
vực và ngữ cảnh cụ thể của yêu cầu của bạn.
Các thuật toán NLP phân tích cấu trúc và ý nghĩa của truy vấn của bạn,
xem xét cú pháp, ngữ pháp và ngữ nghĩa. Điều này cho phép trợ lý giọng
nói nắm bắt được chính xác yêu cầu của bạn và cung cấp một phản hồi phù
hợp.
Truy xuất kiến thức: Trợ lý giọng nói sử dụng kiến thức đã có hoặc truy
cập vào các cơ sở dữ liệu bên ngoài để tìm thông tin liên quan về các nhà
hàng Ý trong khu vực của bạn. NLP giúp trợ lý hiểu và giải thích thông tin
đã truy xuất.
Tạo Phản hồi: dựa trên thông tin đã trích xuất, trợ lý giọng nói tạo ra một
phản hồi phù hợp với yêu cầu của bạn. Ví dụ, nó có thể cung cấp một danh
sách các nhà hàng Ý được đánh giá hàng đầu, địa chỉ của họ, thông tin liên
hệ, đánh giá và thậm chí là hướng dẫn đến nhà hàng gần nhất.
Chuyển đổi: sau khi tạo ra phản hồi, trợ lý giọng nói chuyển đổi văn bản
thành các từ nói bằng cách tổng hợp văn bản thành giọng nói. Điều này
cho phép trợ lý truyền đạt thông tin trở lại cho bạn bằng một giọng nói tự
nhiên và giống như con người.
- Một ví dụ khác là hệ thống điều khiển bằng giọng nói trong nhà thông
minh của Samsung:
Hệ thống nhà thông minh của điều khiển bằng giọng nói Sam sung có
mô hình như sau:
[8]
Các thiết bị Samsung được tích hợp Bixby sẽ cho phép người dùng có
thể giao tiếp với chúng. Và qua nền tảng SmartThing các dữ liệu sẽ được
chuyển tới các đồ dùng thông minh được liên kết với nền tảng này để thực
hiện yêu cầu của người dùng. Ví dụ khi bạn ra lệnh “khởi động máy lọc
không khí”, mệnh lệnh của bạn trước tiên sẽ được gửi đến Bixby để thực
hiện các bước chuyển đổi, phân tích ý nghĩa cấu trúc câu lệnh của bạn như
ở VD trên, sau đó mệnh lệnh đó được chuyền qua nền tảng IoT đến với
máy lọc không khí.
[9]
- Qua ví dụ trên ta có thể rút ra, một hệ thống điều khiển giọng nói hiện
nay thường có mô hình gồm:
+ Thiết bị có khả năng nhận diện giọng nói
+ Một mô hình nhân diện câu nói: chuyển đổi, phân tích yêu cầu của
người dùng.
+ Nền tảng IoT: tra cứu thông tin dữ liệu, di chuyển dữ liệu đến các thiết
bị thông minh.
+ Thiết bị thông minh liên kết nền tảng IoT.
ON
(2) (3)
ON
(1) (4)
[10]
Ưu điểm Nhược điểm
- Khả năng tiếp cận: hệ thống điều khiển - Chi phí: Các thiết bị sử dụng hệ
bằng giọng nói cho phép lượng lớn thộng điều khiển giọng nói có giá
người dùng tiếp cận với cộng nghệ số. thành cao, khó tiếp cận với một số
Nâng cao chất lượng sống cho những người.
người khuyết tật, khiếm thị, hay không
- Lỗi, nhận diện sai từ: Mặc dù khả
thể di chuyển.
năng nhận diện giọng nói đã được
- Khả năng kết nối: hệ thống nhận có thể cải thiện trong một vài năm gần đây
dễ dàng kết nối với các công nghệ khác nhưng khi đưa các yếu ảnh hưởng
giúp việc hoàn thành công việc đơn giản đến giọng nói như chất giọng, tiếng
hơn ồn bên ngoài thì khả năng nhận
diện giọng nói của hệ thống lại bị
- Sự tiện lợi: việc tìm kiếm thông tin,
giảm đi đáng kể.
đưa ra các mệnh lệnh sẽ trở nên nhanh
+ Các từ đồng âm khác nghĩa
hơn và dễ dàng hơn bằng giọng nói thay
cũng là một trở ngại lớn cho công
vì phải viết hoặc gõ phím.
nghệ này
- Khả năng cá nhân hóa: hệ thống có thể
được thay đổi, ghỉ nhớ thông tin từ các
cuộc trò chuyện trước từ đó đưa ra gợi ý,
nhắc nhở phù hợp với từng người dùng.
II. Ứng dụng công nghệ điều khiển bằng giọng nói trong
nhà thông minh
Công nghệ nhận dạng giọng nói đang là xu hướng đối với các sản phẩm nhà
thông minh. Nó giúp chủ nhà có thể thực hiện các thao tác bật tắt các thiết bị
điện, các thiết bị an ninh bằng chính giọng nói của mình, không cần phải thao
tác qua smartphone như trước nữa.
[11]
Đối với các gia đình có trẻ nhỏ hay người khuyết tật, khi các thi quá cao
hoặc không thể sử dụng smartphone thì tính năng điều khiển bằng giọng nói sẽ
giúp họ thực hiện một số lệnh cơ bản như bật tắt các thiết bị điện tử, đóng mở
cửa rèm, Hay đối với những gia đình có người cao tuổi, khó khăn trong việc sử
dụng điện thoại thì đây thực sự là một trợ lý đắc lực cho các cụ.
Điều khiển các thiết bị: Người dùng có thể ra lệnh bằng giọng nói để bật/tắt
đèn, điều chỉnh nhiệt độ, mở cửa garage, hoặc thậm chí khóa cửa từ xa.
Thiết lập và điều khiển các kịch bản: Công nghệ nhận dạng giọng nói có thể
được sử dụng để thiết lập và kích hoạt các kịch bản tự động trong nhà thông
minh, chẳng hạn như kịch bản "Buổi tối" để tắt đèn và khóa cửa trước khi đi
ngủ.
Kiểm soát qua trợ lý ảo:
Quản lý hệ thống an ninh:
II. Tương lai của công nghệ điều khiển bằng giọng nói
1. Một số cập nhật mới về công nghệ điều khiển bằng
giọng nói trong năm 2023
- Khả năng hỗ trợ đa ngôn ngữ.
Các hệ thống nhận dạng giọng nói hàng đầu hiện nay cung cấp khả năng đa
ngôn ngữ mạnh mẽ, cho phép người dùng tương tác bằng ngôn ngữ chính của
họ. Điều này mở rộng phạm vi và tính khả dụng của các thiết bị và ứng dụng
được điều khiển bằng giọng nói.
[12]
- Chuyển đổi thời gian thực:
Các hệ thống nhận dạng giọng nói trong năm 2023 có thể cung cấp chuyển đổi
thời gian thực, cho phép người dùng nhận được bản ghi âm trực tiếp của lời nói
của họ. Tính năng này đặc biệt hữu ích trong các tình huống như viết phụ đề
trực tiếp trong sự kiện, cuộc họp hoặc phát sóng.
C. Kết luận
[13]