Professional Documents
Culture Documents
XỬ LÝ TIẾNG NÓI
XỬ LÝ TIẾNG NÓI
XỬ LÝ TIẾNG NÓI
(Speech Processing )
1. Thông tin chung về môn học
- Tên môn học: Xử lý tiếng nói
- Mã môn học: DTLM1210
- Số đvht: 3
- Loại môn học: Bắt buộc
- Các môn học tiên quyết: Xử lý tín hiệu số
- Phân bổ giờ đối với các hoạt động:
Giảng lý thuyết : 40 tiết
Hướng dẫn bài tập trên lớp : 5 tiết
Thảo luận trên lớp :
Thực hành, thí nghiệm :
Hoạt động theo nhóm :
Tự học : 90 giờ
- Khoa/Bộ môn phụ trách môn học: Lý thuyết mạch
2. Mục tiêu của môn học
- Kiến thức: Nắm được các kiến thức cơ bản về xử lý tiếng nói
- Kỹ năng: Có khả năng nghiên cứu và giải bài tóan cơ bản về xử lý tiếng nói.
- Thái độ, chuyên cần: Nghiêm túc học tập và nghiên cứu
3. Tóm tắt nội dung môn học (khoảng 150 từ)
Môn học cung cấp cho sinh viên những khái niệm cơ bản về tín hiệu tiếng nói, các kiến
thức cơ bản về các phương pháp biểu diễn số của tín hiệu tiếng nói; các phương pháp và kỹ thuật
xử lý tiếng nói: các phương pháp và thuật toán phân tích, các phương pháp tổng hợp tiếng nói;
đồng thời cũng cung cấp cho sinh viên các kiến thức về các hệ thống và các thuật tóan nhận dạng
tiếng nói.
Đồng thời môn học còn giúp sinh viên nghiên cứu có khả năng tư duy và tiếp cận một số
phương pháp xử lý tiếng nói mới.
4. Nội dung chi tiết môn học
Chương 1: Một số khái niệm cơ bản LT6
1.1 Mở đầu
1.2 Quá trình tạo tiếng nói
1.3 Các đặc tính cơ bản của tiếng nói
1.3.1 Dạng sóng và công suất tiếng nói
1.3.2 Tần số cơ bản và phổ tần
1.3.3 Các đặc điểm âm học
Chương 2: Biểu diễn số của tín hiệu tiếng nói LT8/BT1
2.1 Mở đầu
2.2 Lấy mẫu tín hiệu tiếng nói
2.3 Lượng tử hoá tức thời
2.4 Lượng tử hoá thích nghi
2.5 Lượng tử hoá sai phân
2.6 Điều chế xung mã (PCM)
2.7 Điều chế Delta
2.8 Biểu diễn tín hiệu tiếng nói
8.1 Biểu diễn tín hiệu tiếng nói trong miền thời gian
8.2 Biểu diễn tín hiệu tiếng nói trong miền tần số
8.3 Biểu diễn tín hiệu tiếng nói trong miền thời gian và tần số kết hợp
2.9 Thực hành lấy mẫu tiếng nói sử dụng các bộ công cụ
Chương 3: Phân tích tiếng nói LT8/BT1/KT1
3.1 Mở đầu
3.2 Mô hình phân tích tiếng nói
3.3 Phân tích phổ tiếng nói
3.4 Xác định tần số Formant
3.5 Xác định tần số cơ bản
3.6 Trích chọn đặc trưng tín hiệu tiếng nói
3.6.1 Tiền xử lý âm thanh và tiếng nói
3.6.2 Phân khung và hàm cửa sổ
3.7 Thực hành phân tích tiếng nói
Chương 4: Tổng hợp tiếng nói LT8/BT1
4.1 Mở đầu
4.2 Các phương pháp tổng hợp tiếng nói
4.2.1 Tổng hợp trực tiếp
4.2.2 Tổng hợp trực tiếp
4.2.3 Bộ mã hoá tiếng nói
4.2.4 Tổng hợp tiếng nói theo Formant
4.2.5 Tổng hợp tiếng nói theo phương pháp mô phỏng bộ máy phát âm
Chương 5 Nhận dạng tiếng nói LT9/BT2
5.1 Mở đầu
5.2 Phân loại các hệ thống nhận dạng tiếng nói
5.3 Cấu trúc hệ nhận dạng và một số thuật toán nhận dạng tiếng nói
5.4 Phân tích mã hóa dự đoán tuyến tính
5.4.1 Mô hình và phương pháp phân tích LPC
5.4.2 Lượng tử hóa vector
5.4.3 Bộ xử lý LPC trong nhận dạng tiếng nói
5.5 Phân tích MFCC trong nhận dạng
5.6 Giới thiệu một số phương pháp nhận dạng tiên tiến.
5.7 Thực hành nhận dạng tiếng nói
5. Học liệu
- Học liệu bắt buộc:
o Sách, giáo trình chính (Sách, Giáo trình của Học viện Công nghệ Bưu chính
Viễn thông hoặc của các Nhà xuất bản có uy tín trong nước và quốc tế đã xuất
bản)
- Học liệu tham khảo
[1] John R. Deller, John H.L.Hansen, John G.Proakis, Discrete-Time Processing of Speech
Signals, Wiley-IEEE Press, 1999
[2] Lawrence Rabiner, Fundamentals of Speech Recognition, Prentice Hall, Inc, 1997
[3] Claudio Becchetti, Lucio Prina Ricotti, Speech Recognition Theory and C++
Implementation, 1999
[4] John-Paul, Hosom, Training Neural Network for Speech Recognigion, CSLU, 1999
6. Hình thức tổ chức dạy học:
Yêu
cầu
sinh
viên Ghi
Hình thức tổ chức dạy-học
chuẩn chú
bị trước
khi lên
Thời
Nội dung lớp
gian
Giờ lên lớp Thực
hành, Tự
thí học, tự
Hướng
Lý Thảo nghiệm nghiên
dẫn
thuyết luận (đã cứu
Bài tập
quy (Giờ)
đổi)
Chương 1: Một số khái
Đọc
Tuần niệm cơ bản
3 Quyển
1: 1.1 Mở đầu
1
1.2 Quá trình tạo tiếng nói
Chương 1: Một số khái
Đọc
Tuần niệm cơ bản
3 Quyển
2: 1.3 Các đặc tính cơ bản 1
của tiếng nói
Tuần Chương 2: Biểu diễn số 3 Đọc
3: của tín hiệu tiếng nói Quyển
2.1 Mở đầu 1
2.2 Lấy mẫu tín hiệu tiếng
nói
2.3 Lượng tử hoá tức thời
2.4 Lượng tử hoá thích
nghi