Professional Documents
Culture Documents
CHUONG2
CHUONG2
CHUONG2
MÃ HÓA NGUỒN
GIỚI THIỆU
- Mã hóa nguồn rời rạc: + Mã Huffman
+ LZW
- Mã hóa nguồn liên tục (Mã hóa dạng sóng):
+ PCM
+ DPCM
+ DM
- Các phương pháp sau cho tốc độ tín hiệu số thấp hơn với
PCM→ sử dụng băng thông tiết kiệm hơn.
3.2. MÃ HÓA NGUỒN RỜI RẠC
Mã hóa Huffman
- Ưu điểm là hệ số nén tương đối cao
- Thực hiện đơn giản, đòi hỏi ít bộ nhớ
- Nhược điểm là cần phải chứa cả bảng mã và tập tin nén
thì phía nhận mới giải mã được nên hiệu suất chỉ cao khi
nén các tập tin lớn
1. Sắp xếp xác suất các ký hiệu theo thứ tự
2. Gộp 2 xác suất thấp nhất
3. Lặp lại bước 2 cho đến khi tổng các xác suất bằng 1.
4. Ấn định từ mã cho ký tự bằng cách đọc đường dẫn từ
gốc đến ký tự đó.
Ví dụ
Cho tập 5 ký tự A, B, C, D, E với tần suất xuất
hiện tương ứng trong bảng dưới đây. Thực hiện
mã hoá Huffman cho tập ký tự này.
Cây mã hoá Huffman
Cây mã hoá Huffman
• Đọc từ mã tương ứng với ký tự theo đường dẫn từ
gốc qua các nhánh đến ký tự đó.
Mã hoá
• Hình dưới đây mô tả quá trình mã hoá đoạn văn bản
sử dụng bộ mã vừa tạo ra. Đầu vào là đoạn văn bản
gốc và và đầu ra là kết quả sau mã hoá.
Giải mã
• Phía thu thực hiện giải mã chuỗi dữ liệu nhận được
như hình vẽ dưới đây:
Đặc điểm của mã Huffman
Quá trình mã hóa các ký tự được thực hiện
chỉ 1 lần.
Mã Huffman được gọi là mã khối vì mỗi ký tự
được biểu diễn bằng một từ mã cố định.
Việc giải mã từng ký hiệu được thực hiện tức
thời vì không phụ thuộc ký hiệu trước và sau.
Nhược điểm của mã này là phải biết xác suất
xuất hiện của các ký tự trước khi mã hoá.
Mã LZW – Lempel-Ziv-Welch
Ý tưởng là tạo ra từ điển (1 bảng) các chuỗi được sử
dụng trong phiên truyền thông.
LZW sử dụng các từ mã chiều dài cố định để biểu
diễn các chuỗi ký tự chiều dài thay đổi thường xảy ra
cùng nhau, ví dụ các từ trong đoạn văn bản.
Bộ mã hoá và giải mã LZW cùng xây dựng một bộ từ
điển trong quá trình nhận dữ liệu.
Nếu cả bên gửi và bên nhận đều có bản copy của cuốn
từ điển (dictionary) thì các chuỗi đã gặp trước đó sẽ
được thay thế bằng mục lục của chúng để làm giảm
lượng thông tin cần truyền.
Một dãy các ký hiệu của nguồn rời rạc được chia thành
các khối có độ dài thay đổi gọi là các câu.
Một câu mới là một khối các ký hiệu của nguồn và là
một câu đã có thêm vào một ký hiệu cuối cùng.
Các câu được liệt kê trong từ điển kèm vị trí xuất hiện
Để mã hóa một câu mới, chỉ ra vị trí của câu đã có
trong từ điển và chèn thêm ký hiệu mới vào phía cuối.
Ví dụ
• Xét dãy ký hiệu nhị phân
• 1010110100100100111010101000011001110101011000
11011
• Chia dãy ký hiệu thành các câu:
• 1,0,10,11,01,00,100,111,010,1000,011,011,001,110,
Để giải mã cần xây dựng lại từ điển ở phía thu giống
như phía phát và giải mã lần lượt các từ mã nhận được.
Nhận xét trong ví dụ trên thuật toán sẽ hiệu quả hơn và
có nén nếu dãy ký hiệu quan sát dài thêm.
Độ lớn từ điển phụ thuộc bộ nhớ dùng trong lưu trữ. Để
giải quyết tràn bộ nhớ, bộ mã hóa và bộ giải mã cần
thống nhất loại bỏ những câu không còn sử dụng và thay
thế vào các câu mới.
Thuật toán LWZ dùng rộng rãi trong nén số liệu các tệp
(file) máy tính, tiện ích như compress, uncompress trong
hệ điều hành DOS, UNIX…
3.2. ĐIỀU CHẾ XUNG MÃ (Pulse Code Modulation – PCM)
-Gồm
- lấy mẫu tín hiệu (PAM),
- lượng tử hoá
- mã hoá
1. LẤY MẪU
-Là bước đầu tiên để biến đổi tương tự - số theo kỹ thuật PCM.
-Mục đích từ tín hiệu tương tự, tạo dãy xung rời rạc tuần hoàn rộng
bằng nhau, biên độ xung bằng giá trị tín hiệu tương tự tại thời điểm lấy
mẫu.
-Dãy xung rời rạc đó là tín hiệu PAM (Pulse Amplitude Modulation).
-Nếu PAM có tần số đủ lớn (khoảng cách giữa các xung cạnh nhau đủ
nhỏ) thì có thể khôi phục lại tín hiệu tương tự ban đầu từ tín hiệu PAM.
• Định lý lấy mẫu: ‘Tín hiệu x(t) liên tục, phổ hữu hạn, tần số fmax
được xác định bởi các giá trị lấy mẫu của chúng với tần số lấy mẫu
f s 2f max
• x(t) phục hồi chính xác nếu cho tín hiệu lấy mẫu của nó qua bộ lọc
thông thấp lý tưởng có dải thông B với f max B f s f max
• Tổng các giá trị lấy mẫu là:
T
N 1 2f maxT 1
Ts
(T là khoảng thời gian tồn tại của tín hiệu)
Lấy mẫu tín hiệu thoại tương tự phổ 0.3 - 3.4 kHz thì theo định lý lấy
mẫu tính được n = int(3.4/3.1) = 1 nên fs ≥ 6.8 kHz. Thực tế, CCITT
quy định fs = 8 kHz.
Lấy mẫu tự nhiên (natural sampling)
• quá trình nhân tín hiệu tương tự với dãy xung lấy mẫu pT(t).
• Nếu fs không thoả mãn định lý lấy mẫu thì các phiên bản phổ
chồng lấn lên nhau→ chồng phổ hay mập mờ phổ (aliasing).
• Thực hiện: chuyển mạch hai đầu vào một đầu ra tương tự (analog
bilateral switch)→CM4016 (sẵn trong phần cứng của CMOS).
Lấy mẫu tức thời (instaneous sampling)
• Giá trị flat-top PAM = giá trị tín hiệu tương tự ở ngay thời điểm
lấy mẫu và giữ trong thời gian bằng độ rộng xung lấy mẫu.
• f(t) lấy mẫu tại t kTS , các giá trị mẫu f kTS xác định biên độ
của xung chữ nhật đỉnh phẳng.
Tín hiệu lấy mẫu tức thời
• Tín hiệu PAM lấy mẫu tức thời:
fS (t )
k
f (kTS )h(t kTS )
2
Với TS 1 f và f S 2 f max
S
• Định lý:
• Phổ tín hiệu PAM flat-top là :
1
FS ( f ) H ( f ) F ( f kf S )
TS k
Với
sin f
H ( f ) F h(t )
f
• Tạo tín hiệu flat-top PAM, sử dụng bộ lấy mẫu và giữ mẫu
• Vào thời điểm lấy mẫu, khóa đóng. C nạp rất nhanh do rC rất nhỏ, C
nạp đến điện áp = giá trị điện áp tín hiệu tương tự vào→lấy mẫu.
• Sau đó khóa mở, RC rất lớn → điện áp trên C gần như không thay
đổi→ giai đoạn giữ mẫu.
• Thực tế quan tâm nhiều lấy mẫu tức thời vì không cần dùng hình dạng
xung để chứa thông tin truyền đi và dễ tạo dạng xung chữ nhật. Thông
tin chỉ chứa trong biên độ của xung tại thời điểm lấy mẫu
2. LƯỢNG TỬ HÓA
• Là sự xấp xỉ hóa các giá trị của các mẫu tương tự bằng cách sử dụng
số mức hữu hạn L.
• Nếu trực tiếp phát đi các xung có biên độ tỷ lệ với x nTs là điều biên
xung thông thường.
• Trên đồ thị x(t), chia trục tung thành những khoảng x S (kích
thước bước), từ 0 đến L (L nguyên dương),
– S tuân theo quy luật - lượng tử hóa không đều (phi tuyến)
• Biểu diễn các trị số x nTs bằng các số 0 L tại các thời điểm nTs
• Không phát các xung biên độ tỷ lệ trực tiếp với x nTs mà trước hết qui
tròn các số đó thành các số nguyên xn gần với nó nhất:
1 1
x n 1 x x n x n 1 x
2 2
• Phát đi các xung có biên độ tỷ lệ với các số nguyên x nTs gọi là điều
biên xung lượng tử hoá.
x(t)
Nx
4x
x
t
0 1 2 3 4 5 6 7
Ts
• Mục đích lượng tử hoá:
• Để thực hiện điều xung mã: sử dụng tập hợp các số nguyên để ký
hiệu tin tức gọi là mã hoá tin tức.
• Lượng tử hoá có tác dụng tăng tính chống nhiễu.
• Lỗi xuất hiện nếu biên độ nhiễu vượt quá S/2. Nhiễu bị loại bỏ nếu biên
độ nhỏ hơn S/2. Vậy tăng kích thước bước có thể giảm bớt sự tích luỹ
nhiễu.
• Nhưng tăng S sẽ tăng sai khác giữa tín hiệu gốc và tín hiệu lượng tử
hóa. Sai khác này gọi là sai số lượng tử hóa (quantizing noise).
• Sai số lượng tử hóa tăng khi kích thước bước tăng và ngược lại.
• Nhiễu lượng tử hoá khác nhiễu ngẫu nhiên là có thể biết qui luật nên
khắc phục được, như phương pháp lượng tử hoá không đều.
• Khi lượng tử hóa, giới hạn biên độ của tín hiệu bản tin x(t) là (-xp, xp ),
giả sử lượng tử hóa đều thì 2xp
x S
L: số mức lượng tử hóa L
S0 x (t ) 2
x (t ) 2
3L2 2 12 2
N0 xp S
xp : biên độ đỉnh của tín hiệu được lượng tử hóa
• Công suất trung bình của sai số lượng tử hóa phụ thuộc S.
• Nếu S không đổi thì S/N nhỏ với tín hiệu có biên độ nhỏ, S/N lớn với tín
hiệu có biên độ lớn.
• Để đạt S/N đồng đều mà không làm tăng số mức lượng tử hóa thì dùng
lượng tử hóa không đều với S thay đổi
– S nhỏ với tín hiệu có biên độ nhỏ
• Luật lượng tử logarit được sử dụng trong nén và giãn, biến đầu vào x
được chuyển thành biến y theo quan hệ y = log x
• 2 tiêu chuẩn, luật Bắc Mỹ, Nhật Bản, luật A châu Âu và các nước
• Luật
1 xm
y ln 1 0 X 1
ln 1 x p
1 1
• Luật A: X 0 X
1 ln A A
y
1 1 ln AX
1
X 1
1 ln A A
xm
X
xp
xm là biên độ tín hiệu và xp là giá trị cực đại của biên độ
• Một ưu điểm nữa của lượng tử hóa là khắc phục sự tích lũy nhiễu trong
thông tin đường dài. Đặt các trạm chuyển tiếp suốt dọc hệ thống, các
trạm này thu tín hiệu của trạm trước, lượng tử hóa và phát tiếp đi, bằng
cách này loại bỏ được nhiễu tích lũy.
3. MÃ HÓA
• Quá trình chuyển các giá trị mẫu đã lượng tử hóa sang biểu diễn dưới
dạng tập hợp các ký hiệu.
• Ví dụ mức lớn nhất mà x(t) đạt được trong thang lượng tử hóa là L ,
để mã hóa nó theo mã nhị phân, cần dùng n con số sao cho:
2 n 1
L2 n
hay log 2 L n log 2 L 1
4. Một số tính chất của tín hiệu PCM
• R: số bit truyền trong một giây của tín hiệu PCM. R gọi tốc độ bit (bit/s
hay bps). Gọi n số bit của một từ mã PCM; fs tần số lấy mẫu
• Nếu tín hiệu lấy mẫu có phổ giới hạn là fmax, thì độ rộng yêu cầu tối thiểu
của kênh truyền BT là:
nfs
BT R nf max = (Hz)
2 2
• Băng thông tín hiệu PCM lớn hơn băng thông tín hiệu tương tự tương
ứng là khuyết điểm chính của hệ thống PCM
• Một ưu điểm nổi bật của PCM so với các phương pháp điều chế tương
tự khác là cho phép truyền tín hiệu tương tự như tín hiệu số.
• Điều xung mã là loại tín hiệu có tính chống nhiễu cao so với các loại
tín hiệu khác.
• Nếu chọn bước lượng tử hóa nhỏ thì đạt độ chính xác cao, nhưng
bước lượng tử hóa quá nhỏ sẽ làm giảm ưu điểm về tính chống nhiễu.
• Nếu bước lượng tử hóa nhỏ làm tăng độ rộng của kênh thông tin.
Ta thấy cứ tăng thêm 1 bit trong từ mã PCM thì S/N sẽ tăng được 6,02dB
3.2. Ghép kênh phân chia theo thời gian của tín hiệu PAM
- tỷ số T S rất nhỏ ( để khôi phục càng giống với tín hiệu ban đầu) nghĩa là
khoảng cách giữa hai xung PAM cạnh nhau rất lớn.
- Lợi dụng khoảng cách lớn này để ghép và truyền đi các xung PAM khác
- Đó là nguyên lý ghép kênh theo thời gian TDM (Time Division Multiplexing)
3.3. CÁC KỸ THUẬT SỐ HÓA GIẢM BĂNG THÔNG
• Các đường truyền vật lý (cáp đồng trục, cáp sợi quang, vi ba...) chỉ cho
truyền tín hiệu qua trong một dải tần số hữu hạn.
Cần sử dụng băng thông hiệu quả, để truyền nhiều kênh thông tin nhất
với một băng thông sẵn có.
tìm phương pháp giảm băng thông của tín hiệu truyền trên kênh.
• Tín hiệu thông tin như tiếng nói, hình ảnh, âm thanh... có sự tương
quan (correlation) đáng kể giữa các mẫu cạnh nhau.
• DPCM dùng thuật toán dự đoán (predict), dự đoán giá trị mẫu tương
lai, đợi giá trị mẫu thực sự xuất hiện để kiểm tra, sau đó truyền đi tín
hiệu biểu diễn sai khác giữa giá trị dự đoán với giá trị thực sự.
• Sai khác này biểu diễn cho phần không dự đoán được. DPCM mã hóa
với độ dài từ mã giảm, băng thông tín hiệu giảm.
• Thực hiện sơ đồ theo cách ước lượng giá trị mẫu thứ n từ các mẫu
trước đó, xˆ nTs là giá trị ước lượng của x nTs giá trị phát đi là sai
số:
e nTS x nTs xˆ nTS
• Phía thu giá trị x nTs được xác định từ e nTs và xˆ nTs .
• Nếu dự đoán chính xác thì xˆ nTs x nTS tức sai số ước đoán
nhỏ, thậm chí nhỏ hơn sai khác giữa các mẫu lân cận.
• Sự khác nhau giữa tín hiệu vào và dạng xấp xỉ được lượng tử hóa
thành 2 mức , ứng với sự khác nhau dương và âm tương ứng.
xq(t)
x(t)
Ts
t
• Nguyên lý hoạt động:
So sánh
eq(nTs)
x(nTs) +
Lượng tử hóa Mã hoá
e(nTs) Tín hiệu
-
DM
xq(nTs-Ts) +
+
Trễ Ts
(a) xq(nTs)
Accumulator
Vào +
Giải mã
LPF Ra
+
Trễ Ts
(b)
Accumulator
• Tín hiệu sau lấy mẫu x nTs đến bộ so sánh, nó so sánh với giá trị dự
đoán (giá trị gần đúng của nó sau khi qua bộ trễ với thời gian trễ Ts )
• Sai số e nTs được lượng tử hóa bởi 2 mức tùy thuộc dấu của sai số
– Nếu tín hiệu vào x nTs > giá trị dự đoán xq nTs Ts hay e nTs 0 thì lấy giá trị +
• Tín hiệu ra bộ lượng tử hóa e nTs được mã hóa thành tín hiệu nhị phân
ở bộ mã hóa tín hiệu DM.
• Phía thu, tín hiệu nhị phân qua bộ giải mã và tín hiệu xq nTs ở đầu ra bộ
giải mã đưa đến bộ tích phân, bộ lọc thông thấp để hạn chế băng tần.
Nhận xét:
• Ưu điểm chính của điều chế Delta là tính đơn giản (không yêu cầu bộ
mã hóa/giải mã), phần cứng đơn giản hơn PCM giá thành thấp.
• Trong DM, mỗi mẫu x nTs được mã hóa bằng một xung đơn có biên
độ + hoặc -.
• Tín hiệu DM có thể biểu diễn dưới dạng nhị phân hoặc là "one bit per
sample", tức dùng 1 bit nhị phân để mã hóa cho một xung lấy mẫu
DM còn được gọi là điều chế PCM 1 bit - "one bit PCM".
• Méo quá dốc (slop overload): nhiều lúc bộ DM không theo kịp
những biến đổi nhanh của tín hiệu vào, vì vậy tín hiệu mã hóa cách
xa tín hiệu vào một khoảng lớn hơn kích thước bước bộ DM bị
quá tải theo độ dốc (slope overload). Nhiễu quá tải theo độ dốc sẽ
giảm nếu tăng kích thước bước.
• Méo granular (hạt) tương tự méo lượng tử hóa trong PCM, do kích
thước bước quá lớn so với độ dốc lân cận của x(t).
• Nhiễu lượng tử hóa giảm nếu giảm kích thước bước, nhiễu quá tải
theo độ dốc giảm nếu tăng kích thước bước giữ cho hai loại
nhiễu này nằm trong phạm vi cho phép, phải lấy mẫu với tần số lớn
hơn trong PCM, DPCM.
3. ĐIỀU CHẾ DELTA THÍCH NGHI (Adaptive DM - ADM)
• Để giữ cả nhiễu lượng tử hóa và nhiễu quá tải theo độ dốc nằm trong
phạm vi cho phép mà không tăng tần số lấy mẫu lên nhiều lần như
trong DM sử dụng ADM.
• Kích thước bước thay đổi theo tín hiệu vào, kích thước bước lớn khi
có nhiễu quá tải theo độ dốc và nhỏ khi có nhiễu lượng tử hóa.
• Bộ tạo ADM, sử dụng vòng hồi tiếp để điều chỉnh kích thước bước .
• ADM không những khắc phục được nhược điểm về méo trong điều
chế Delta, mà còn đạt tỷ số S/N tốt hơn so với DM.
So sánh
x(nTs) + e(nTs) eq(nTs) ADM
Lượng tử hoá
Mã hoá
-
xq(nTs-Ts)
Đ/k
Trễ Ts g(nTs)
xq(nTs)
Hệ thống ADM
4. Điều chế xung mã vi sai thích nghi (ADPCM)
• PCM tốc độ 64kb/s tiêu chuẩn đòi hỏi độ rộng kênh truyền lớn.
• Một số trường hợp giảm tốc độ bit mã hóa tín hiệu tiếng nói thấp hơn
64kb/s, để truyền trên kênh có dung lượng thấp mà vẫn đảm bảo chất
lượng cho tín hiệu phục hồi. Nhưng tăng tính phức tạp sơ đồ mã hóa,
tăng giá thành sản phẩm.
• Để mã hóa tiếng nói với tốc độ bit thấp, bộ mã hóa dạng sóng cấu
thành dựa trên đặc tính thống kê của dạng sóng tiếng nói và tính chất
của hệ thống thính giác con người. Với 2 mục tiêu:
• Xác định số bit cần để mã hóa phần còn lại của tín hiệu tiếng nói
một cách hiệu quả trên quan điểm giác quan
• Giảm từ 8 bits (tiêu chuẩn trong PCM) xuống 4 bits cho mỗi mẫu, sử
dụng tổ hợp lượng tử hóa thích nghi và dự đoán thích nghi trong sơ đồ
mã hóa số để đạt chất lượng tốt trong dải rộng, gọi ADPCM.
• Lượng tử hóa thích nghi, kích thước bước lượng tử hóa nTs biến đổi
theo thời gian.
- Bộ mã hóa trong miền tần số, trong đó tín hiệu tiếng nói được chia
thành một số băng con và mã hóa riêng rẽ.
- Bộ mã hóa tín hiệu tiếng nói với tốc độ 16kb/s, chất lượng tiêu chuẩn
(ở tốc độ PCM chuẩn 64kb/s).
- Tín hiệu trong miền thời gian ứng với mỗi dải được mã hóa độc lập.
- Thực tế tín hiệu các băng riêng biệt không mang cùng năng lượng
- Trong mã hóa audio, dải tần thấp chứa phần lớn năng lượng tín hiệu,
nhiễu lượng tử ít ảnh hưởng đến tai người nghe ở miền tần thấp mã
hóa tín hiệu ở băng tần thấp bằng ít bit, tín hiệu miền tần số cao được
mã hóa bằng nhiều bit hơn
• Các hãng sản xuất đầu compact disc đã thành công mã hóa phân
chia 32 băng con với tín hiệu hi-fi 20 kHz. Bộ mã hóa PCM đơn giản
lấy mẫu tần số 44.1 kHz yêu cầu 700 kbps hay 15 bit trên một mẫu
nhưng bộ mã hóa băng con trên cơ sở DFT chỉ yêu cầu 88 kbps
hay 2 bit trên một mẫu.