Chương 3-X Lý At&ha

BÀI GIẢNG MÔN
XỬ LÝ ÂM THANH & HÌNH ẢNH

Chương 3: Kỹ thuật xử lý hình ảnh
Bộ môn: Tín hiệu và Hệ thống

Chương 3- Kỹ thuật xử lý hình ảnh
3.1 Giới thiệu
– Khái niệm ảnh và xử lý ảnh/ Các ứng dụng xử lý ảnh
– Các giai đoạn xử lý ảnh số/ K/n ảnh số/ Các định dạng/Máu sắc..
3.2 Cơ sở xử lý ảnh số
– Cơ sở cảm nhận thị giác
– Số hóa ảnh/ Biểu diễn ảnh số
3.3 Kỹ thuật nén ảnh
– Tổng quan về nén ảnh
– Hiệu quả nén ảnh và chất lượng ảnh
– Phân loại các phương pháp nén ảnh
3.4 Các phương pháp nén ảnh không tổn thất
– Mã hóa Huffman/ Mã hóa số học/ Mã hóa từ điển LZW/
3.5 Các phương pháp nén ảnh có tổn thất
– Mã hóa DPCM/ Mã hóa biến đổi
3.6 Một số chuẩn nén ảnh
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
a) Khái niệm ảnh:
- Thông tin về vật thể hay quang cảnh được chiếu sáng mà con
người quan sát và cảm nhận được bằng mắt và hệ thống thần
kinh thị giác.
- Biểu diễn ảnh về mặt toán học: F(x,y): trong đó x,y là tọa độ
không gian 2 chiều (biến liên tục) và F (biến liên tục) là độ lớn
của độ chói (ánh sáng đơn sắc) hoặc độ lớn của màu (ảnh màu).
- Ảnh số là ảnh thu được từ ảnh liên tục bằng phép lấy mẫu và
lượng tử hóa.
3.1- Giới thiệu
b) Ảnh số:
- Một ảnh số thường được biểu diễn dưới dạng một ma trận
các điểm ảnh.
+ Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x, y) với
mức xám hoặc màu nhất định.
+ Kích thước và khoảng cách giữa các điểm ảnh đó được chọn
thích hợp sao cho mắt người cảm nhận sự liên tục về không gian
và mức xám (hoặc màu) của ảnh số gần như ảnh thật.
- Mỗi một điểm ảnh có thể được biểu diễn bằng:
+ 1 bit (ảnh đen trắng - ảnh nhị phân),
+ 8 bit (ảnh đa mức xám- Gray-scale)
+ 8, 16, 24 bit (ảnh màu)
3.1- Giới thiệu
b) Ảnh số:
- Ảnh đen trắng: mỗi điểm ảnh được biểu diễn bằng 1 bit,
các ảnh này đôi khi còn được gọi là ảnh 2 mức (Bi-level
hoặc Bi-tonal images)
Bức ảnh Lena đơn sắc 1 bi

3.1- Giới thiệu
b) Ảnh số:
- Ảnh đa mức xám: mỗi điểm ảnh được biểu diễn bằng
các mức chói khác nhau, thường là 256 mức chói hay 8
bit cho mỗi điểm ảnh
Hình ảnh thang độ xám Các mặt phẳng bit cho hình
của Lena ảnh 8-bit thang độ xám
3.1- Giới thiệu
b) Ảnh số:
- Ảnh màu: mỗi điểm ảnh màu được biểu diễn bởi các
thành phần chói và các thành phần màu.
3.1- Giới thiệu
b) Ảnh số:
- Ảnh màu: mỗi điểm ảnh màu được biểu diễn bởi các
thành phần chói và các thành phần màu.
3.1- Giới thiệu
b) Ảnh số:
• Điểm ảnh: là một phần tử của ảnh số tại tọa độ (x,y) có mức
xám hoặc mức màu nhất định. Kích thước và khoảng cách
giữa các điểm ảnh được chọn thích hợp sao cho mắt người
cảm nhận được sự liên tục về không gian mức xám (hoặc
màu) của ảnh số gần giống như ảnh thật
• Độ phân giải của ảnh: là mật độ điểm ảnh được chỉ thị trên
một ảnh số được hiển thị
• Mức xám của điểm ảnh: cường độ sáng của nó được thể
hiện bằng một giá trị số tại điểm đó
• Các thang giá trị mức xám thông thường: 16, 32, 64, 128;
256 (mức phổ biến)
dpi (dots per inch)
1 inch = 2.54 centimeters
3.1- Giới thiệu
b) Ảnh số:
3.1- Giới thiệu
c) Khái niệm xử lý ảnh:
- Nâng cao chất lượng ảnh theo một tiêu chí nào đó (cảm nhận
của con người).
- Phân tích ảnh để thu được các thông tin đặc trưng giúp cho
việc phân loại, nhận biết ảnh.
- Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn,
sâu hơn.
- Là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong
muốn. Ảnh
“Tốt hơn”
Ảnh
XỬ LÝ ẢNH
Kết luận
3.1- Giới thiệu
d) Lịch sử về xử lý ảnh:
• Bắt nguồn từ 2 ứng dụng: nâng cao chất lượng thông tin hình
ảnh và xử lý số liệu cho máy tính.
• Ứng dụng đầu tiên: truyền thông tin ảnh báo giữa London và
NewYork vào năm 1920 qua cáp Bartlane:
- Mã hóa dữ liệu ảnh → khôi phục.
- Thời gian truyền ảnh: từ 1 tuần → 3 tiếng.
3.1- Giới thiệu
• Ảnh 15 mức độ xám được truyền từ London
đến NewYork, năm 1929. (McFarlane)
• Hệ thống đầu tiên có khả năng mã hóa hình ảnh với mức xám
là 5.
• Trong khoảng thời gian này mới chỉ nói đến ảnh số, chưa nói
đến xử lý ảnh số (chưa có máy tính).
• Năm 1964: ảnh mặt trăng được đưa về trái đất thông qua
máy chụp của tàu Ranger 7 để cho máy tính xử lý (chỉnh
méo).
3.1- Giới thiệu
• Cùng với các ứng dụng trong khám phá vũ trụ, các kỹ thuật xử
lý ảnh cũng bắt đầu trong y học từ cuối 1960s và đầu 1970s.
• Đến nay, xử lý ảnh có một bước tiến dài trong nhiều ngành
khoa học, từ ứng dụng đơn giản đến phức tạp.
• Mô hình hệ thống xử lý ảnh (góc độ người dùng)
3.1- Giới thiệu
3.1.2- Các ứng dụng của xử lý ảnh
• Xử lý ảnh vệ tinh, ảnh viễn thám
• Thiên văn, nghiên cứu không gian, vũ trụ
• Thăm dò địa chất
• Y tế
• Robot, tự động hóa
• Giám sát phát hiện chuyển động
• Tách ghép ảnh và video,…
Xử lý số ảnh:
3.1- Giới thiệu
 Phân vùng ảnh (Segmentation)
 Phân tích ảnh (Analyse): có được sự mô tả về ảnh, xác định biên ảnh.
 Nén dữ liệu ảnh (Compression)
Biến đổiCác
3.1.3-
ảnh giai
tương tự thành
đoạn xử lýảnh rờisố
ảnh rạc:
Trích chọn các đặc tính (Feature Extraction)...
Lấy
Tăngmẫu (rờiảnh
cường rạc (Enhancement):
về mặt không gian)nhằm loại bỏ các suy giảm
Lượng tử hóa(rời
(degradation) trongrạc
ảnh:vềlọcmặt
độ biên
tươngđộ).
phản, khử nhiễu, nổi màu,…
 Khôi phục ảnh (Restoration).
 Phát hiện biên (Egde Detection)
Hệ quyết định:
Tùy mục đích của ứng dụng mà chuyển sang giai đoạn
khác là hiển thị, nhận dạng, phân lớp, truyền thông…
Là giai đoạn quan trọng nhất.

Thiết bị thu nhận: các ông ghi hình chân không
(vidicon, plumbicon v.v.) hoặc thiết bị cảm biến quang
điện bán dẫn CCD (Charge-Coupled Device)
3.1- Giới thiệu
3.1.4- Các thành phần của hệ thống xử lý ảnh số
3.1- Giới thiệu
3.1.4- Các thành phần của HT xử lý ảnh số
a) Thiết bị thu nhận hình ảnh:
- Biến đổi quang-điện (biến đổi hình ảnh quang học thành tín
hiệu điện dưới dạng analog/ số).
- Có nhiều dạng cảm biến cho phép làm việc với ánh sáng
nhìn thấy hoặc hồng ngoại.
- Hai loại thiết bị biến đổi quang – điện chủ yếu thường
được sử dụng là đèn ghi hình điện tử và CCD.
b) Bộ xử lý ảnh chuyên dụng:
- Chip xử lý ảnh chuyên dụng (thực hiện nhanh các lệnh
chuyên dùng trong xử lý ảnh.
- Thực hiện các quá trình xử lý ảnh: lọc, làm nổi đường bao,
nén và giải nén video số…
- Trong bộ xử lý ảnh thường tích hợp bộ nhớ đệm có tốc độ
cao.
3.1- Giới thiệu
c) Máy tính:
- Để bàn cũng như siêu máy tính có chức năng điều khiển
tất cả các bộ phận chức năng trong hệ thống xử lý ảnh số.
d) Màn hình hiển thị:
- Hệ thống biến đổi điện - quang hay đèn hình (đen trắng
cũng như màu)
- Biến đổi tín hiệu điện có chứa thông tin của ảnh (tín hiệu
video) thành hình ảnh trên màn hình.
- Có hai dạng display được sử dụng rộng rãi là đèn hình
CRT (Cathode-Ray Tube) và màn hình tinh thể lỏng LCD
(Liquid Crystal Display).
- Đèn hình CRT thường có khả năng hiển thị màu sắc tốt
hơn màn hình LCD nên được dùng phổ biến trong các hệ
thống xử lý ảnh chuyên nghiệp.
3.1- Giới thiệu
e) Bộ nhớ trong và ngoài:
- Dung lượng rất lớn dùng để lưu trữ ảnh tĩnh/động số (ảnh
số đen trắng 1024x1024 điểm, 8 bits/điểm ~ bộ nhớ 1MB;
ảnh màu không nén, dung lượng bộ nhớ tăng gấp 3).
- Bộ nhớ chia làm 3 loại:
+ Bộ nhớ đệm trong PC để lưu ảnh trong quá trình xử lý (khả
năng ghi/đọc rất nhanh (25 hình/s));
+ bộ nhớ ngoài có tốc độ truy cập tương đối nhanh, dùng để
lưu thông tin thường dung (là ổ cứng, thẻ nhớ flash...)
+ Bộ nhớ dùng để lưu trữ dữ liệu (dung lượng lớn, tốc độ truy
cập không cao): đĩa quang (ROM) ghi 1 lần/nhiều lần (DVD)
có dung lượng 4.7GB (một mặt).
- Ngoài ra còn có các vật liệu khác: giấy in, giấy in nhiệt,
giấy trong, đó có thể là máy in phun, in laser, in trên giấy
ảnh đặc biệt bằng công nghệ nung nóng …
3.1- Giới thiệu
3.1.5- Các định dạng file ảnh phổ biến
a) Định dạng GIF (Graphics Interchange Format):
- Đưa ra bởi Cty Unisys và Compuserve, để truyền các hình
ảnh đồ họa trên đường dây điện thoại thông qua Modem.
- Các tiêu chuẩn GIF sử dụng thuật toán nén Lempel-Ziv-
Welch và được giới hạn cho 256 màu (8 bit).
- Thực tế, GIF có hai chuẩn:
+ GIF87a- Phiên bản kỹ thuật ban đầu
+ GIF89a- Phiên bản mở rộng (hỗ trợ hoạt hình đơn giản).
b) Định dạng JPEG (Joint Photographic Experts Group):
- Được tạo ra bởi một nhóm làm việc của Tổ chức tiêu
chuẩn quốc tế (ISO) gọi là JPEG
- Các file ảnh được tạo ra theo chuẩn nén JPEG có tên định
dạng jpeg. JPEG cho phép người dùng thiết lập một mức
độ mong muốn về chất lượng, hoặc tỉ lệ nén.
3.1- Giới thiệu
c) Định dạng PNG (Portable Network Graphics):
- Xuất phát từ sự phổ biến của Internet nhằm hỗ trợ nhiều
hơn cho các định dạng hình ảnh hệ thống độc lập.
- PNG có thể thay thế các t/c GIF và hỗ trợ lên đến 48 bit
thông tin màu sắc.
d) Định dạng TIFF (Tagged Image File Format):
- Tập tin định dạng phổ biến hình ảnh.
- Phát triển bởi Công ty Aldus, 1980, sau đó được hỗ trợ bởi
Microsoft.
- TIFF có thể lưu trữ nhiều loại khác nhau của hình ảnh: 1-
bit, màu xám, 8-bit, 24-bit RGB.
3.1- Giới thiệu
e) Định dạng EXIF (Exchange Image File):
- Định dạng hình ảnh cho máy ảnh kỹ thuật số.
- Ban đầu 1995, phiên bản hiện tại (2.2) được đưa ra 2002
bởi các hãng điện tử Nhật Bản và Informa- Hiệp hội Công
nghiệp Công nghệ (JEITA).
f) Định dạng Windows WMF (Windows Metafile):
- Định dạng file gốc cho HĐHMicrosoft Windows.
- Tệp tin WMF gồm một tập hợp các hàm giao diện thiết bị
đồ họa (GDI), cũng có nguồn gốc ở các môi trường
Windows.
f) Định dạng Windows BMP (Bitmap):
- T/chuẩn hệ thống định dạng tập tin đồ họa lớn cho
Microsoft Windows.
- Lưu trữ ảnh 24-bit bitmap khá hiệu quả (BMP có rất nhiều
chế độ khác nhau, bao gồm cả không nén hình ảnh 24-bit).
3.1- Giới thiệu
3.1.6- Màu sắc trong ảnh và video
a) Các mô hình màu trong ảnh
- Lý thuyết về mầu: bất kỳ một màu nào đều có thể được
tổng hợp từ ba màu chính, cơ bản có cường độ tương
thích: Đỏ (Red); Xanh lá cây (Green) và Xanh lơ (Blue).
- Ngược lại bất kỳ màu sắc nào cũng đều có thể phân
chia thành ba mầu cơ bản R, G và B.
Mầu Bước sóng, 10-9 m

Đỏ (R) 615
Xanh lá cây (G) 532
Xanh lơ (B) 470
3.1- Giới thiệu
+ Mô hình cộng màu RGB
Magenta (Đỏ tươi) = Red + Blue
Cyan (Lục lam) = Blue + Green
Yellow = Green + Red
White = Red + Blue + Green
3.1- Giới thiệu
+ Mô hình loại trừ màu CMY (C:Cyan-Lục lam; M:Magenta-Đỏ
tươi; Y: Yellow- Vàng):
Magenta = White – Green
Cyan = White - Red
Yellow = White - Blue
Black = Red + Blue + Green
3.1- Giới thiệu
+ Chuyển đổi màu:
- RGB thành CMY (C:Cyan-Lục lam; M:Magenta-Đỏ tươi;
Y: Yellow- Vàng):
(3.1)
- CMY thành RGB (C:Cyan-Lục lam; M:Magenta-Đỏ tươi;

Y: Yellow- Vàng):
(3.2)
3.1- Giới thiệu
b) Các mô hình màu trong video
- Các ảnh trước khi truyền, được quét với 3 thiết bị quang,
mà mỗi một trong số chúng đều có một bộ lọc màu khác
nhau đặt ở phía trước của thiết bị.
- Ba kênh (R, G, B) được hiệu chỉnh sao cho nếu một vùng
trắng đều được quét, thì cả 3 đầu ra phải có điện áp cân
bằng nhau.
- Vì mắt người có độ nhạy khác nhau đối với các màu có
cùng cường độ, nên độ chói phải được bổ sung thêm các
trọng số. Độ chói của t/h Y:
Y= 0.299R+0.587G+0.114B (3.3)
- Do một sắc màu đc xác định: nếu hai trong số ba màu cơ
bản được biết, nên chỉ cần truyền đi thông tin của 2 t/h.
Màu thứ 3 sẽ được tính toán lại tại phía thu  đưa ra mô
hình màu khác nhau trong truyền dẫn tín hiệu video.
3.1- Giới thiệu
+ Mô hình YUV:
(được sử dụng cho tín hiệu video tương tự hệ PAL)
- T/h màu U, V:
(3.4)
- Chuyển đổi RGB thành YUV:
(3.5)
3.1- Giới thiệu
+ Mô hình YIQ: (được sử dụng cho t/h video màu NTSC)
- Do U và V không biểu thị hết phân cấp bậc thấp nhất về độ
nhạy hiển thị của người. NTSC đã sử dụng I và Q thay thế.
- YIQ được xem như là một phiên bản của YUV, với cùng
một Y nhưng với U và V được quay đi góc 33 °
- T/h màu U, V:
(3.6)
- Chuyển đổi RGB thành YIQ:

(3.7)
3.1- Giới thiệu
+ Mô hình YCbCr:
- Chuẩn quốc tế cho các tín hiệu video số (ITU-R BT.601-4). Tiêu
chuẩn này dùng một không gian màu YCbCr. Biến đổi YCbCr
được sử dụng trong nén ảnh JPEG và nén video MPEG
- T/h màu Cb, Cr:
(3.8)
- Chuyển đổi RGB thành YCbCr:

(3.9)
3.1- Giới thiệu
b) Bài tập các mô hình màu trong video
+ Bài 1:
The conversion between RGB and YCbCr

coordinate is shown below:
a) Determine the YCbCr coordinate for a color that
is specified in (R,G,B) coordinate with R=100,
G=200, B=50.
b) Determine the (R,G,B) coordinate for a color
specified in the YCbCr coordinate with Y=100,
Cb=50, Cr=30.
3.1- Giới thiệu
3.1.7- Cơ bản về video
a) Các loại tín hiệu video: được tổ chức thành 3 loại
Video thành phần (Component Video); Video tổ hợp (Composite
Video) và S-Video
+ Video thành phần:
- Các HT Video đầu cuối cao cấp như phòng thu hình
(studios) sử dụng ba tín hiệu Video riêng rẽ cho các ảnh
màu đỏ, xanh lá cây và xanh lơ (là các tín hiệu Video thành
phần).
- Ở HT phòng thu này sử dụng ba dây (connector) kết nối
Camera hoặc các thiết bị khác đến TV hay màn hình.
- Video thành phần cho tái tạo màu sắc tốt nhất vì không có
xuyên nhiễu giữa ba kênh tín hiệu khác nhau, tuy nhiên đòi
hỏi nhiều băng thông hơn và đồng bộ tốt hơn cho cả ba tín
hiệu thành phần.
3.1- Giới thiệu
a) Các loại tín hiệu video:
+ Video tổ hợp:
- Các t/h mầu và độ chói được trộn trong 1 sóng mang đơn.
T/h mầu là tổ hợp của hai thành phần hiệu mầu I và Q
(hoặc U và V). T/h Video tổ hợp được sử dụng trong truyền
hình mầu quảng bá, thích ứng với truyền hình đen – trắng.
- Trong hệ NTSC: I và Q được kết hợp thành một t/h mầu,
và một sóng mang sẽ đặt t/h mầu vào cuối tần số cao hơn
của kênh chia sẻ với tín hiệu độ chói. Sau đó, các thành
phần độ chói và màu được tách ra tại đầu cuối máy thu và
hai thành phần màu sắc được khôi phục.
- Khi nối với TV hoặc VCR, Video tổ hợp chỉ dùng 1 dây và
các t/h mầu video được trộn với nhau, không gửi riêng
biệt. Các t/h đồng bộ và tiếng cũng được đưa chung vào.
Vì t/h mầu và độ chói được đưa vào cùng một t/h, nên có
3.1- Giới thiệu
a) Các loại tín hiệu video:
+ S-Video:
- Xem như là sự thỏa hiệp giữa Video thành phần và Video tổ
hợp S-Video (Separated Video hoặc Supper Video) sử dụng 2
dây, một cho độ chói và một cho tín hiệu mầu. Kết quả là, có ít
xuyên nhiễu giữa các thông tin về màu sắc và mức độ xám.
Cáp S-Video
3.2- Cơ sở xử lý ảnh số
3.2.1- Cơ sở cảm nhận thị giác
• Việc xử lý hình ảnh trong các ứng dụng: trợ giúp con người
quan sát thông tin trong một hình ảnh  phải hiểu được hệ
thống thị giác của con người.
• Hệ thống thị giác của người tập trung chủ yếu: vào mắt (cảm
biến hình ảnh hay camera), thần kinh thị giác (đường dẫn
hình ảnh) và não (các khối thông tin xử lý về ảnh…).
• Mắt hoạt động như một camera: thấu kính tập trung hình ảnh vào
võng mạc.
• Võng mạc: nơi tập trung các tế bào hình que (rods) và ba loại tế
bào hình nón (cones).
• Các tế bào hình que (~75-150 triệu): phân bố quanh hoàng điểm
(điểm vàng), rất nhậy về ánh sáng nhưng không cảm thụ màu sắc.
• Các tế bào hình nón (~6,5 triệu): tập trung tại hoàng điểm, kém
nhậy cảm với ánh sáng, nhưng cảm thụ và phân biệt được màu
tương ứng với ba loại tế bào hình nón nhậy cảm với 3 mầu khác
nhau: Đỏ, Xanh lá cây và Xanh lơ
• Mắt hoạt động như một camera: thấu kính tập trung hình ảnh vào
võng mạc.
• Võng mạc: nơi tập trung các tế bào hình que (rods) và ba loại tế
bào hình nón (cones).
• Các tế bào hình que (~75-150 triệu): phân bố quanh hoàng điểm
(điểm vàng), rất nhậy về ánh sáng nhưng không cảm thụ màu sắc.
• Các tế bào hình nón (~6,5 triệu): tập trung tại hoàng điểm, kém
nhậy cảm với ánh sáng, nhưng cảm thụ và phân biệt được màu
tương ứng với ba loại tế bào hình nón nhậy cảm với 3 mầu khác
nhau: Đỏ, Xanh lá cây và Xanh lơ
+ Đáp ứng phổ của mắt người:
• Mắt người nhạy cảm nhất với ánh sáng ở vùng giữa của phổ
nhìn thấy, độ nhạy tương đối là hàm của bước sóng.
• Hàm độ nhạy của mắt người V( ) (đứt nét): tổng 3 đường
cong đáp ứng phổ của các mầu đỏ, xanh lá cây, và xanh lam.
+ Mô hình hình thành hình ảnh:
• Ánh sáng từ nguồn với phân bố năng lượng phổ (SPD-
Spectral Power Distribution) - E( ) đến bề mặt của vật thể, có
hàm phản xạ phổ bề mặt S() và sau đó được lọc bởi các
hàm độ nhạy phổ tương ứng với các tế bào hình nón q().
Hàm C() được gọi là tín hiệu màu sắc và tích của E( ) và
S().
3.2.2- Quá trình thu tín hiệu hình ảnh
• Ảnh được nhận qua camera màu hoặc đen trắng:
– Loại camera tương tự ống chuẩn CCIR- (Consultative
Committee on international Radio) với tần số 1/25, mỗi
ảnh 25 dòng),
– Loại camera số (CCD– Charge Coupled Device) là loại
photodiode tạo cường độ sáng tại mỗi điểm ảnh.
• Camera thường dùng là loại quét dòng; ảnh tạo ra có dạng
hai chiều.
• Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu,
vào môi trường (ánh sáng, phong cảnh).
• Trên thực tế các thiết bị thu nhận ảnh có thể là: máy quay
(Cameras) cộng với bộ chuyển đổi tương tự số; máy quét
(Scaners) chuyên dụng và các bộ cảm biến ảnh (Sensors).
+ Thu nhận ảnh sử dụng bộ cảm biến đơn:
• Bộ cảm biến đơn phổ biến nhất là photodiode (vật liệu
silicon): dạng sóng điện áp đầu ra tỷ lệ với ánh sáng đầu vào.
• Sử dụng bộ lọc ở mặt trước của bộ cảm biến: nâng cao tính
chọn lọc.
• Ví dụ: bộ lọc mầu xanh lá trước bộ cảm biến sẽ nhạy hơn cho
ánh sáng trong băng mầu xanh lá của phổ mầu. Kết quả: đầu
ra cảm biến sẽ cho ảnh có ánh sáng mầu xanh mạnh hơn các
thành phần mầu khác.
+ Thu nhận ảnh sử dụng dải cảm biến:
• Dải cảm biến bao gồm nhiều cảm biến được sắp xếp theo một hàng.
• Dải cảm biến tạo ra các phần tử ảnh theo một hướng.Chuyển động
theo hướng vuông góc với dải cảm biến: tạo ra ảnh theo một hướng
khác. (các ứng dụng XLA bằng máy bay)
• Các dải cảm biến cũng có cấu hình vòng sử dụng trong y học và công
nghiệp để tạo ra các ảnh cắt lớp cho các vật thể 3D.
+ Thu nhận ảnh sử dụng mảng cảm biến:
• Các bộ cảm biến được sắp xếp lại để hình thành nên một mảng cảm
biến hai chiều. (Các thiết bị cảm biến siêu âm, điện từ trường hoặc
trong các camera số (loại CCD)).
• Ưu điểm: có thể thu nhận được ngay toàn bộ ảnh hoàn chỉnh của
vật thể thông qua việc tập trung nguồn năng lượng sáng trên bề
mặt của mảng cảm biến.
3.2.3- Số hóa ảnh
• Các t/h và hình ảnh (trước khi cảm nhận) là những đối
tượng tương tự tự nhiên (các tín hiệu tồn tại trong miền
không gian/thời gian) là liên tục và cũng có thể nhận các
giá trị liên tục.
• Khi nói về xử lý các t/h video và hình ảnh số (T/h được
cảm nhận): phải được chuyển sang dạng số mà máy vi
tính có thể đọc được.
• Nói đến kỹ thuật số nghĩa là: tín hiệu được xác định trên
miền (không gian/thời gian) rời rạc, và nó nhận các giá trị
từ một tập các khả năng rời rạc.
• Trước khi bắt đầu quá trình xử lý số: phải thực hiện quá
trình chuyển đổi từ tương tự sang số (A/D). Biến đổi A/D
bao gồm: lấy mẫu, lượng tử hóa và mã hóa .
3.2.3- Số hóa ảnh
• Quá trình chuyển đổi tín hiệu và ảnh A/D:
3.2.3- Số hóa ảnh (Lấy mẫu và lượng tử)
+ Chuyển đổi dữ liệu liên tục trong bộ cảm ứng sang dạng
số (số hóa ảnh):
• Từ ảnh liên tục theo tọa độ x, y và biên độ f,
• Tiến hành lấy mẫu theo cả 2 tọa độ và biên độ
• Lấy mẫu: số hóa giá trị các tọa độ
(Quét ảnh theo hàng và lấy mẫu theo hàng. Đầu ra là rời rạc
về mặt không gian, nhưng liên tục về mặt biên độ)
• Lượng tử hóa: số hóa các giá trị biên độ
(lượng tử hóa về mặt biên độ (độ sáng) cho dòng ảnh vừa
được rời rạc hóa)
3.2.3- Số hóa ảnh (Lấy mẫu và lượng tử hóa)
• Lấy mẫu: (số hóa giá trị các tọa độ)
– Yêu cầu tín hiệu có dải phổ hữu hạn: f x  f x max , f x  f x max
– Ảnh thỏa mãn điều kiện trên, và được lấy mẫu đều trên
một lưới hình chữ nhật, với bước nhảy (chu kỳ lấy mẫu)
x, y sao cho:
1 1
 2 f x max ,  2 f y max (3.10)
x y
– Thực tế luôn có nhiễu ngẫu nhiên trong ảnh, nên có một

số kỹ thuật khác được dùng: lưới không vuông, lưới bát
giác.
• Lượng tử hóa: (số hóa các giá trị biên độ)
– Lượng hóa ảnh nhằm ánh xạ từ một biến liên tục u
(biểu diễn giá trị độ sáng) sang một biến rời rạc u* với
các giá trị thuộc tập hữu hạn:  r1 , r2 ,..., rL  ,
– Cơ sở lý thuyết của lượng hóa: chia dải độ sáng biến
thiên từ Lmin đến L thành một số mức (rời rạc và
nguyên)- Phải thỏa mãn tiêu chí về độ nhạy của mắt.
Thường Lmin=0, Lmax là số nguyên dạng: 2B (Thường
chọn B=8, mỗi điểm ảnh sẽ được mã hóa 8 bít).
• Bắt đầu từ phần đầu của ảnh, thực hiện LM và LTH theo từng
dòng tạo ra ảnh số 2 chiều:
– Ảnh liên tục (hình vẽ)
– Đoạn thẳng AB quét qua ảnh liên tục trong quá trình số
hóa.
Dòng quét từ A đến B trong ảnh liên tục

Lấy mẫu và lượng tử hóa (thang
độ xám được chia thành 8 mức: Đường quét số có được
từ đen đến trắng) sau khi LM và LTH.
- Kết quả sau LM và LTH: chuỗi giá trị rời rạc mô tả các mức độ chói trong
một dòng ảnh. Chuỗi được mã hóa để gán biểu diễn thành các từ mã.
- Thực hiện quá trình số hóa cho tất cả các dòng ảnh từ trên xuống dưới:
sẽ nhận được ảnh số trong không gian hai chiều.
• Ảnh liên tục được chiếu lên một mảng cảm ứng và Ảnh số
Chất lượng ảnh được xác định qua số mẫu và mức xám sử dụng
3.2.4- Biểu diễn ảnh số
• Ảnh số: tập hợp các điểm ảnh với mức xám phù hợp
dùng để mô tả ảnh gần với ảnh thật.
• Biểu diễn ảnh số:
– Ảnh được bd bởi một ma trận kích thước MxN, tương
ứng với số điểm ảnh của bộ cảm biến quang
– Mỗi phần tử của ảnh sẽ có 1 đến 3 giá trị tùy thuộc vào
ảnh mức xám (đen trắng) hay ảnh màu
– Các khoảng giá trị là một số nguyên nằm trong khoảng
[Lmin, Lmã]
– Tổng số bit để biểu diễn các mức xám trong khoảng L là
K sao cho: L=2K
– Tổng số bit cần để lưu trữ một ảnh là: MxNxK (bit)
3.3- Kỹ thuật nén ảnh
3.3.1- Tổng quan về nén ảnh
• Mục đích nén ảnh: để giảm thiểu dung lượng dữ liệu nhằm
nâng cao hiệu quả truyền dẫn và lưu trữ.
• Ví dụ:
100KB/s ~ 1phut
5,7MB=5760KB
3x640x480
x8 x24 =
177MB
Video 24 h/s
• Mục đích nén ảnh: để giảm thiểu dung lượng dữ liệu nhằm
nâng cao hiệu quả truyền dẫn và lưu trữ.
• Ví dụ:
Ảnh 512X512, RGB, 30Hz:
 1 picture = 512x512x3 =786 KB
 1 second = 786KB x 30 = 23.5 MB
 1 minute = 23.5 MB x 60 = 1.4 GB
 1 hour = 1.4 GB x 60 = 84 GB
• Nguyên lý nén ảnh: thực hiện quá trình làm giảm thông
tin dư thừa trong dữ liệu.
1600x1200 1600x1200
Nén
5,7MB 406KB
DATA = INFORMATION + REDUNDANT DATA
• Độ dư thừa dữ liệu là tham số đánh giá trong nén ảnh số

• Nguyên lý nén ảnh:
- Tham số đánh giá cho quá trình thực hiện giải thuật nén
là tỉ lệ nén (CN): N
CN  1 (3.11)
N2
trong đó: N1 và N2 là lượng dữ liệu trong hai tập hợp số liệu
dùng để biễu diễn lượng thông tin cho trước.
- Độ dư thừa dữ liệu tương đối RD của tập số liệu thứ nhất so
với tập số liệu thứ hai: R  1 1 (3.12)
D CN
Nếu N1 = N2 , CN=1 và RD=0 Không dư thừa
Nếu N1 >> N2 , CN và∞RD
→ →1
Dư thừa cao
Nếu N1 << N2 , CR → 0 R
and →− ∞
undesirable
D
- Trong nén ảnh số: có 3 loại dư thừa dữ liệu
+ Dư thừa mã (Coding Redundancy)
+ Dư thừa giữa các điểm ảnh (Interpixel
Redundancy)
+ Dư thừa tâm sinh lý (Psychovisual Redundancy)
+ Dư thừa mã (Coding Redundancy):
. Nếu các mức của t/h video mã hóa = các symbol nhiều hơn cần
thiết thì t/h nhận được sẽ có độ dư thừa mã.
. Để giảm độ dư thừa mã, trong nén ảnh thường sử dụng
các mã có từ mã thay đổi đổi (VLC) như mã Huffman, mã
số học, mã LZW (Lempel-Ziv-Welch)...
. Ví dụ:

7
𝐿𝑎𝑣 =∑ 𝑙(𝑟 𝑘 )¿¿
+ Dư thừa giữa các điểm ảnh (Interpixel Redundancy):
. Mức độ tương quan giữa hai điểm ảnh gần nhau là tương đối
lớn, do đó trong ảnh số tồn tại lượng dư thừa pixel.
. Mỗi điểm ảnh có thể được dự báo từ giá trị các điểm lân cận
với nó.
. Giảm độ dư thừa trong pixel của một ảnh có thể được thực
hiện khi sử dụng các phương pháp mã hóa biến đổi (biến
đổi cosin rời rạc DCT,…) để chuyển đổi ảnh từ miền không
gian sang miền tần số, bằng cách này sẽ giảm được độ dư
thừa dữ liệu trong ảnh ở miền tần số cao
+ Dư thừa tâm sinh lý (Psychovisual Redundancy):
. Dựa trên các nghiên cứu về hệ thống thị giác, chúng ta biết
rằng mắt người chỉ cảm nhận được một phần thông tin chứa
trong ảnh quang học.
. Nói cách khác, ảnh có thể được tách ra thành hai phần: một
phần chứa các tin tức quan trọng cho người xem, phần khác
là các thông tin mà người xem hầu như không cảm nhận
được. Thông tin này được gọi là độ dư thừa tâm lý thị giác.
. Thành phần thứ hai có thể được loại bỏ mà không ảnh
hưởng đáng kể đến chất lượng thu nhận ảnh.
. Độ dư thừa tâm lý thị giác có quan hệ tới việc lượng tử hóa
• Mô hình nén ảnh:
Loại bỏ thông tin Tăng khả năng

dư thừa nguồn chống nhiễu
Mô hình hệ thống nén tổng quát

• Mô hình nén ảnh:
Reduce inter-pixel Reduce psycho- Reduce coding
redundancy visual redundancy redundancy
(Reversible) (Irreversible) (Reversible)
Mô hình mã hóa và giải mã nguồn

• Mô hình nén ảnh: (Bộ mã hóa nguồn)
. Bộ biến đổi: dùng phép biến đổi DCT, DWT để tập trung
năng lượng t/h vào một số lượng nhỏ các hệ số khai triển để
thực hiện phép nén hiệu quả hơn là dùng t/h ban đầu.
. Bộ lượng tử hoá: tạo ra một lượng ký hiệu giới hạn cho ảnh
nén với hai kỹ thuật: LT vô hướng (thực hiện LTH cho từng
phần dữ liệu) và LT vectơ (thực hiện LTH một lần một khối dữ
liệu). Quá trình này không thuận nghịch.
. Bộ mã hoá: gán một từ mã, một dòng bit nhị phân cho mỗi
ký hiệu.
• Mô hình nén ảnh: (Bộ giải mã hóa nguồn)
. Bộ giải mã: thực hiện giải mã tín hiệu nhận được để cho ra ma
trận các hệ số của ảnh biến đổi.
, Bộ chuyển đổi: thực hiện biến đổi nghịch (so với quá trình biến
đổi ở bộ mã hóa) để khôi phục lại ảnh số ban đầu.
3.3.2- Hiệu quả nén ảnh và chất lượng ảnh
• Hiệu quả nén ảnh: được xác định bằng tỉ lệ nén (tỉ số
giữa lượng dữ liệu của ảnh gốc trên lượng dữ liệu của
ảnh nén)
. Độ phức tạp của thuật toán nén: được xác định bằng số
bước tính toán trong cả hai quá trình mã hóa và giải mã.
. Thông thường thì thuật toán nén càng phức tạp bao nhiêu
thì hiệu quả nén càng cao nhưng ngược lại giá thành và
thời gian để thực hiện lại tăng.
3.3.2- Hiệu quả nén ảnh và chất lượng ảnh
• Chất lượng ảnh nén:
. Đánh giá chất lượng ảnh nén=sai lệch bình phương trung bình
rms (Root Mean Square):
(3.13)
. Hoặc qua PSNR (Peak to Signal to Noise Ratio):
(3.14)
3.3.3- Phân loại các phương pháp nén ảnh
• Phân loại theo nguyên lý nén:
- Nén không tổn thất (Loss-less): bao gồm các p2 nén ảnh mà
sau khi giải nén thu được chính xác dữ liệu gốc.
- Nén tổn thất (Lossy Compression): sau khi giải nén ta không
thu được dữ liệu như bản gốc, trong nén ảnh, người ta gọi là các
phương pháp “tâm lý thị giác”.
• Phân loại theo cách thực hiện nén:
. Phương pháp không gian (Spatial Data Compression): thực hiện
nén bằng cách tác động trực tiếp lên các mẫu (điểm ảnh) của
ảnh gốc.
. Phương pháp sử dụng mã hóa biến đổi (Transform
Coding): tác động lên các hệ số biến đổi của ảnh gốc mà
không tác động trực tiếp lên các mẫu của ảnh gốc.
3.4- Các p2 nén ảnh không tổn thất
- Nén cho các ứng dụng yêu cầu không lỗi: Ví dụ trong y
tế, nén tài liệu..vv
- Tỷ số nén CR= 2 đến 10
- Loại bỏ sự dư thừa về mã và dư thừa về không gian
- Ví dụ: Huffman codes, Arithmetic coding, LZW, 1D and 2D
run-length encoding, Loss-less Predictive Coding, and
Bit-Plane Coding.
3.4.1- Mã hoá Huffman
- Dựa vào mô hình thống kê tính x/suất xuất hiện các ký tự.
- Gán cho các ký tự có xác xuất cao bằng một từ mã ngắn,
các ký tự có xác xuất thấp bằng một từ mã dài.
• Thuật toán:
1. Khởi tạo: liệt tất cả các ký hiệu trong danh sách đã được sắp
xếp theo xác suất xuất hiện giảm dần.
2. Lặp lại cho đến khi danh sách chỉ còn lại 1 ký hiệu.
(a) Từ danh sách, chọn 2 ký hiệu có x/s xuất hiện thấp nhất. Tạo
thành một nút con.
(b) Gán tổng x/suất của các nút con vào nút cha và chèn vào
danh sách sao cho trật tự giảm dần được đảm bảo.
(c) Xóa các nút con khỏi danh sách.
3. Gán từ mã cho mỗi lá theo đường dẫn từ gốc.
3.4.2- Mã hoá số học
- Là kĩ thuật nén dữ liệu mà cho phép mã hóa dữ liệu bằng cách
tạo ra một chuỗi mã (code string). Chuỗi này biểu diễn một giá
trị thập phân nằm trong khoảng giữa 0 và 1.
- Ý tưởng cơ bản của mã hóa số học là sử dụng khoảng chia
giữa 0 và 1 để biểu diễn các khoảng mã hóa.
- Rõ ràng hàm mật độ xác xuất tích lũy của tất cả các kí hiệu sẽ
bằng 1.
- Khi bản tin càng dài thì các khoảng để biểu diễn bản tin đó
càng ngắn, và số các bít cần để xác định khoảng đó càng tăng.
- Dựa trên các xác suất kí hiệu tạo ra bởi mô hình, kích thước
của các khoảng cho các kí tự tiếp theo của bản tin sẽ giảm.
- Quá trình mã hóa:
+ B1: Gán mỗi ký hiệu riêng lẻ với một đoạn của dải [0, 1)
(khởi đầu) (mà đoạn đó tương ứng với xác suất xuất hiện
của kí tự đó trong hàm mật độ xác suất tích lũy).
+ B2: Xác định giá trị biên trên (Un) và biên dưới (Ln) cho
dải bản tin đầu ra (Sau khi kí hiệu đầu tiên đã được mã
hóa). Mỗi giá trị mới được mã hóa sẽ càng làm cho dải này
hẹp lại.
+ B3: Lặp (B1,B2) dải giá trị mới cho đến khi xác định chuỗi
mã đầu ra (một giá trị thập phân).
- Quá trình giải mã:
+ Sử dụng các khoảng xác suất giống như bộ mã hóa và thực
hiện quá trình tương tự.
+ Tổng quát đối với quá trình giải mã có thể được công thức hóa
như sau:
Rn  Ln
Rn 1  (3.15)
U n  Ln
Trong đó: Rn là mã nằm trong dải giá trị dưới Ln và giá trị trên Un
của kí hiệu thứ n và Rn+1 là mã cho kí hiệu tiếp theo.
- Ví dụ 1: Cho tập các ký hiệu {a, b, c, d} và mô hình tĩnh
được sử dụng với các xác suất như biểu diễn ở Bảng:
Kí hiê ̣u Xác suất Dải
A 0.6 [0.0, 0.6)
B 0.2 [0.6, 0.8)
C 0.1 [0.8, 0.9)
D 0.1 [0.9, 1)
a) Xác định chuỗi mã đầu ra bộ mã hóa số học cho bản tin

ACD.
b) Từ kết quả câu a, xác định bản tin đầu ra bộ giải mã. So
sánh với bản tin đầu vào bộ mã hóa số học đã cho.
- HD Ví dụ 1:
a) Xác định chuỗi mã đầu ra bộ mã hóa số học
B1: Gán mỗi ký hiệu riêng lẻ với một đoạn của dải [0, 1)
a b c d
B2:
+ Kí hiệu đầu tiên cần được mã hóa là a. Do đó, bản tin
được mã hóa cuối cùng phải là một số lớn hơn hoặc bằng
0 (Ln) và nhỏ hơn 0.6 (Un)
+ Sau khi kí hiệu đầu tiên đã được mã hóa, ta biết được giá trị
Un và Ln cho dải mới bản tin đầu ra.
- HD Ví dụ 1:
B3: Bước lặp
+ Mã hóa cho ký hiệu thứ 2 trong bản tin:
. Gán mỗi ký hiệu riêng lẻ với một đoạn của dải mới [0, 0.6)
a b c d
. Ký hiệu thứ 2 (c) được mã hóa: xác định dải mới [0.48,
0.54)
- HD Ví dụ 1:
B3: Bước lặp
+ Mã hóa cho ký hiệu cuối trong bản tin:
. Gán mỗi ký hiệu riêng lẻ với một đoạn của dải mới [0.48, 0.54)
a b c d
. Ký hiệu cuối (d) được mã hóa: xác định dải mới [0.534,
0.54). Do đó: đầu ra bộ mã hóa số học nhận được x =
0.534 (nằm trong dải 0.534 ≤ x <0.54)
- HD Ví dụ 1:
Bảng biểu diễn quá trình mã hóa số học cho bản tin
“ACD”
Kí tự mới Dải
Khởi tạo [0, 1)
Sau khi xem xét một kí hiê ̣u A [0, 0.6)
C [0.48, 0.54)
D [0.534, 0.54)
Kết quả đầu ra bộ mã hóa số học nhận được chuỗi mã ra: x
= 0.534 (nằm trong dải 0.534 ≤ x <0.54)
- HD Ví dụ 1:
b) Xác định bản tin đầu ra bộ giải mã
Bộ giải mã sẽ sử dụng các khoảng xác suất giống như bộ
mã hóa và thực hiện quá trình tương tự khi nhận được
x= 0.534.
Bảng biểu diễn quá trình giải mã hóa số học
Số (chuỗi) được mã hóa Dải Kí hiệu đầu ra
0.534 [0, 0.6) A
0.89 [0.8, 0.9) C
0.9 [0.9, 1) D
Kết quả đầu ra bộ giải mã số học nhận được bản tin: ACD
(Giống bản tin đầu vào bộ mã hóa) Phương pháp nén
ảnh ko tổn thất.
3.4.3- Mã hoá từ điển LZW
- Là một trong những kỹ thuật nén không tổn thất.
- Khai thác dư thừa giữa các pixel của ảnh.
- Thực hiện gán các từ mã cố định vào các chuỗi có độ dài thay
đổi của các ký hiệu nguồn. Dựa trên việc xây dựng Từ điển lưu
các chuỗi ký tự có tần suất lặp cao, thay thế bằng từ mã
tương ứng khi gặp lại.
- Nâng cao tỉ lệ nén (kỹ thuật tổ chức từ điển).
Ứng dụng:
- Thường dùng để nén các loại văn bản, ảnh đen trắng, ảnh
màu, ảnh đa mức xám...
- Là chuẩn nén cho các dạng ảnh GIF và TIFF.
• Cách thức mã hóa:
- Khác với mã Huffman, kỹ thuật LZW không cần biết tần
suất của các ký tự trong tín hiệu gốc.
- Để mã hóa theo phương pháp LZW, chuỗi dữ liệu phải
được thực hiện dựa vào tra cứu trong "từ điển" để tìm ra
mã tương ứng với nó. "Từ điển" được hình thành ngay
trong quá trình mã hóa.
- Ví dụ: khi nén ảnh đen-trắng mã hóa 8 bits/pixel, từ điển
được khởi tạo bao gồm 256 từ tương ứng với các mức
chói 0,1,2…255. Sau đó, bộ mã hóa sẽ phân tích lần lượt
chuỗi ký tự (mức xám) liên tiếp trong dữ liệu nguồn, khi
phát hiện trong từ điển không có chuỗi ký tự tương đương,
bộ mã hóa sẽ ghi chuỗi ký tự liên tiếp đó vào vị trí còn
trống của từ điển.
• Cấu trúc từ điển:
Mã của 256 kí tự cơ bản

trong bảng mã ASCII
Cấu
trúc
(Khi số mẫu lặp > 4096)
từ (Cho từng ảnh)
điển Chứa các mẫu lặp lại trong ảnh:
 258-511: 9 bit.
 512 -1023: 10 bit
1024-2047: 11 bit
- 2048-4095: 12 bit
• Bảng từ điển (mã hóa):
3.4.4- Mã hoá loạt chạy dài (RLC)
• Cách thức mã hóa:
- Tư tưởng của phương pháp là dựa trên sự lặp lại các bit.
- Thay thế các bit bởi chiều dài chuỗi và bít lặp.
- Để phân biệt với các ký tự khác ta có thể thêm 1 từ mã đặc
biệt trước 2 thông tin chiều dài chuỗi và bit lặp.
• Ví dụ:
- Cho dãy các giá trị mức xám như sau
55 22 22 22 22 22 22 22 22 51 52 52 52 60 …
- Ta có thể thay đoạn mã trên bằng
55 E 8 22 51 E 3 52 60 …
- Với E là ký tự đặc biệt, hai giá trị sau E là chiều dài ký tự
lặp và ký tự lặp.
- .
3.4.5- Mã hoá dự đoán không tổn thất
 Có thể dự đoán giá trị pixel.
 Mô hình mã hóa dự đoán không tổn thất
 m

fˆn  round   l f n l 
 l 1 
3.4.5- Mã hoá dự đoán không tổn thất
• Giảm thiểu dư thừa giữa các pixel lân cận: tách và chỉ
mã hóa thông tin mới (sai khác giữa giá trị thực tế và
giá trị dự đoán của pixel đó) trong mỗi pixel:
• Bộ giải mã khôi phục lại:
en  f n  fˆn
f n  en  fˆn (3.16)
 m

   i f n 1 
ˆf  round
trong đó: n
 i 1 
Bài tập:
Bài 1: Cho ảnh I như sau :
a) Xây dựng bảng mã Huffman cho các mức xám của ảnh I trên. Tính tốc độ
bit trung bình và so sánh nó với entropy của nguồn.
b) Mã hóa ảnh I trên sử dụng bảng mã Huffman xây dựng ở câu a.
 36 36 128 128
 36 36 128 128
Bài 2: Cho ảnh I4x4: I 
128 36 36 128
 
128 36 36 128
a) Mã hóa ảnh I sử dụng mã hóa từ điển LZW. Tính tỷ số nén?
b) Với dữ liệu ảnh nén có được ở câu a, sử dụng giải mã LZW để tìm ảnh ban
đầu? (Giả thiết ảnh được đọc và hiển thị theo thứ tự từ trái qua phải, từ
trên xuống dưới).
Bài tập:
Bài 3: Cho tập các ký hiệu {a, c, d, e, k, !} và mô hình tĩnh được sử
dụng với các xác suất như biểu diễn ở Bảng sau:
Kí hiê ̣u Xác suất Dải

a 0.2 [0.0, 0.2)
c 0.3 [0.2, 0.5)
d 0.1 [0.5, 0.6)
e 0.2 [0.6, 0.8)
k 0.1 [0.8, 0.9)
! 0.1 [0.9, 1.0)
a) Xác định chuỗi mã đầu ra bộ mã hóa số học cho bản tin cadd!.
b) Từ kết quả câu a, xác định bản tin đầu ra bộ giải mã. So sánh với bản tin
đầu vào bộ mã hóa số học đã cho.
Bài tập:
Bài 4: Cho sơ đồ mã hóa như hình vẽ, bộ dự đoán đưa ra
giá trị dự đoán u( n )  u( n  1) , giả sử giá trị pixel đầu tiên
được truyền trực tiếp không lỗi u ( n )  u.(1Tìm ) giá trị
u(n ), e(n), e(nvà
) u (n )
tương ứng với chuỗi pixel ảnh đầu
vào u(n)=101, 110, 107, 108, 105, 102.
HD Bài tập:
Bài 1: Cho ảnh I như sau :
a) Xây dựng bảng mã Huffman cho các mức xám của ảnh I trên. Tính
tốc độ bit trung bình và so sánh nó với entropy của nguồn.
B1: Vẽ biểu đồ Histogram của vùng ảnh và chuyển sang dạng bảng
Số pixel (nk)
6
Mức xám rk 2 3 4 5
5 Số pixel nk 6 5 4 1
4 p(rk) = nk/n 6/16 5/16 4/16 1/16
3
5
2
1
1
𝐿𝑎𝑣 = ∑ 𝑙 (𝑟 𝑘 ) ¿ ¿
0 𝑘 =0
1 2 3 4 5 Mức xám (rk)
b) Mã hóa ảnh I trên
1 sử dụng bảng mã Huffman xây dựng ở câu a.
3.5- Các p2 nén ảnh tổn thất
- Nén ảnh có tổn thất được xây dựng dựa trên độ chính xác
của việc khôi phục lại ảnh trong lúc trao đổi nhằm tăng hiệu
quả nén.
- Nếu kết quả không chính xác (ảnh kém chất lượng) có thể
chấp nhận được, thì hiệu quả nén là đáng kể.
- Trong thực tế, nhiều kỹ thuật mã hoá có tổn thất có khả năng
khôi phục lại ảnh đơn sắc từ dữ liệu được nén có tỉ số nén
100:1, hoặc ảnh khôi phục gần như không phân biệt được so
với ảnh gốc nếu tỉ số nén 10:1 đến 50:1.
- Phương pháp nén ảnh có tổn thất sẽ được trình bày bao gồm
mã hóa DPCM và mã hóa biến đổi.
3.5.1- Mã hoá DPCM
- Là p2 mã hóa dự đoán có tổn thất dựa trên nguyên tắc phát
hiện sự giống nhau và khác nhau giữa các điểm ảnh gần
nhau để tìm cách loại bỏ các thông tin thừa.
- Phân tích thống kê phân bố biên độ t/h video: thấy phân bố
biên độ các mẫu tương ứng với các điểm ảnh về nguyên
tắc là phân bố đều, ngược lại phân bố về độ lệch biên độ
các điểm ảnh có đồ thị hình chuông xung quanh điểm 0.
- Nếu dựa trên các đặc trưng thống kê ảnh, thì sự khác
nhau mẫu là không lớn lắm và để mã hóa chỉ cần số bit bé
(so với việc mã hóa toàn bộ biên độ các mẫu).
- P2 DPCM còn sử dụng đặc điểm của mắt người (kém nhạy
với mức LT có chênh lệch về độ chói giữa điểm ảnh gần
nhau, so với mức LTH chênh lệch nhỏ) và cho phép dùng
đặc trưng phi tuyến về LTH.
• Sơ đồ khối của bộ mã hóa và giải mã DPCM:
(a)
(b)
• Ví dụ BT mã hóa và giải mã DPCM:
Mã hóa chuỗi sau sử dụng bộ mã hóa DPCM: {1,3,4,4,7,8,6,5,3,1}. Sử

dụng bộ dự đoán đơn giản: dự đoán giá trị hiện tại bằng một giá trị
trước đó và sử dụng bộ lượng tử 3 mức: 2 d 1

e n = Q(d)= 0 d <1
-2 d  -1

Giả sử dự đoán mẫu đầu tiên là 1. Tính toán chuỗi bit nhị phân mã hóa
nếu mã sau được sử dụng để mã hóa tín hiệu sai số lượng tử: e =0 
n
“1”; e =2  “01”; e =-2  “00”;
n n
• Ví dụ BT mã hóa và giải mã DPCM:
Mẫu vào Mẫu dự Sai số dự Sai số được Mã Giá trị khôi

(fn)
1
đoán ( )
1
đoán (en)
0 0
𝒆˙
Lượng tử hóa ( )
𝒏 1
phục
1
3 1 2 2 01 3
4 3 1 2 01 5
4 5 -1 -2 00 3
7 3 4 2 01 5
8 5 3 2 01 7
6 7 -1 -2 00 5
5 5 0 0 1 5
3 5 -2 -2 00 3
1 3 -2 -2 00 1
3.5.2- Mã hoá chuyển đổi
- Động lực chuyển đổi:
+ Biểu diễn ảnh gốc hiệu quả hơn
+ Các tham số chuyển đổi y/c ít bit mã hóa hơn (Đóng gói
năng lượng, giải tương quan giữa các điểm ảnh).
- Các phép biến đổi: DFT, DCT và wavelet để ánh xạ ảnh số
sang không gian khác.
- Tập hệ số kết quả của các biến đổi tuyến tính sau đó được lượng
tử hóa và mã hóa.
- Ưu điểm của các phép biến đổi là các hệ số khai triển thường có
mức tương quan nhỏ hơn so với mức độ tương quan giữa các
điểm ảnh trong không gian thực.
- Ngoài ra, phần lớn năng lượng của tín hiệu tập trung tại các hệ
số nằm trong miền tần số thấp.
3.5.2- Mã hoá biến đổi
• Sơ đồ khối của bộ mã hóa và giải mã:
• Biến đổi Cosin rời rạc:
– DCT thuận ảnh f, MxN:
2C  u  C  v  M 1 N 1
 2i  1 u  2 j  1 v
F  u, v  
MN
 f
i 0 j 0
ij cos
2M
cos
2N
 1
 u, v  0
C (u ), C (v)   2 (3.17)
 1 u, v  0

2 M 1 N 1  2i  1 u  2 j  1 v
ij  ngược:   C  u  C  v  F (u , v ) cos
– fDCT cos
MN u 0 v 0 2M 2N
(3.18)
• Biến đổi Wavelet:
– Sử dụng để phân tích các tín hiệu không dừng (non-
stationary) - là những tín hiệu có đáp ứng tần số thay
đổi theo thời gian.
– Mục đích: giải quyết vấn đề về độ phân giải tín hiệu
(miền thời gian hoặc tần số) mà STFT vẫn còn hạn chế.
– Được thực hiện theo cách phân tích đa phân giải - MRA
(Multi Resolution Analysis): phân tích tín hiệu (ảnh)
thành các tín hiệu con (ảnh con) có mức phân giải khác.
Cụ thể:
• Tín hiệu được nhân với hàm Wavelet (tương tự như
nhân với hàm cửa sổ trong biến đổi STFT).
• Thực hiện biến đổi riêng rẽ cho các khoảng t/h khác
nhau trong miền thời gian tại các tần số khác nhau.
• Biến đổi Wavelet:
– Lọc dữ liệu (ảnh) thành dữ liệu phân giải thấp và dữ liệu
chi tiết.
• Biến đổi Wavelet rời rạc – DWT-1D:
– Sử dụng một tập các bộ lọc: thông cao và thông thấp
(giống kỹ thuật mã hoá băng con- subband coding).
Nhưng các bộ lọc trong DWT được thiết kế phải có đáp
ứng phổ phẳng, trơn và trực giao.
– Dạng tổng quát của biến đổi DWT một chiều (DWT-1D):
– Phân tích: Tín hiệu được đưa qua các bộ lọc thông cao G
và thông thấp H rồi được giảm mẫu (down sampling) hệ số
2 tạo thành biến đổi DWT mức 1. Ngược lại là quá trình
• Biến đổi Wavelet hai chiều – DWT-2D:
– Sử dụng các bộ lọc riêng biệt, thực hiện biến đổi DWT-1D
dữ liệu vào (ảnh) theo hàng rồi thực hiện theo cột. Theo
cách này nếu thực hiện biến đổi DWT-2D ở mức 1, sẽ tạo
ra 4 nhóm hệ số biến đổi: LL, HL, LH, HH.
• Biến đổi Wavelet hai chiều – DWT-2D:
– DWT-2D 3 mức:
• Một số họ Wavelet rời rạc:
– Wavelet Harr; Wavelet Daubechies; Wavelet Morlet
– The Haar basis vectors are
(3.19)
– An example of Daubechies basis vectors (there are many

others) follows:
(3.20)
• Biến đổi Wavelet Harr:
– Xét tín hiệu rời rạc:
Trong đó: N- độ dài của tín hiệu, các giá trị f (thực)
được xác định từ tín hiệu tương tự tại thời điểm t1, t2,
…,tN:
– Biến đổi wavelet sẽ phân tích t/h thành 2 băng con

(độ dài N/2):
• Một t/h con là trung bình chạy (running average)
(trend)
• Một t/h con là sai khác chạy (running difference)
(fluctuation)
• Biến đổi Wavelet Harr: Thuận (mức 1: )
– T/h con trung bình chạy: lấy trung bình, nhân sqrt(2)
(bảo toàn năng lượng của tín hiệu)
(3.21)
– Tín hiệu con vi sai: 1/2 sai khác, nhân sqrt(2))
(3.22)
• Biến đổi Wavelet Harr: Ngược
(3.23)
– Biên độ của tín hiệu con vi sai thường nhỏ hơn đáng kể so
với biên độ của tín hiệu gốc.
– Nếu f có 8 giá trị, trung bình là 7 thì tín hiệu con vi sai có 4
giá trị, trung bình 0,75sqrt(2) (nhỏ hơn 6,6 lần).
– Ví dụ: Cho tín hiệu rời rạc:
– T/h con trung bình chạy:

– Tín hiệu con vi sai:
– Biến đổi Haar mức 1:
+ Thuận:
+ Ngược:
– Tính bảo tồn và đóng gói năng lượng:
• Năng lượng của tín hiệu f: (3.24)
• Biến đổi wavelet mức 1 (biến đổi Haar):
 Năng lượng t/h con trung bình chiếm: 440/446=

98,7% tổng năng lượng của t/h
• Biến đổi nhiều mức
– Tính bảo tồn và đóng gói năng lượng:
• Năng lượng của tín hiệu f:
• Biến đổi nhiều mức: Từ t/h con trung bình mức 1

phân tích thành 2 t/h con trung bình và vi sai mức
2, mức 3, …:
Trong đó: (Chiếm 90% năng lượng của tín hiệu, độ

dài 1/4)
– Bài tập: DWT-1D (Biến đổi thuận)
Cho x(k)= {1, 2, 3, 4, 5, 6, 7, 8}. Haar 2 mức:
– Bài tập: DWT-1D (Biến đổi thuận)
Cho x(k)= {1, 2, 3, 4, 5, 6, 7, 8}. Haar 2 mức:
– Bài tập: DWT-1D (Biến đổi ngược)
Haar 2 mức:
– Bài tập: DWT-1D (Biến đổi ngược)
Haar 2 mức:
• Biến đổi Wavelet Harr: Bài tập: DWT-2D (thuận)
Cho:
+ Thực hiện biến đổi theo hàng, sau đó theo cột

• Biến đổi Wavelet Harr: Bài tập: DWT-2D (ngược)
Với:
• Biến đổi Wavelet Harr: Bài tập: DWT-2D (ngược)
3.6- Một số chuẩn nén ảnh
3.6.1- Chuẩn nén JPEC
• JPEG: Joint Photographic Experts Group
• Trở thành chuẩn quốc tế vào đầu những năm 90 (bắt
đầu nghiên cứu vào 80’s).
• Chuẩn JPEG: cho nén ảnh tĩnh đơn sắc và màu. Nhưng
cũng được sử dụng cho nhiều ứng dụng với ảnh động
(do chất lượng ảnh khôi phục khá tốt và ít phải tính toán
hơn so với nén MPEG).
• MPEG-1/2/4/7: do Ủy ban ISO IEC/JTC1/SC29/WG11
phát triển cho mã hoá kết hợp giữa video và audio.
• H.261: chuẩn mã hoá video cho các dịch vụ nghe nhìn
tốc độ nx 64Kbps, do nhóm nghiên cứu XI phát triển.
• ITU-TS H.263 cho các ứng dụng điện thoại thấy hình tốc
độ dưới 64Kbps.
• Mã hóa JPEC:
• Mã hóa JPEC:
+ Bước I: Chia ảnh thành các khối 8x8
- Chèn 0 đối với các khối biên không phải 8x8.
- Với ảnh màu thường chuyển sang không gian màu (Y, Cb, Cr)
- Mỗi khối chỉ có 64 pixel. Nhiều giá trị pixel gần bằng nhau đối
với các pixel lân cận.
• Mã hóa JPEC:
+ Bước II: Thực hiện DCT-2D trên mỗi khối, có được 64 hệ số
biến đổi ở đầu ra.
- Với i(p,q): giá trị của pixel (p=0,…,7; q=0,…,7)
(3.25)
Hầu hết các giá trị lớn

hơn nằm ở góc trên trái
(tại tần số thấp)
• Mã hóa JPEC:
+ Bước III: Lượng tử hóa các hệ số DCT
- Sử dụng bộ lượng tử hóa đều đối với mỗi hệ số.
- Các hệ số khác nhau được lượng tử hóa với kích cỡ
bước khác nhau (Q):
- Các hệ số tần số thấp có Q nhỏ hơn
- Các hệ số tần số cao có Q lớn hơn
- Được xác định trong ma trận chuẩn tắc. Sau đó ma
trận này có thể được định cỡ qua hệ số tỷ lệ (QP).
• Mã hóa JPEC:
• Mã hóa JPEC:
Ma trận LTH mặc định trong JPEG (cho tp Luminance)
• Mã hóa JPEC:
LTH đều
• Mã hóa JPEC:
+ Bước VI: Quét zig-zag trong JPEG
Horizontal frequency
0 1 5 6 14 15 27 28
2 4 7 13 16 26 29 42
Vertical frequency
3 8 12 17 25 30 41 43
9 11 18 24 31 40 44 53
10 19 23 32 39 45 52 54
20 22 33 38 46 51 55 60
21 34 37 47 50 56 59 61
35 36 49 48 57 58 62 63
• Mã hóa JPEC:
+ Bước V: Mã hóa entropy JPEG
- Sau khi lượng tử hóa, các hệ số (1 DC + 63 AC) được mã hóa
entropy.
- Các hệ số DC và AC được xử lý khác nhau. Vì sau khi LTH, có
nhiều thành phần AC=0, thực hiện RLC:
- Bước RLC thay thế các giá trị trong vector 64 phần tử
bằng các cặp: (Chạy dài, Giá trị)
- trong đó Chạy dài: là số số 0 và Giá trị là giá trị khác 0
kế tiếp.
- Chú ý, hầu hết các thành phần 0 thường nằm về phía
góc phải dưới (các tần số không gian lớn- t/s cao).
- Thực hiện quét zig-zag cho một vector 64 phần tử.
• Mã hóa JPEC:
- Mã hóa các hệ số DC:
- Mỗi 1 khối có 1 DC.
- Các hệ số DC có thể khác nhau rất nhiều trong toàn bộ
ảnh, nhưng khác nhau ít từ khối này đến khối lân cận.
- Các hệ số DC được mã hóa DPCM.
- Ví dụ: có 5 hệ số DC đầu tiên: 150, 155, 149, 152, 144,

chúng ta có mã DPCM: 150, 5, -6, 3, -8
• Mã hóa JPEC:
Sơ đồ khối bộ mã hóa
• Mã hóa JPEC:
Bảng mã Huffman phân loại các thành phần DC và AC
• Mã hóa JPEC:
Bảng mã Huffman cho các thuộc tính của thành phần DC

• Mã hóa JPEC:
- Mã hóa các hệ số AC:
Sơ đồ khối bộ mã hóa
• Mã hóa JPEC:
Bảng mã Huffman phân loại các thành phần DC và AC
• Mã hóa JPEC:
Bảng mã Huffman
cho thành phần AC
• Mã hóa JPEC:
- Mã hóa các hệ số AC: Sơ đồ khối bộ mã hóa
• Giải mã JPEC:
Bài tập chương 3
3.5.2- Mã hoá biến đổi (Harr)
Bài 1: Cho đoạn tiếng nói gồm 8 mẫu thoại như sau:
x(n)=[1,-2,-1,0,1,2,-1,0] với n=0,…,7.
Thực hiện phân tích đa phân giải tín hiệu trên, với các sóng
con:
a) Tìm biến đổi Haar 2 mức. Phân tích đóng gói năng
lượng của biến đổi Haar.
b) Khôi phục lại x(n) qua biến đổi Haar ngược. Tính MSE
giữa tín hiệu ban đầu và tín hiệu khôi phục?
c) Nêu ý nghĩa của biến đổi Haar
0 0 0 0
0 256 0 0
Bài 2: Cho ảnh I4x4 (8 bits/pixel) như sau: I 
0 0 0 0
0 0 0 0
Tính toán biến đổi sóng con Haar 1 mức ảnh I ở trên, sau đó
thực hiện mã hóa trung bình 2 bits/pixel như sau:
a) Mã hóa băng con LL với 8 bits/pixel và các băng con còn lại
là 0 bits/pixel sử dụng lượng tử hóa đều vô hướng.
b) Mã hóa 4 băng con với 2 bits/pixel sử dụng lượng tử hóa
đều vô hướng.
c) Mã hóa 4 băng con sử dụng DPCM với lượng tử hóa đều vô
hướng 2 bits/pixel.
d) So sánh các ảnh khôi phục của ảnh I tương ứng với các cơ
Bài 3: Cho ảnh X4x4:
a) Thực hiện chuyển đổi Wavelet Haar hai mức. Phân tính đóng gói
năng lượng của phép chuyển đổi Haar.
b) Mã hóa băng LL bằng 8 bit/pixel, các băng con còn lại là 0 bit/pixel,
dùng lượng tử đều kích thước bước lượng tử bằng 1.
c) Khôi phục lại ảnh qua biến đổi haar ngược. Tính MSE giữa tín hiệu
gốc và tín hiệu sau khôi phục.
Bài 4: Cho khối ảnh S2x2:
8 2
S  
2 8
a) Mã hóa ảnh S trên sử dụng chuẩn nén ảnh JPEG (bỏ qua bước trừ
3 2
Q 
128 điểm ảnh). Biết ma trận lượng tử 2
và DC của khối
 5
trước

đó là 3.
b) Tính tỷ số nén, RMS,MSE, PSNR?

Chương 3-X Lý At&ha

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chương 3-X Lý At&ha

Uploaded by

Copyright:

Available Formats

BÀI GIẢNG MÔN

XỬ LÝ ÂM THANH & HÌNH ẢNH

Bộ môn: Tín hiệu và Hệ thống

Bức ảnh Lena đơn sắc 1 bi

Là giai đoạn quan trọng nhất.

Mầu Bước sóng, 10-9 m

- CMY thành RGB (C:Cyan-Lục lam; M:Magenta-Đỏ tươi;

- Chuyển đổi RGB thành YUV:

- Chuyển đổi RGB thành YIQ:

- Chuyển đổi RGB thành YCbCr:

The conversion between RGB and YCbCr

– Thực tế luôn có nhiễu ngẫu nhiên trong ảnh, nên có một

Dòng quét từ A đến B trong ảnh liên tục

Ảnh 512X512, RGB, 30Hz:

 1 picture = 512x512x3 =786 KB

 1 second = 786KB x 30 = 23.5 MB

 1 minute = 23.5 MB x 60 = 1.4 GB

DATA = INFORMATION + REDUNDANT DATA

• Độ dư thừa dữ liệu là tham số đánh giá trong nén ảnh số

Loại bỏ thông tin Tăng khả năng

Mô hình hệ thống nén tổng quát

Mô hình mã hóa và giải mã nguồn

. Hoặc qua PSNR (Peak to Signal to Noise Ratio):

a) Xác định chuỗi mã đầu ra bộ mã hóa số học cho bản tin

Mã của 256 kí tự cơ bản

Kí hiê ̣u Xác suất Dải

Mã hóa chuỗi sau sử dụng bộ mã hóa DPCM: {1,3,4,4,7,8,6,5,3,1}. Sử

Mẫu vào Mẫu dự Sai số dự Sai số được Mã Giá trị khôi

– An example of Daubechies basis vectors (there are many

– Biến đổi wavelet sẽ phân tích t/h thành 2 băng con

– Tín hiệu con vi sai: 1/2 sai khác, nhân sqrt(2))

– T/h con trung bình chạy:

• Biến đổi wavelet mức 1 (biến đổi Haar):

 Năng lượng t/h con trung bình chiếm: 440/446=

• Biến đổi nhiều mức: Từ t/h con trung bình mức 1

Trong đó: (Chiếm 90% năng lượng của tín hiệu, độ

+ Thực hiện biến đổi theo hàng, sau đó theo cột

Hầu hết các giá trị lớn

- Ví dụ: có 5 hệ số DC đầu tiên: 150, 155, 149, 152, 144,

Bảng mã Huffman cho các thuộc tính của thành phần DC

b) Tính tỷ số nén, RMS,MSE, PSNR?

You might also like