Professional Documents
Culture Documents
Chương 3-X Lý At&ha
Chương 3-X Lý At&ha
Hình ảnh thang độ xám Các mặt phẳng bit cho hình
của Lena ảnh 8-bit thang độ xám
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
b) Ảnh số:
- Ảnh màu: mỗi điểm ảnh màu được biểu diễn bởi các
thành phần chói và các thành phần màu.
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
b) Ảnh số:
- Ảnh màu: mỗi điểm ảnh màu được biểu diễn bởi các
thành phần chói và các thành phần màu.
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
b) Ảnh số:
• Điểm ảnh: là một phần tử của ảnh số tại tọa độ (x,y) có mức
xám hoặc mức màu nhất định. Kích thước và khoảng cách
giữa các điểm ảnh được chọn thích hợp sao cho mắt người
cảm nhận được sự liên tục về không gian mức xám (hoặc
màu) của ảnh số gần giống như ảnh thật
• Độ phân giải của ảnh: là mật độ điểm ảnh được chỉ thị trên
một ảnh số được hiển thị
• Mức xám của điểm ảnh: cường độ sáng của nó được thể
hiện bằng một giá trị số tại điểm đó
• Các thang giá trị mức xám thông thường: 16, 32, 64, 128;
256 (mức phổ biến)
dpi (dots per inch)
1 inch = 2.54 centimeters
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
b) Ảnh số:
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
c) Khái niệm xử lý ảnh:
- Nâng cao chất lượng ảnh theo một tiêu chí nào đó (cảm nhận
của con người).
- Phân tích ảnh để thu được các thông tin đặc trưng giúp cho
việc phân loại, nhận biết ảnh.
- Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn,
sâu hơn.
- Là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong
muốn. Ảnh
“Tốt hơn”
Ảnh
XỬ LÝ ẢNH
Kết luận
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
d) Lịch sử về xử lý ảnh:
• Bắt nguồn từ 2 ứng dụng: nâng cao chất lượng thông tin hình
ảnh và xử lý số liệu cho máy tính.
• Ứng dụng đầu tiên: truyền thông tin ảnh báo giữa London và
NewYork vào năm 1920 qua cáp Bartlane:
- Mã hóa dữ liệu ảnh → khôi phục.
- Thời gian truyền ảnh: từ 1 tuần → 3 tiếng.
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
d) Lịch sử về xử lý ảnh:
• Ảnh 15 mức độ xám được truyền từ London
đến NewYork, năm 1929. (McFarlane)
• Hệ thống đầu tiên có khả năng mã hóa hình ảnh với mức xám
là 5.
• Trong khoảng thời gian này mới chỉ nói đến ảnh số, chưa nói
đến xử lý ảnh số (chưa có máy tính).
• Năm 1964: ảnh mặt trăng được đưa về trái đất thông qua
máy chụp của tàu Ranger 7 để cho máy tính xử lý (chỉnh
méo).
3.1- Giới thiệu
3.1.1- Khái niệm ảnh & xử lý ảnh
d) Lịch sử về xử lý ảnh:
• Cùng với các ứng dụng trong khám phá vũ trụ, các kỹ thuật xử
lý ảnh cũng bắt đầu trong y học từ cuối 1960s và đầu 1970s.
• Đến nay, xử lý ảnh có một bước tiến dài trong nhiều ngành
khoa học, từ ứng dụng đơn giản đến phức tạp.
• Mô hình hệ thống xử lý ảnh (góc độ người dùng)
3.1- Giới thiệu
3.1.2- Các ứng dụng của xử lý ảnh
• Xử lý ảnh vệ tinh, ảnh viễn thám
• Thiên văn, nghiên cứu không gian, vũ trụ
• Thăm dò địa chất
• Y tế
• Robot, tự động hóa
• Giám sát phát hiện chuyển động
• Tách ghép ảnh và video,…
Xử lý số ảnh:
3.1- Giới thiệu
Phân vùng ảnh (Segmentation)
Phân tích ảnh (Analyse): có được sự mô tả về ảnh, xác định biên ảnh.
Nén dữ liệu ảnh (Compression)
Biến đổiCác
3.1.3-
ảnh giai
tương tự thành
đoạn xử lýảnh rờisố
ảnh rạc:
Trích chọn các đặc tính (Feature Extraction)...
Lấy
Tăngmẫu (rờiảnh
cường rạc (Enhancement):
về mặt không gian)nhằm loại bỏ các suy giảm
Lượng tử hóa(rời
(degradation) trongrạc
ảnh:vềlọcmặt
độ biên
tươngđộ).
phản, khử nhiễu, nổi màu,…
Khôi phục ảnh (Restoration).
Phát hiện biên (Egde Detection)
Hệ quyết định:
Tùy mục đích của ứng dụng mà chuyển sang giai đoạn
khác là hiển thị, nhận dạng, phân lớp, truyền thông…
(3.1)
(3.2)
3.1- Giới thiệu
3.1.6- Màu sắc trong ảnh và video
b) Các mô hình màu trong video
- Các ảnh trước khi truyền, được quét với 3 thiết bị quang,
mà mỗi một trong số chúng đều có một bộ lọc màu khác
nhau đặt ở phía trước của thiết bị.
- Ba kênh (R, G, B) được hiệu chỉnh sao cho nếu một vùng
trắng đều được quét, thì cả 3 đầu ra phải có điện áp cân
bằng nhau.
- Vì mắt người có độ nhạy khác nhau đối với các màu có
cùng cường độ, nên độ chói phải được bổ sung thêm các
trọng số. Độ chói của t/h Y:
Y= 0.299R+0.587G+0.114B (3.3)
- Do một sắc màu đc xác định: nếu hai trong số ba màu cơ
bản được biết, nên chỉ cần truyền đi thông tin của 2 t/h.
Màu thứ 3 sẽ được tính toán lại tại phía thu đưa ra mô
hình màu khác nhau trong truyền dẫn tín hiệu video.
3.1- Giới thiệu
3.1.6- Màu sắc trong ảnh và video
b) Các mô hình màu trong video
+ Mô hình YUV:
(được sử dụng cho tín hiệu video tương tự hệ PAL)
- T/h màu U, V:
(3.4)
(3.5)
3.1- Giới thiệu
3.1.6- Màu sắc trong ảnh và video
b) Các mô hình màu trong video
+ Mô hình YIQ: (được sử dụng cho t/h video màu NTSC)
- Do U và V không biểu thị hết phân cấp bậc thấp nhất về độ
nhạy hiển thị của người. NTSC đã sử dụng I và Q thay thế.
- YIQ được xem như là một phiên bản của YUV, với cùng
một Y nhưng với U và V được quay đi góc 33 °
- T/h màu U, V:
(3.6)
(3.8)
Cáp S-Video
3.2- Cơ sở xử lý ảnh số
3.2.1- Cơ sở cảm nhận thị giác
• Việc xử lý hình ảnh trong các ứng dụng: trợ giúp con người
quan sát thông tin trong một hình ảnh phải hiểu được hệ
thống thị giác của con người.
• Hệ thống thị giác của người tập trung chủ yếu: vào mắt (cảm
biến hình ảnh hay camera), thần kinh thị giác (đường dẫn
hình ảnh) và não (các khối thông tin xử lý về ảnh…).
3.2- Cơ sở xử lý ảnh số
3.2.1- Cơ sở cảm nhận thị giác
• Mắt hoạt động như một camera: thấu kính tập trung hình ảnh vào
võng mạc.
• Võng mạc: nơi tập trung các tế bào hình que (rods) và ba loại tế
bào hình nón (cones).
• Các tế bào hình que (~75-150 triệu): phân bố quanh hoàng điểm
(điểm vàng), rất nhậy về ánh sáng nhưng không cảm thụ màu sắc.
• Các tế bào hình nón (~6,5 triệu): tập trung tại hoàng điểm, kém
nhậy cảm với ánh sáng, nhưng cảm thụ và phân biệt được màu
tương ứng với ba loại tế bào hình nón nhậy cảm với 3 mầu khác
nhau: Đỏ, Xanh lá cây và Xanh lơ
3.2- Cơ sở xử lý ảnh số
3.2.1- Cơ sở cảm nhận thị giác
• Mắt hoạt động như một camera: thấu kính tập trung hình ảnh vào
võng mạc.
• Võng mạc: nơi tập trung các tế bào hình que (rods) và ba loại tế
bào hình nón (cones).
• Các tế bào hình que (~75-150 triệu): phân bố quanh hoàng điểm
(điểm vàng), rất nhậy về ánh sáng nhưng không cảm thụ màu sắc.
• Các tế bào hình nón (~6,5 triệu): tập trung tại hoàng điểm, kém
nhậy cảm với ánh sáng, nhưng cảm thụ và phân biệt được màu
tương ứng với ba loại tế bào hình nón nhậy cảm với 3 mầu khác
nhau: Đỏ, Xanh lá cây và Xanh lơ
3.2- Cơ sở xử lý ảnh số
3.2.1- Cơ sở cảm nhận thị giác
+ Đáp ứng phổ của mắt người:
• Mắt người nhạy cảm nhất với ánh sáng ở vùng giữa của phổ
nhìn thấy, độ nhạy tương đối là hàm của bước sóng.
• Hàm độ nhạy của mắt người V( ) (đứt nét): tổng 3 đường
cong đáp ứng phổ của các mầu đỏ, xanh lá cây, và xanh lam.
3.2- Cơ sở xử lý ảnh số
3.2.1- Cơ sở cảm nhận thị giác
+ Mô hình hình thành hình ảnh:
• Ánh sáng từ nguồn với phân bố năng lượng phổ (SPD-
Spectral Power Distribution) - E( ) đến bề mặt của vật thể, có
hàm phản xạ phổ bề mặt S() và sau đó được lọc bởi các
hàm độ nhạy phổ tương ứng với các tế bào hình nón q().
Hàm C() được gọi là tín hiệu màu sắc và tích của E( ) và
S().
3.2- Cơ sở xử lý ảnh số
3.2.2- Quá trình thu tín hiệu hình ảnh
• Ảnh được nhận qua camera màu hoặc đen trắng:
– Loại camera tương tự ống chuẩn CCIR- (Consultative
Committee on international Radio) với tần số 1/25, mỗi
ảnh 25 dòng),
– Loại camera số (CCD– Charge Coupled Device) là loại
photodiode tạo cường độ sáng tại mỗi điểm ảnh.
• Camera thường dùng là loại quét dòng; ảnh tạo ra có dạng
hai chiều.
• Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu,
vào môi trường (ánh sáng, phong cảnh).
• Trên thực tế các thiết bị thu nhận ảnh có thể là: máy quay
(Cameras) cộng với bộ chuyển đổi tương tự số; máy quét
(Scaners) chuyên dụng và các bộ cảm biến ảnh (Sensors).
3.2- Cơ sở xử lý ảnh số
3.2.2- Quá trình thu tín hiệu hình ảnh
+ Thu nhận ảnh sử dụng bộ cảm biến đơn:
• Bộ cảm biến đơn phổ biến nhất là photodiode (vật liệu
silicon): dạng sóng điện áp đầu ra tỷ lệ với ánh sáng đầu vào.
• Sử dụng bộ lọc ở mặt trước của bộ cảm biến: nâng cao tính
chọn lọc.
• Ví dụ: bộ lọc mầu xanh lá trước bộ cảm biến sẽ nhạy hơn cho
ánh sáng trong băng mầu xanh lá của phổ mầu. Kết quả: đầu
ra cảm biến sẽ cho ảnh có ánh sáng mầu xanh mạnh hơn các
thành phần mầu khác.
3.2- Cơ sở xử lý ảnh số
3.2.2- Quá trình thu tín hiệu hình ảnh
+ Thu nhận ảnh sử dụng dải cảm biến:
• Dải cảm biến bao gồm nhiều cảm biến được sắp xếp theo một hàng.
• Dải cảm biến tạo ra các phần tử ảnh theo một hướng.Chuyển động
theo hướng vuông góc với dải cảm biến: tạo ra ảnh theo một hướng
khác. (các ứng dụng XLA bằng máy bay)
• Các dải cảm biến cũng có cấu hình vòng sử dụng trong y học và công
nghiệp để tạo ra các ảnh cắt lớp cho các vật thể 3D.
3.2- Cơ sở xử lý ảnh số
3.2.2- Quá trình thu tín hiệu hình ảnh
+ Thu nhận ảnh sử dụng mảng cảm biến:
• Các bộ cảm biến được sắp xếp lại để hình thành nên một mảng cảm
biến hai chiều. (Các thiết bị cảm biến siêu âm, điện từ trường hoặc
trong các camera số (loại CCD)).
• Ưu điểm: có thể thu nhận được ngay toàn bộ ảnh hoàn chỉnh của
vật thể thông qua việc tập trung nguồn năng lượng sáng trên bề
mặt của mảng cảm biến.
3.2- Cơ sở xử lý ảnh số
3.2.3- Số hóa ảnh
• Các t/h và hình ảnh (trước khi cảm nhận) là những đối
tượng tương tự tự nhiên (các tín hiệu tồn tại trong miền
không gian/thời gian) là liên tục và cũng có thể nhận các
giá trị liên tục.
• Khi nói về xử lý các t/h video và hình ảnh số (T/h được
cảm nhận): phải được chuyển sang dạng số mà máy vi
tính có thể đọc được.
• Nói đến kỹ thuật số nghĩa là: tín hiệu được xác định trên
miền (không gian/thời gian) rời rạc, và nó nhận các giá trị
từ một tập các khả năng rời rạc.
• Trước khi bắt đầu quá trình xử lý số: phải thực hiện quá
trình chuyển đổi từ tương tự sang số (A/D). Biến đổi A/D
bao gồm: lấy mẫu, lượng tử hóa và mã hóa .
3.2- Cơ sở xử lý ảnh số
3.2.3- Số hóa ảnh
• Quá trình chuyển đổi tín hiệu và ảnh A/D:
3.2- Cơ sở xử lý ảnh số
3.2.3- Số hóa ảnh (Lấy mẫu và lượng tử)
+ Chuyển đổi dữ liệu liên tục trong bộ cảm ứng sang dạng
số (số hóa ảnh):
• Từ ảnh liên tục theo tọa độ x, y và biên độ f,
• Tiến hành lấy mẫu theo cả 2 tọa độ và biên độ
• Lấy mẫu: số hóa giá trị các tọa độ
(Quét ảnh theo hàng và lấy mẫu theo hàng. Đầu ra là rời rạc
về mặt không gian, nhưng liên tục về mặt biên độ)
• Lượng tử hóa: số hóa các giá trị biên độ
(lượng tử hóa về mặt biên độ (độ sáng) cho dòng ảnh vừa
được rời rạc hóa)
3.2- Cơ sở xử lý ảnh số
3.2.3- Số hóa ảnh (Lấy mẫu và lượng tử hóa)
+ Chuyển đổi dữ liệu liên tục trong bộ cảm ứng sang dạng
số (số hóa ảnh):
• Lấy mẫu: (số hóa giá trị các tọa độ)
– Yêu cầu tín hiệu có dải phổ hữu hạn: f x f x max , f x f x max
– Ảnh thỏa mãn điều kiện trên, và được lấy mẫu đều trên
một lưới hình chữ nhật, với bước nhảy (chu kỳ lấy mẫu)
x, y sao cho:
1 1
2 f x max , 2 f y max (3.10)
x y
- Kết quả sau LM và LTH: chuỗi giá trị rời rạc mô tả các mức độ chói trong
một dòng ảnh. Chuỗi được mã hóa để gán biểu diễn thành các từ mã.
- Thực hiện quá trình số hóa cho tất cả các dòng ảnh từ trên xuống dưới:
sẽ nhận được ảnh số trong không gian hai chiều.
3.2- Cơ sở xử lý ảnh số
3.2.3- Số hóa ảnh (Lấy mẫu và lượng tử hóa)
• Ảnh liên tục được chiếu lên một mảng cảm ứng và Ảnh số
Chất lượng ảnh được xác định qua số mẫu và mức xám sử dụng
3.2- Cơ sở xử lý ảnh số
3.2.4- Biểu diễn ảnh số
• Ảnh số: tập hợp các điểm ảnh với mức xám phù hợp
dùng để mô tả ảnh gần với ảnh thật.
• Biểu diễn ảnh số:
– Ảnh được bd bởi một ma trận kích thước MxN, tương
ứng với số điểm ảnh của bộ cảm biến quang
– Mỗi phần tử của ảnh sẽ có 1 đến 3 giá trị tùy thuộc vào
ảnh mức xám (đen trắng) hay ảnh màu
– Các khoảng giá trị là một số nguyên nằm trong khoảng
[Lmin, Lmã]
– Tổng số bit để biểu diễn các mức xám trong khoảng L là
K sao cho: L=2K
– Tổng số bit cần để lưu trữ một ảnh là: MxNxK (bit)
3.3- Kỹ thuật nén ảnh
3.3.1- Tổng quan về nén ảnh
• Mục đích nén ảnh: để giảm thiểu dung lượng dữ liệu nhằm
nâng cao hiệu quả truyền dẫn và lưu trữ.
• Ví dụ:
100KB/s ~ 1phut
5,7MB=5760KB
3x640x480
x8 x24 =
177MB
Video 24 h/s
3.3- Kỹ thuật nén ảnh
3.3.1- Tổng quan về nén ảnh
• Mục đích nén ảnh: để giảm thiểu dung lượng dữ liệu nhằm
nâng cao hiệu quả truyền dẫn và lưu trữ.
• Ví dụ:
1 hour = 1.4 GB x 60 = 84 GB
3.3- Kỹ thuật nén ảnh
3.3.1- Tổng quan về nén ảnh
• Nguyên lý nén ảnh: thực hiện quá trình làm giảm thông
tin dư thừa trong dữ liệu.
1600x1200 1600x1200
Nén
5,7MB 406KB
. Bộ biến đổi: dùng phép biến đổi DCT, DWT để tập trung
năng lượng t/h vào một số lượng nhỏ các hệ số khai triển để
thực hiện phép nén hiệu quả hơn là dùng t/h ban đầu.
. Bộ lượng tử hoá: tạo ra một lượng ký hiệu giới hạn cho ảnh
nén với hai kỹ thuật: LT vô hướng (thực hiện LTH cho từng
phần dữ liệu) và LT vectơ (thực hiện LTH một lần một khối dữ
liệu). Quá trình này không thuận nghịch.
. Bộ mã hoá: gán một từ mã, một dòng bit nhị phân cho mỗi
ký hiệu.
3.3- Kỹ thuật nén ảnh
3.3.1- Tổng quan về nén ảnh
• Mô hình nén ảnh: (Bộ giải mã hóa nguồn)
. Bộ giải mã: thực hiện giải mã tín hiệu nhận được để cho ra ma
trận các hệ số của ảnh biến đổi.
, Bộ chuyển đổi: thực hiện biến đổi nghịch (so với quá trình biến
đổi ở bộ mã hóa) để khôi phục lại ảnh số ban đầu.
3.3- Kỹ thuật nén ảnh
3.3.2- Hiệu quả nén ảnh và chất lượng ảnh
• Hiệu quả nén ảnh: được xác định bằng tỉ lệ nén (tỉ số
giữa lượng dữ liệu của ảnh gốc trên lượng dữ liệu của
ảnh nén)
. Độ phức tạp của thuật toán nén: được xác định bằng số
bước tính toán trong cả hai quá trình mã hóa và giải mã.
. Thông thường thì thuật toán nén càng phức tạp bao nhiêu
thì hiệu quả nén càng cao nhưng ngược lại giá thành và
thời gian để thực hiện lại tăng.
3.3- Kỹ thuật nén ảnh
3.3.2- Hiệu quả nén ảnh và chất lượng ảnh
• Chất lượng ảnh nén:
. Đánh giá chất lượng ảnh nén=sai lệch bình phương trung bình
rms (Root Mean Square):
(3.13)
(3.14)
3.3- Kỹ thuật nén ảnh
3.3.3- Phân loại các phương pháp nén ảnh
• Phân loại theo nguyên lý nén:
- Nén không tổn thất (Loss-less): bao gồm các p2 nén ảnh mà
sau khi giải nén thu được chính xác dữ liệu gốc.
- Nén tổn thất (Lossy Compression): sau khi giải nén ta không
thu được dữ liệu như bản gốc, trong nén ảnh, người ta gọi là các
phương pháp “tâm lý thị giác”.
• Phân loại theo cách thực hiện nén:
. Phương pháp không gian (Spatial Data Compression): thực hiện
nén bằng cách tác động trực tiếp lên các mẫu (điểm ảnh) của
ảnh gốc.
. Phương pháp sử dụng mã hóa biến đổi (Transform
Coding): tác động lên các hệ số biến đổi của ảnh gốc mà
không tác động trực tiếp lên các mẫu của ảnh gốc.
3.4- Các p2 nén ảnh không tổn thất
- Nén cho các ứng dụng yêu cầu không lỗi: Ví dụ trong y
tế, nén tài liệu..vv
- Tỷ số nén CR= 2 đến 10
- Loại bỏ sự dư thừa về mã và dư thừa về không gian
- Ví dụ: Huffman codes, Arithmetic coding, LZW, 1D and 2D
run-length encoding, Loss-less Predictive Coding, and
Bit-Plane Coding.
3.4- Các p2 nén ảnh không tổn thất
3.4.1- Mã hoá Huffman
- Dựa vào mô hình thống kê tính x/suất xuất hiện các ký tự.
- Gán cho các ký tự có xác xuất cao bằng một từ mã ngắn,
các ký tự có xác xuất thấp bằng một từ mã dài.
• Thuật toán:
1. Khởi tạo: liệt tất cả các ký hiệu trong danh sách đã được sắp
xếp theo xác suất xuất hiện giảm dần.
2. Lặp lại cho đến khi danh sách chỉ còn lại 1 ký hiệu.
(a) Từ danh sách, chọn 2 ký hiệu có x/s xuất hiện thấp nhất. Tạo
thành một nút con.
(b) Gán tổng x/suất của các nút con vào nút cha và chèn vào
danh sách sao cho trật tự giảm dần được đảm bảo.
(c) Xóa các nút con khỏi danh sách.
3. Gán từ mã cho mỗi lá theo đường dẫn từ gốc.
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- Là kĩ thuật nén dữ liệu mà cho phép mã hóa dữ liệu bằng cách
tạo ra một chuỗi mã (code string). Chuỗi này biểu diễn một giá
trị thập phân nằm trong khoảng giữa 0 và 1.
- Ý tưởng cơ bản của mã hóa số học là sử dụng khoảng chia
giữa 0 và 1 để biểu diễn các khoảng mã hóa.
- Rõ ràng hàm mật độ xác xuất tích lũy của tất cả các kí hiệu sẽ
bằng 1.
- Khi bản tin càng dài thì các khoảng để biểu diễn bản tin đó
càng ngắn, và số các bít cần để xác định khoảng đó càng tăng.
- Dựa trên các xác suất kí hiệu tạo ra bởi mô hình, kích thước
của các khoảng cho các kí tự tiếp theo của bản tin sẽ giảm.
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- Quá trình mã hóa:
+ B1: Gán mỗi ký hiệu riêng lẻ với một đoạn của dải [0, 1)
(khởi đầu) (mà đoạn đó tương ứng với xác suất xuất hiện
của kí tự đó trong hàm mật độ xác suất tích lũy).
+ B2: Xác định giá trị biên trên (Un) và biên dưới (Ln) cho
dải bản tin đầu ra (Sau khi kí hiệu đầu tiên đã được mã
hóa). Mỗi giá trị mới được mã hóa sẽ càng làm cho dải này
hẹp lại.
+ B3: Lặp (B1,B2) dải giá trị mới cho đến khi xác định chuỗi
mã đầu ra (một giá trị thập phân).
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- Quá trình giải mã:
+ Sử dụng các khoảng xác suất giống như bộ mã hóa và thực
hiện quá trình tương tự.
+ Tổng quát đối với quá trình giải mã có thể được công thức hóa
như sau:
Rn Ln
Rn 1 (3.15)
U n Ln
Trong đó: Rn là mã nằm trong dải giá trị dưới Ln và giá trị trên Un
của kí hiệu thứ n và Rn+1 là mã cho kí hiệu tiếp theo.
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- Ví dụ 1: Cho tập các ký hiệu {a, b, c, d} và mô hình tĩnh
được sử dụng với các xác suất như biểu diễn ở Bảng:
Kí hiê ̣u Xác suất Dải
A 0.6 [0.0, 0.6)
B 0.2 [0.6, 0.8)
C 0.1 [0.8, 0.9)
D 0.1 [0.9, 1)
B2:
+ Kí hiệu đầu tiên cần được mã hóa là a. Do đó, bản tin
được mã hóa cuối cùng phải là một số lớn hơn hoặc bằng
0 (Ln) và nhỏ hơn 0.6 (Un)
+ Sau khi kí hiệu đầu tiên đã được mã hóa, ta biết được giá trị
Un và Ln cho dải mới bản tin đầu ra.
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- HD Ví dụ 1:
a) Xác định chuỗi mã đầu ra bộ mã hóa số học
B3: Bước lặp
+ Mã hóa cho ký hiệu thứ 2 trong bản tin:
. Gán mỗi ký hiệu riêng lẻ với một đoạn của dải mới [0, 0.6)
a b c d
. Ký hiệu thứ 2 (c) được mã hóa: xác định dải mới [0.48,
0.54)
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- HD Ví dụ 1:
a) Xác định chuỗi mã đầu ra bộ mã hóa số học
B3: Bước lặp
+ Mã hóa cho ký hiệu cuối trong bản tin:
. Gán mỗi ký hiệu riêng lẻ với một đoạn của dải mới [0.48, 0.54)
a b c d
. Ký hiệu cuối (d) được mã hóa: xác định dải mới [0.534,
0.54). Do đó: đầu ra bộ mã hóa số học nhận được x =
0.534 (nằm trong dải 0.534 ≤ x <0.54)
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- HD Ví dụ 1:
a) Xác định chuỗi mã đầu ra bộ mã hóa số học
Bảng biểu diễn quá trình mã hóa số học cho bản tin
“ACD”
Kí tự mới Dải
Khởi tạo [0, 1)
Sau khi xem xét một kí hiê ̣u A [0, 0.6)
C [0.48, 0.54)
D [0.534, 0.54)
Kết quả đầu ra bộ mã hóa số học nhận được chuỗi mã ra: x
= 0.534 (nằm trong dải 0.534 ≤ x <0.54)
3.4- Các p2 nén ảnh không tổn thất
3.4.2- Mã hoá số học
- HD Ví dụ 1:
b) Xác định bản tin đầu ra bộ giải mã
Bộ giải mã sẽ sử dụng các khoảng xác suất giống như bộ
mã hóa và thực hiện quá trình tương tự khi nhận được
x= 0.534.
Bảng biểu diễn quá trình giải mã hóa số học
Số (chuỗi) được mã hóa Dải Kí hiệu đầu ra
0.534 [0, 0.6) A
0.89 [0.8, 0.9) C
0.9 [0.9, 1) D
Kết quả đầu ra bộ giải mã số học nhận được bản tin: ACD
(Giống bản tin đầu vào bộ mã hóa) Phương pháp nén
ảnh ko tổn thất.
3.4- Các p2 nén ảnh không tổn thất
3.4.3- Mã hoá từ điển LZW
- Là một trong những kỹ thuật nén không tổn thất.
- Khai thác dư thừa giữa các pixel của ảnh.
- Thực hiện gán các từ mã cố định vào các chuỗi có độ dài thay
đổi của các ký hiệu nguồn. Dựa trên việc xây dựng Từ điển lưu
các chuỗi ký tự có tần suất lặp cao, thay thế bằng từ mã
tương ứng khi gặp lại.
- Nâng cao tỉ lệ nén (kỹ thuật tổ chức từ điển).
Ứng dụng:
- Thường dùng để nén các loại văn bản, ảnh đen trắng, ảnh
màu, ảnh đa mức xám...
- Là chuẩn nén cho các dạng ảnh GIF và TIFF.
3.4- Các p2 nén ảnh không tổn thất
3.4.3- Mã hoá từ điển LZW
• Cách thức mã hóa:
- Khác với mã Huffman, kỹ thuật LZW không cần biết tần
suất của các ký tự trong tín hiệu gốc.
- Để mã hóa theo phương pháp LZW, chuỗi dữ liệu phải
được thực hiện dựa vào tra cứu trong "từ điển" để tìm ra
mã tương ứng với nó. "Từ điển" được hình thành ngay
trong quá trình mã hóa.
- Ví dụ: khi nén ảnh đen-trắng mã hóa 8 bits/pixel, từ điển
được khởi tạo bao gồm 256 từ tương ứng với các mức
chói 0,1,2…255. Sau đó, bộ mã hóa sẽ phân tích lần lượt
chuỗi ký tự (mức xám) liên tiếp trong dữ liệu nguồn, khi
phát hiện trong từ điển không có chuỗi ký tự tương đương,
bộ mã hóa sẽ ghi chuỗi ký tự liên tiếp đó vào vị trí còn
trống của từ điển.
3.4- Các p2 nén ảnh không tổn thất
3.4.3- Mã hoá từ điển LZW
• Cấu trúc từ điển:
m
fˆn round l f n l
l 1
3.4- Các p2 nén ảnh không tổn thất
3.4.5- Mã hoá dự đoán không tổn thất
• Giảm thiểu dư thừa giữa các pixel lân cận: tách và chỉ
mã hóa thông tin mới (sai khác giữa giá trị thực tế và
giá trị dự đoán của pixel đó) trong mỗi pixel:
• Bộ giải mã khôi phục lại:
en f n fˆn
f n en fˆn (3.16)
m
i f n 1
ˆf round
trong đó: n
i 1
3.4- Các p2 nén ảnh không tổn thất
Bài tập:
Bài 1: Cho ảnh I như sau :
a) Xây dựng bảng mã Huffman cho các mức xám của ảnh I trên. Tính tốc độ
bit trung bình và so sánh nó với entropy của nguồn.
b) Mã hóa ảnh I trên sử dụng bảng mã Huffman xây dựng ở câu a.
36 36 128 128
36 36 128 128
Bài 2: Cho ảnh I4x4: I
128 36 36 128
128 36 36 128
a) Mã hóa ảnh I sử dụng mã hóa từ điển LZW. Tính tỷ số nén?
b) Với dữ liệu ảnh nén có được ở câu a, sử dụng giải mã LZW để tìm ảnh ban
đầu? (Giả thiết ảnh được đọc và hiển thị theo thứ tự từ trái qua phải, từ
trên xuống dưới).
3.4- Các p2 nén ảnh không tổn thất
Bài tập:
Bài 3: Cho tập các ký hiệu {a, c, d, e, k, !} và mô hình tĩnh được sử
dụng với các xác suất như biểu diễn ở Bảng sau:
a) Xây dựng bảng mã Huffman cho các mức xám của ảnh I trên. Tính
tốc độ bit trung bình và so sánh nó với entropy của nguồn.
B1: Vẽ biểu đồ Histogram của vùng ảnh và chuyển sang dạng bảng
Số pixel (nk)
6
Mức xám rk 2 3 4 5
5 Số pixel nk 6 5 4 1
4 p(rk) = nk/n 6/16 5/16 4/16 1/16
3
5
2
1
1
𝐿𝑎𝑣 = ∑ 𝑙 (𝑟 𝑘 ) ¿ ¿
0 𝑘 =0
1 2 3 4 5 Mức xám (rk)
b) Mã hóa ảnh I trên
1 sử dụng bảng mã Huffman xây dựng ở câu a.
3.5- Các p2 nén ảnh tổn thất
- Nén ảnh có tổn thất được xây dựng dựa trên độ chính xác
của việc khôi phục lại ảnh trong lúc trao đổi nhằm tăng hiệu
quả nén.
- Nếu kết quả không chính xác (ảnh kém chất lượng) có thể
chấp nhận được, thì hiệu quả nén là đáng kể.
- Trong thực tế, nhiều kỹ thuật mã hoá có tổn thất có khả năng
khôi phục lại ảnh đơn sắc từ dữ liệu được nén có tỉ số nén
100:1, hoặc ảnh khôi phục gần như không phân biệt được so
với ảnh gốc nếu tỉ số nén 10:1 đến 50:1.
- Phương pháp nén ảnh có tổn thất sẽ được trình bày bao gồm
mã hóa DPCM và mã hóa biến đổi.
3.5- Các p2 nén ảnh tổn thất
3.5.1- Mã hoá DPCM
- Là p2 mã hóa dự đoán có tổn thất dựa trên nguyên tắc phát
hiện sự giống nhau và khác nhau giữa các điểm ảnh gần
nhau để tìm cách loại bỏ các thông tin thừa.
- Phân tích thống kê phân bố biên độ t/h video: thấy phân bố
biên độ các mẫu tương ứng với các điểm ảnh về nguyên
tắc là phân bố đều, ngược lại phân bố về độ lệch biên độ
các điểm ảnh có đồ thị hình chuông xung quanh điểm 0.
- Nếu dựa trên các đặc trưng thống kê ảnh, thì sự khác
nhau mẫu là không lớn lắm và để mã hóa chỉ cần số bit bé
(so với việc mã hóa toàn bộ biên độ các mẫu).
- P2 DPCM còn sử dụng đặc điểm của mắt người (kém nhạy
với mức LT có chênh lệch về độ chói giữa điểm ảnh gần
nhau, so với mức LTH chênh lệch nhỏ) và cho phép dùng
đặc trưng phi tuyến về LTH.
3.5- Các p2 nén ảnh tổn thất
3.5.1- Mã hoá DPCM
• Sơ đồ khối của bộ mã hóa và giải mã DPCM:
(a)
(b)
3.5- Các p2 nén ảnh tổn thất
3.5.1- Mã hoá DPCM
• Ví dụ BT mã hóa và giải mã DPCM:
2C u C v M 1 N 1
2i 1 u 2 j 1 v
F u, v
MN
f
i 0 j 0
ij cos
2M
cos
2N
1
u, v 0
C (u ), C (v) 2 (3.17)
1 u, v 0
2 M 1 N 1 2i 1 u 2 j 1 v
ij ngược: C u C v F (u , v ) cos
– fDCT cos
MN u 0 v 0 2M 2N
(3.18)
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet:
– Sử dụng để phân tích các tín hiệu không dừng (non-
stationary) - là những tín hiệu có đáp ứng tần số thay
đổi theo thời gian.
– Mục đích: giải quyết vấn đề về độ phân giải tín hiệu
(miền thời gian hoặc tần số) mà STFT vẫn còn hạn chế.
– Được thực hiện theo cách phân tích đa phân giải - MRA
(Multi Resolution Analysis): phân tích tín hiệu (ảnh)
thành các tín hiệu con (ảnh con) có mức phân giải khác.
Cụ thể:
• Tín hiệu được nhân với hàm Wavelet (tương tự như
nhân với hàm cửa sổ trong biến đổi STFT).
• Thực hiện biến đổi riêng rẽ cho các khoảng t/h khác
nhau trong miền thời gian tại các tần số khác nhau.
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet:
– Lọc dữ liệu (ảnh) thành dữ liệu phân giải thấp và dữ liệu
chi tiết.
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet rời rạc – DWT-1D:
– Sử dụng một tập các bộ lọc: thông cao và thông thấp
(giống kỹ thuật mã hoá băng con- subband coding).
Nhưng các bộ lọc trong DWT được thiết kế phải có đáp
ứng phổ phẳng, trơn và trực giao.
– Dạng tổng quát của biến đổi DWT một chiều (DWT-1D):
– Phân tích: Tín hiệu được đưa qua các bộ lọc thông cao G
và thông thấp H rồi được giảm mẫu (down sampling) hệ số
2 tạo thành biến đổi DWT mức 1. Ngược lại là quá trình
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet hai chiều – DWT-2D:
– Sử dụng các bộ lọc riêng biệt, thực hiện biến đổi DWT-1D
dữ liệu vào (ảnh) theo hàng rồi thực hiện theo cột. Theo
cách này nếu thực hiện biến đổi DWT-2D ở mức 1, sẽ tạo
ra 4 nhóm hệ số biến đổi: LL, HL, LH, HH.
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet hai chiều – DWT-2D:
– DWT-2D 3 mức:
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Một số họ Wavelet rời rạc:
– Wavelet Harr; Wavelet Daubechies; Wavelet Morlet
– The Haar basis vectors are
(3.19)
(3.20)
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet Harr:
– Xét tín hiệu rời rạc:
Trong đó: N- độ dài của tín hiệu, các giá trị f (thực)
được xác định từ tín hiệu tương tự tại thời điểm t1, t2,
…,tN:
(3.21)
(3.22)
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet Harr: Ngược
(3.23)
– Biên độ của tín hiệu con vi sai thường nhỏ hơn đáng kể so
với biên độ của tín hiệu gốc.
– Nếu f có 8 giá trị, trung bình là 7 thì tín hiệu con vi sai có 4
giá trị, trung bình 0,75sqrt(2) (nhỏ hơn 6,6 lần).
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet Harr:
– Ví dụ: Cho tín hiệu rời rạc:
+ Thuận:
+ Ngược:
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet Harr:
– Tính bảo tồn và đóng gói năng lượng:
• Năng lượng của tín hiệu f: (3.24)
Haar 2 mức:
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet Harr:
– Bài tập: DWT-1D (Biến đổi ngược)
Haar 2 mức:
3.5- Các p2 nén ảnh tổn thất
3.5.2- Mã hoá biến đổi
• Biến đổi Wavelet Harr: Bài tập: DWT-2D (thuận)
Cho:
(3.25)
0 1 5 6 14 15 27 28
2 4 7 13 16 26 29 42
Vertical frequency
3 8 12 17 25 30 41 43
9 11 18 24 31 40 44 53
10 19 23 32 39 45 52 54
20 22 33 38 46 51 55 60
21 34 37 47 50 56 59 61
35 36 49 48 57 58 62 63
3.6- Một số chuẩn nén ảnh
3.6.1- Chuẩn nén JPEC
• Mã hóa JPEC:
+ Bước V: Mã hóa entropy JPEG
- Sau khi lượng tử hóa, các hệ số (1 DC + 63 AC) được mã hóa
entropy.
- Các hệ số DC và AC được xử lý khác nhau. Vì sau khi LTH, có
nhiều thành phần AC=0, thực hiện RLC:
- Bước RLC thay thế các giá trị trong vector 64 phần tử
bằng các cặp: (Chạy dài, Giá trị)
- trong đó Chạy dài: là số số 0 và Giá trị là giá trị khác 0
kế tiếp.
- Chú ý, hầu hết các thành phần 0 thường nằm về phía
góc phải dưới (các tần số không gian lớn- t/s cao).
- Thực hiện quét zig-zag cho một vector 64 phần tử.
3.6- Một số chuẩn nén ảnh
3.6.1- Chuẩn nén JPEC
• Mã hóa JPEC:
+ Bước V: Mã hóa entropy JPEG
- Mã hóa các hệ số DC:
- Mỗi 1 khối có 1 DC.
- Các hệ số DC có thể khác nhau rất nhiều trong toàn bộ
ảnh, nhưng khác nhau ít từ khối này đến khối lân cận.
- Các hệ số DC được mã hóa DPCM.
Bảng mã Huffman
cho thành phần AC
3.6- Một số chuẩn nén ảnh
3.6.1- Chuẩn nén JPEC
• Mã hóa JPEC:
+ Bước V: Mã hóa entropy JPEG
- Mã hóa các hệ số AC: Sơ đồ khối bộ mã hóa
3.6- Một số chuẩn nén ảnh
3.6.1- Chuẩn nén JPEC
• Giải mã JPEC:
Bài tập chương 3
3.5.2- Mã hoá biến đổi (Harr)
Bài 1: Cho đoạn tiếng nói gồm 8 mẫu thoại như sau:
x(n)=[1,-2,-1,0,1,2,-1,0] với n=0,…,7.
Thực hiện phân tích đa phân giải tín hiệu trên, với các sóng
con:
a) Tìm biến đổi Haar 2 mức. Phân tích đóng gói năng
lượng của biến đổi Haar.
b) Khôi phục lại x(n) qua biến đổi Haar ngược. Tính MSE
giữa tín hiệu ban đầu và tín hiệu khôi phục?
c) Nêu ý nghĩa của biến đổi Haar
Bài tập chương 3
0 0 0 0
3.5.2- Mã hoá biến đổi (Harr)
0 256 0 0
Bài 2: Cho ảnh I4x4 (8 bits/pixel) như sau: I
0 0 0 0
0 0 0 0
Tính toán biến đổi sóng con Haar 1 mức ảnh I ở trên, sau đó
thực hiện mã hóa trung bình 2 bits/pixel như sau:
a) Mã hóa băng con LL với 8 bits/pixel và các băng con còn lại
là 0 bits/pixel sử dụng lượng tử hóa đều vô hướng.
b) Mã hóa 4 băng con với 2 bits/pixel sử dụng lượng tử hóa
đều vô hướng.
c) Mã hóa 4 băng con sử dụng DPCM với lượng tử hóa đều vô
hướng 2 bits/pixel.
d) So sánh các ảnh khôi phục của ảnh I tương ứng với các cơ
Bài tập chương 3
3.5.2- Mã hoá biến đổi (Harr)
Bài 3: Cho ảnh X4x4:
a) Thực hiện chuyển đổi Wavelet Haar hai mức. Phân tính đóng gói
năng lượng của phép chuyển đổi Haar.
b) Mã hóa băng LL bằng 8 bit/pixel, các băng con còn lại là 0 bit/pixel,
dùng lượng tử đều kích thước bước lượng tử bằng 1.
c) Khôi phục lại ảnh qua biến đổi haar ngược. Tính MSE giữa tín hiệu
gốc và tín hiệu sau khôi phục.
Bài tập chương 3
3.6.1- Chuẩn nén JPEC
Bài 4: Cho khối ảnh S2x2:
8 2
S
2 8
a) Mã hóa ảnh S trên sử dụng chuẩn nén ảnh JPEG (bỏ qua bước trừ
3 2
Q
128 điểm ảnh). Biết ma trận lượng tử 2
và DC của khối
5
trước
đó là 3.