Báo Cáo Gi A K - Xla

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 43

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

BÁO CÁO MÔN : XỬ LÝ ẢNH

TÍNH NGƯỠNG NHỊ PHÂN ẢNH BẰNG GAUSSIAN OTSU THRESHOLDING

GIẢNG VIÊN : TS.ĐINH TRẦN HIỆP

Sinh viên thực hiện :

Nguyễn Hoàng Hiệp 20021123

Trần Quốc Việt 20021211

Nguyễn Quang Minh 20021162

Lê Minh Hiếu 20021126

Vũ Thế Anh 20021086

Nhóm : 6

Lớp: INT3039E_20
1
Lời cảm ơn
Cuối cùng chúng em xin chân thành cảm ơn thầy vì những kiến thức bổ ích thầy đã
cung cấp. Báo cáo của chúng em có thể sẽ còn rất nhiều thiếu xót do lần đầu được tiếp xúc
với lĩnh vực này rất mong có thể nhận được nhiều lời đóng góp ý kiến của thầy cho bài tập
của chúng em. Và mong rằng đề tài này của chúng em trong tương lai sẽ được phát triển tiếp
để hoàn thiện hơn nữa. Xin chân thành cảm ơn thầy!

MỤC LỤ

2
C
I. Giới Thiệu 3

A. Tổng quan về báo cáo và lý do chọn đề tài..................................................................................3

1 Giới thiệu về mục đích và phạm vi của báo cáo:.........................................................................................3

2. Tóm tắt vấn đề chính mà phương pháp G.Otsu giải quyết:.....................................................................3

3. Lý do lựa chọn đề tài và tầm quan trọng của việc nghiên cứu về phương pháp này:............................4

B. Mục tiêu và ý nghĩa của việc tìm hiểu về phương pháp tính ngưỡng nhị phân G.Otsu.........4

1. Các mục tiêu cụ thể mà báo cáo muốn đạt được:......................................................................................4

2. Ý nghĩa của việc tìm hiểu và áp dụng phương pháp G.Otsu....................................................................5

II.Cơ sở lý thuyết 5

1. Phân phối Histogram của ảnh đa mức xám..............................................................................................5

2. Ngưỡng nhị phân và ý nghĩa.......................................................................................................................9

3. Phương pháp tìm ngưỡng nhị phân Otsu..................................................................................................9

III.Phương pháp thực hiện 16

1. Phần mềm Pycharm và thư viện OpenCV..............................................................................................16

2. Sơ đồ thuật toán.........................................................................................................................................19

3. Kết quả........................................................................................................................................................21

IV. Đánh giá kết quả 24

1. Đánh giá trực quan ( định tính )...............................................................................................................24

2. Đánh giá định lượng...................................................................................................................................31

3. Kết luận........................................................................................................................................................38

V. Tổng kết 40

Tài liệu tham khảo 41

3
I. Giới Thiệu
A. Tổng quan về báo cáo và lý do chọn đề tài

1 Giới thiệu về mục đích và phạm vi của báo cáo:

*) Mục đích của báo cáo

Trong thời đại công nghệ hiện nay, xử lý ảnh và phân tích hình ảnh đóng vai trò cực kỳ quan
trọng trong nhiều lĩnh vực khác nhau, từ y học cho đến an ninh và công nghiệp. Báo cáo này
nhằm mục đích chính là tìm hiểu và phân tích phương pháp tính ngưỡng nhị phân Otsu nói
chung và sẽ tập trung vào Gaussian Otsu’s method hay G.Otsu một hướng tiếp cận khác so
với phương pháp gốc. Chúng ta sẽ đi sâu vào cơ chế hoạt động của G.Otsu Thresholding,
khám phá các ứng dụng của nó và đánh giá chất lượng và hiệu suất của phương pháp này
trong quá trình nhị phân hóa ảnh.

*) Phạm vi của báo cáo

Trong báo cáo này, chúng ta sẽ tập trung vào các mục tiêu sau:

 Tìm hiểu cơ chế hoạt động của phương pháp tính ngưỡng nhị phân G.Otsu.
 Khám phá các ứng dụng của phương pháp G.Otsu trong lĩnh vực xử lý ảnh và phân
tích hình ảnh.
 Đánh giá chất lượng và hiệu suất của phương pháp G.Otsu trong quá trình nhị phân
hóa ảnh.
 Nắm vững kiến thức và hiểu biết về phương pháp G.Otsu để có thể áp dụng nó vào
các bài toán xử lý ảnh thực tế.

Trong phạm vi của báo cáo, chúng ta sẽ cung cấp một cái nhìn tổng quan về phương pháp
Otsu và tập trung vào G. Otsu cùng các khía cạnh quan trọng nhất của nó. Báo cáo sẽ không
chỉ giới hạn ở mức độ lý thuyết, mà cũng sẽ khám phá các ứng dụng thực tế của phương
pháp và đánh giá hiệu quả của nó trong việc nhị phân hóa ảnh.

2. Tóm tắt vấn đề chính mà phương pháp G.Otsu giải quyết:

Trong quá trình xử lý ảnh, việc phân loại các pixel thành hai nhóm khác nhau, chẳng hạn
như nền và vật thể, hoặc nền và đối tượng cần quan sát, là một bước quan trọng. Để thực
hiện việc này, ngưỡng phân ngưỡng phải được xác định, đóng vai trò quan trọng trong quá

4
trình phân loại. Việc lựa chọn ngưỡng phân ngưỡng một cách chính xác và hiệu quả là một
thách thức trong xử lý ảnh.

Phương pháp Otsu nói chung và G.Otsu nói riêng giải quyết vấn đề này bằng cách tự động
xác định ngưỡng tối ưu dựa trên phân phối của các pixel trong ảnh. Ý tưởng cơ bản của
phương pháp G.Otsu là tìm ngưỡng sao cho phương pháp này tối đa hóa độ phân tách giữa
hai nhóm pixel, đồng thời tối thiểu hóa độ biến thiên trong mỗi nhóm. Khi ngưỡng này được
xác định, quá trình nhị phân hóa ảnh có thể được thực hiện một cách tự động và chính xác.

Phương pháp Otsu là một phương pháp tính toán ngưỡng nhị phân không cần thông tin tiền
đề về ảnh và không đòi hỏi nhiều tài nguyên tính toán. Nó đã được chứng minh là hiệu quả
trong việc xử lý ảnh và phân đoạn hình ảnh. Bằng cách sử dụng phương pháp G.Otsu, độ
chính xác và hiệu suất của các thuật toán xử lý ảnh có thể được cải thiện, đồng thời giảm
thiểu sự can thiệp của con người trong quá trình xác định ngưỡng phân ngưỡng.

3. Lý do lựa chọn đề tài và tầm quan trọng của việc nghiên cứu về phương pháp này:

Lựa chọn nghiên cứu về phương pháp G.Otsu được đưa ra dựa trên sự phổ biến và tính ứng
dụng cao của nó trong lĩnh vực xử lý ảnh và phân tích hình ảnh. Otsu Thresholding và
G.Otsu Thresholding đã được chứng minh là một công cụ mạnh mẽ để tự động xác định
ngưỡng phân ngưỡng trong quá trình phân loại ảnh.

Tầm quan trọng của việc nghiên cứu phương pháp G.Otsu là rất đáng chú ý. Hiểu sâu về cơ
chế hoạt động và các ứng dụng của G.Otsu Thresholding có thể đóng góp quan trọng vào
việc cải thiện hiệu suất của các hệ thống nhận dạng và phân loại ảnh.

Nghiên cứu về phương pháp Otsu là quan trọng và có ảnh hưởng rộng rãi trong lĩnh vực xử
lý ảnh và phân tích hình ảnh. Hiểu biết về cơ chế hoạt động và ứng dụng của G.Otsu
Thresholding có thể mang lại lợi ích đáng kể trong việc cải thiện hiệu suất và chất lượng của
các hệ thống nhận dạng và phân loại ảnh.

B. Mục tiêu và ý nghĩa của việc tìm hiểu về phương pháp tính ngưỡng nhị phân
G.Otsu

1. Các mục tiêu cụ thể mà báo cáo muốn đạt được:

a) Hiểu rõ cơ chế hoạt động của phương pháp Otsu và G.Otsu:

5
Ta sẽ nghiên cứu về cơ chế hoạt động của phương pháp Otsu và G.Otsu. Điều này bao gồm
việc tìm hiểu về phân phối pixel trong ảnh và cách các phương pháp Otsu tính toán ngưỡng
tối ưu. Bằng cách nắm vững cơ chế hoạt động này, chúng ta có khả năng áp dụng phương
pháp Otsu một cách chính xác và hiệu quả vào các bài toán xử lý ảnh.

b) Nắm vững các ứng dụng thực tiễn của G.Otsu Thresholding:

Mục tiêu này yêu cầu phân tích các trường hợp sử dụng phổ biến của phương pháp G.Otsu
nói riêng trong các lĩnh vực thực tế. Điều này bao gồm việc tìm hiểu và đánh giá các ứng
dụng của G.Otsu Thresholding các loại ảnh thuộc nhiều lĩnh vực khác nhau. Việc nắm vững
các ứng dụng này giúp ta thấy rõ tầm quan trọng của các phương pháp Otsu và khả năng áp
dụng của nó trong các bài toán thực tế.

c) Đánh giá hiệu suất và ưu nhược điểm của phương pháp này:

Mục tiêu này là đưa ra một đánh giá tổng quan về hiệu suất của phương pháp G.Otsu trong
việc xác định ngưỡng phân ngưỡng. Chúng ta sẽ xác định các điểm mạnh và hạn chế của
G.Otsu Thresholding, nhằm đề xuất các cải tiến và tối ưu hóa để nâng cao hiệu suất và chất
lượng của quá trình phân loại pixel. Đánh giá này cũng sẽ giúp chúng ta hiểu rõ hơn về
phạm vi ứng dụng của G.Otsu Thresholding và khi nào nên áp dụng phương pháp này.

2. Ý nghĩa của việc tìm hiểu và áp dụng phương pháp G.Otsu

Phương pháp G.Otsu không chỉ giúp tăng cường hiệu suất của các thuật toán xử lý ảnh mà
còn mở ra những tiềm năng ứng dụng mới trong nhiều lĩnh vực, từ y học đến công nghiệp
và giải trí.

Hiểu biết sâu về G.Otsu Thresholding có thể giúp tạo ra các hệ thống tự động thông minh và
linh hoạt hơn, giảm thiểu sự can thiệp của con người trong quy trình xử lý và phân tích dữ
liệu.

Để thực hiện mục tiêu này, chúng ta sẽ cùng phân tích chi tiết cách G.Otsu Thresholding
hoạt động, ứng dụng thực tế và các nghiên cứu liên quan để đưa ra những kết luận và đề
xuất cụ thể trong các phần tiếp theo của báo cáo.

II.Cơ sở lý thuyết
1. Phân phối Histogram của ảnh đa mức xám

6
a) Ảnh đa mức xám

Ảnh đa mức xám (multilevel grayscale image) là một dạng hình ảnh trong xử lý ảnh mà mỗi
pixel của nó có thể nhận giá trị xám từ một tập hợp các mức xám khác nhau. Trong ảnh đa
mức xám, không chỉ có hai mức xám đen (0) và trắng (255) như trong ảnh nhị phân, mà có
thể có nhiều mức xám trung gian.

Một ảnh đa mức xám có thể được biểu diễn bằng ma trận các giá trị xám có kích thước
tương ứng với chiều dài và chiều rộng của ảnh. Mỗi phần tử trong ma trận đại diện cho một
pixel và chứa giá trị xám của pixel tương ứng. Các giá trị xám có thể được biểu diễn bằng
các số nguyên từ 0 đến 255, trong đó 0 thể hiện mức xám tối nhất (đen) và 255 thể hiện mức
xám sáng nhất (trắng).

Ảnh đa mức xám thường được sử dụng để biểu diễn các hình ảnh có độ tương phản phức
tạp hơn so với ảnh nhị phân, nơi chỉ có hai mức xám. Các ảnh đa mức xám có thể chứa
thông tin chi tiết về cường độ ánh sáng và sự phân bố mức xám trong hình ảnh, cho phép
phân tích và xử lý ảnh một cách chi tiết hơn.

Trong xử lý ảnh, ảnh đa mức xám thường được sử dụng trong các bài toán như phân
ngưỡng, lọc ảnh, phân đoạn và nhận dạng. Bằng cách làm việc với các mức xám trung gian,
ta có thể trích xuất thông tin quan trọng từ ảnh và thực hiện các phép toán phức tạp để xử lý
và phân tích hình ảnh một cách chính xác và linh hoạt hơn.

b) Phân phối histogram

Phân phối histogram là một biểu đồ thống kê mô tả phân bố tần suất của các mức xám trong
một hình ảnh. Nó biểu diễn số lượng pixel trong ảnh có cùng giá trị xám trên trục hoành và
số lượng pixel tương ứng trên trục tung.

7
Để tạo ra phân phối histogram, ta tổng hợp thông tin về các mức xám trong ảnh và đếm số
lượng pixel tương ứng cho mỗi mức xám. Mức xám thường được biểu diễn bằng các giá trị
từ 0 đến 255 (trên 8 bit), tương ứng với 256 mức xám khác nhau.

Phân phối histogram cung cấp thông tin quan trọng về phân bố độ sáng và mức xám trong
hình ảnh. Nó cho phép chúng ta hiểu rõ hơn về sự phân tán và tập trung của các mức xám
trong ảnh, từ đó làm việc với ảnh một cách hiệu quả hơn.

Thông qua phân phối histogram, ta có thể nhận biết các đặc điểm quan trọng của hình ảnh,
bao gồm độ tương phản, sự phân bố các vùng sáng và tối, và các mức xám đặc trưng. Nó
cung cấp thông tin cơ bản để lựa chọn các phương pháp xử lý ảnh phù hợp, bao gồm phân
ngưỡng, làm mờ, cân bằng độ sáng, phân đoạn và nhiều phép toán khác.

Phân phối histogram là một công cụ quan trọng trong xử lý ảnh và phân tích hình ảnh. Nó
giúp chúng ta hiểu và thao tác với thông tin mức xám trong ảnh, tìm ra các đặc trưng quan
trọng và thực hiện các phép toán xử lý ảnh phù hợp để cải thiện chất lượng và hiệu suất của
hình ảnh.

8
Ví dụ:

 Ảnh đa mức xám : Hình 1a) và Hình 2a)

a) b)
Hình 1

b)
a)
Hình 2

 Histogram tương ứng : Hình 1b) và Hình 2b)

2. Ngưỡng nhị phân và ý nghĩa

9
Trong xử lý ảnh, ngưỡng (threshold) là một giá trị hoặc một tập giá trị được sử dụng để
phân loại các pixel trong một hình ảnh thành hai nhóm khác nhau. Quá trình này được gọi là
phân ngưỡng hóa (thresholding). Ngưỡng được áp dụng để quyết định xem một pixel nên
thuộc nhóm đen (mức xám thấp) hay nhóm trắng (mức xám cao), tùy thuộc vào giá trị của
pixel so với ngưỡng.

Ngưỡng nhị phân (binary threshold) là một dạng phân ngưỡng đơn giản nhất, chỉ chia hình
ảnh thành hai nhóm: một nhóm chứa các pixel có giá trị xám lớn hơn hoặc bằng ngưỡng và
một nhóm chứa các pixel có giá trị xám nhỏ hơn ngưỡng. Kết quả là một hình ảnh nhị phân,
trong đó các pixel thuộc nhóm đen được gán giá trị xám thấp (thường là 0 hoặc 1), còn các
pixel thuộc nhóm trắng được gán giá trị xám cao (thường là 255).

Ý nghĩa của việc sử dụng ngưỡng và ngưỡng nhị phân trong xử lý ảnh là làm cho thông tin
trong ảnh trở nên dễ hiểu và dễ xử lý hơn. Bằng cách này, ta có thể tập trung vào các vùng
cụ thể trong ảnh, như đối tượng hoặc bối cảnh, để thực hiện các phân tích và xử lý tiếp theo.
Ngưỡng nhị phân được sử dụng rộng rãi trong xử lý ảnh để đơn giản hóa và tách biệt các
vùng của hình ảnh dựa trên mức xám. Nó có thể được áp dụng để phát hiện cạnh, phân đoạn
vùng quan tâm, nhận dạng đối tượng, loại bỏ nhiễu và thực hiện nhiều tác vụ khác.

Việc chọn ngưỡng phù hợp là một phần quan trọng trong phân ngưỡng nhị phân. Có nhiều
phương pháp để xác định ngưỡng tối ưu, bao gồm phương pháp cố định, phương pháp dựa
trên histogram và phương pháp tự động như phương pháp Otsu Thresholding. Sự lựa chọn
đúng ngưỡng có thể tối ưu hóa kết quả phân ngưỡng và cải thiện hiệu suất xử lý ảnh.

3. Phương pháp tìm ngưỡng nhị phân Otsu


a) Giới thiệu:

Trong xử lý hình ảnh và thị giác máy tính , phương pháp của Otsu , được đặt theo tên
của Nobuyuki Otsu , được sử dụng để thực hiện việc phân ngưỡng hình ảnh tự động. Ở dạng
đơn giản nhất, thuật toán trả về một ngưỡng cường độ duy nhất phân tách các pixel thành
hai lớp, nền trước và nền sau. Ngưỡng này được xác định bằng cách giảm thiểu phương sai
cường độ giữa các lớp, hoặc tương đương, bằng cách tối đa hóa phương sai cường độ giữa
các lớp. Phương pháp của Otsu là một phương pháp tương tự rời rạc một chiều của Phân
tích phân biệt của Fisher , có liên quan đến phương pháp tối ưu hóa Jenks và tương đương
với phương tiện k tối ưu toàn cầu được thực hiện trên biểu đồ cường độ. Việc mở rộng

10
ngưỡng đa cấp đã được mô tả trong bài báo gốc, và việc triển khai hiệu quả về mặt tính toán
đã được đề xuất.

Phân ngưỡng hình ảnh là quá trình chia một hình ảnh thành các vùng hoặc đường viền
tương ứng với các đối tượng trong hình. Để thực hiện phân đoạn, chúng ta thường tìm kiếm
các thuộc tính chung hoặc sự khác biệt giữa các vùng để phân biệt chúng.

Một thuộc tính đơn giản mà các pixel trong cùng một vùng có thể chia sẻ là độ sáng. Vì vậy,
một phương pháp tự nhiên để phân đoạn các vùng là sử dụng ngưỡng, tức là chia các vùng
thành các phần sáng và tối dựa trên giá trị mức xám của pixel.

Kỹ thuật ngưỡng hóa chuyển đổi hình ảnh xám thành hình ảnh nhị phân bằng cách chuyển
các pixel có giá trị dưới một ngưỡng cố định thành 0 (màu đen) và các pixel có giá trị lớn
hơn ngưỡng đó thành 1 (màu trắng). Quyết định xử lý các pixel tại ngưỡng không quan
trọng, miễn là quyết định này được thực hiện một cách nhất quán.

Quá trình ngưỡng hóa có thể được thực hiện bằng cách sử dụng ngưỡng cố định, trong đó
ngưỡng được xác định trước và áp dụng cho toàn bộ hình ảnh. Một phương pháp khác là sử
dụng ngưỡng tự động, trong đó ngưỡng được xác định dựa trên các thuật toán và đặc trưng
của hình ảnh nhằm tối ưu hóa quá trình phân đoạn.

Việc chọn ngưỡng phù hợp là một phần quan trọng trong phân đoạn hình ảnh. Nếu ngưỡng
quá cao, các vùng tối sẽ bị bỏ qua và có thể xảy ra hiện tượng mất mát thông tin. Ngược lại,
nếu ngưỡng quá thấp, các vùng sáng có thể bị chia tách thành nhiều phần nhỏ.

b) Cách thức hoạt động của phương pháp otsu:

Otsu method thực hiện tính toán 3 tham số chính ω, μ, σ đại diện cho Trọng số, giá trị trung
bình, phương sai từ các bước tính toán sẽ thu được ngưỡng tối ưu.

Otsu method có 2 hướng tiếp cận:

+) Phương sai trong lớp (Within-Class Variance)

Hướng tiếp cận này tập trung vào việc giảm thiểu sự biến động bên trong từng lớp hoặc
vùng trong hình ảnh.

Ý tưởng chính là tìm một ngưỡng sao cho phương sai của pixel trong từng lớp là nhỏ nhất
có thể. Khi phương sai trong lớp là nhỏ nhất, tức là các pixel trong cùng một lớp có độ đồng
nhất cao, giúp phân đoạn chính xác hơn.

11
Phương pháp ngưỡng hóa của Otsu tương ứng với tiêu chí phân loại tuyến tính giả định rằng
hình ảnh chỉ bao gồm đối tượng (foreground) và nền (background), và sự không đồng nhất
và đa dạng của nền được bỏ qua. Otsu đặt ngưỡng sao cho cố gắng giảm thiểu việc chồng
chéo của phân phối các lớp. Dựa trên định nghĩa này, phương pháp của Otsu chia hình ảnh
thành hai vùng sáng và tối T0 và T1, trong đó vùng T0 là một tập hợp các cấp độ độ sáng từ
0 đến t hoặc theo ký hiệu tập hợp T0 = {0; 1; :::; t} và vùng T1 = {t; t + 1; :::; l − 1; l} trong
đó t là giá trị ngưỡng, l là mức xám tối đa của hình ảnh (ví dụ: 255). T0 và T1 có thể được
gán cho đối tượng và nền hoặc ngược lại (đối tượng không nhất thiết phải luôn chiếm vùng
sáng). Phương pháp ngưỡng hóa của Otsu quét tất cả các giá trị ngưỡng có thể và tính toán
giá trị tối thiểu cho các cấp độ pixel ở mỗi bên của ngưỡng. Mục tiêu là tìm giá trị ngưỡng
có entropy tối thiểu cho tổng của foreground và background. Phương pháp của Otsu xác
định giá trị ngưỡng dựa trên thông tin thống kê của hình ảnh, trong đó cho một giá trị
ngưỡng được chọn t, phương sai của các nhóm T0 và T1 có thể được tính toán. Giá trị
ngưỡng tối ưu được tính bằng cách tối thiểu hóa tổng của phương sai nhóm có trọng số,
trong đó các trọng số là xác suất của các nhóm tương ứng.

Cho P(i) là xác xuất histogram của giá trị xám quan sát được i=0,..,l

number { ( r , c )|image ( r , c )=i }


P ( i )=
( R ,C )

Trong đó, r, c lần lượt là là chỉ số cho hàng và cột của điểm ảnh, tương ứng, R và C lần lượt
là số hàng và số cột của hình ảnh.

ω b (t), μb (t ), σ b (t) lần lượt là trọng số, trung bình, và phương sai của lớp T0 với giá trị cường
độ từ 0 đến t

ω f (t), μf (t), σ f (t ) lần lượt là trọng số, trung bình, và phương sai của lớp T1 với giá trị cường

độ từ t+1 đến l
2
σ ω là tổng có trọng số của các phương sai nhóm.

Giá trị ngưỡng tốt nhất t* là giá trị có phương sai nhỏ nhất trong lớp. Phương sai bên trong
lớp được định nghĩa như sau:
2 2 2
σ ω=ω b ( t )∗σ b ( t ) + ωf ( t )∗σ f (t)

12
Trong đó
t −1
ω b (t )=∑ P (i)
i=0

l
ω f ( t )=∑ P(i)
i=t

t −1

∑ i∗P(i)
μb ( t )= i =0
ωb ( t )
l

∑ i∗P(i)
μf ( t )= i=t
ωf ( t )
t−1

∑ (i−μb ( t ) )2∗P(i)
σ b ( t )= i=0
ωb ( t )
l

∑ (i−μ f ( t ) )2∗P(i)
σ f ( t )= i=t
ωf ( t )

+) Phương sai giữa các lớp (Between-Class Variance)

Hướng tiếp cận này còn được gọi là Gaussian Otsu thresholding, nó tập trung vào việc tối
ưu hóa sự phân biệt giữa các lớp hoặc vùng trong hình ảnh.

Ý tưởng chính là tìm một ngưỡng sao cho phương sai giữa các lớp là lớn nhất có thể. Khi
phương sai giữa các lớp là lớn nhất, tức là sự khác biệt giữa các lớp là tối đa, giúp phân
đoạn hiệu quả hơn.

Phương pháp Gaussian Otsu là một phần mở rộng của kỹ thuật ngưỡng Otsu dựa trên
phương sai giữa các lớp từ vùng nền trước và vùng nền. Cách tiếp cận này nhanh hơn nhiều
so với phương pháp Otsu gốc. Cách tiếp cận ngưỡng này tính toán mức tối đa giữa phương
sai của lớp trong đó sử dụng mức tối thiểu trong phương sai của lớp. Phương sai giữa các
lớp được định nghĩa như sau:
2 2 2
σ B ( t ) =σ −σ ω (t)
2 2
¿ ω b ( t )∗( μ¿¿ b ( t )−μ) +ω f ( t )∗( μ¿ ¿ f ( t )−μ) ¿ ¿
2
¿ ω b ( t )∗ωf (t )∗(μ ¿ ¿ b ( t )−μ f ( t ) ) ¿

13
Trong đó σ 2 và μ là tổng phương sai và tổng giá trị trung bình của hình ảnh tương ứng.

*) Ví dụ: Ta sẽ xét một ví dụ đơn giản sau với chỉ 6 mức xám được xử dụng

Các tính toán để tìm ra sự khác biệt giữa nền trước và nền sau (thước đo mức độ lan truyền)
cho một ngưỡng duy nhất hiện đã được hiển thị. Trong trường hợp này giá trị ngưỡng là 3.

Với nền sau ta có các thông số được tính toán như sau:

8+7+2
ω b= =0.4722
36

14
( 0∗8 )+ (1∗7 ) + ( 2∗2 )
μb = =0.6471
17

2 ( ( 0−0.6471 )2∗8 ) + ( ( 1−0.6471 )2∗7 ) +(( 2−0.6471 )2∗2)


σ =
b =0.4637
17

Với nền đối tượng (nền trước) ta có các thông số được tính toán như sau:

6+9+ 4
ω b= =0.5278
36

( 3∗6 ) + ( 4∗9 ) + ( 5∗4 )


μb = =3.8947
19

2 ( ( 3−3.8947 )2∗6 ) + ( ( 4−3.8947 )2∗9 ) +(( 5−3.8947 )2∗4 )


σ =
b =0.5152
19

*) Kết quả:

Với cách tiếp cận phương sai trong lớp:


2 2 2
σ ω=ω b ( t )∗σ b ( t ) + ωf ( t )∗σ f (t) =0.4909

Với cách tiếp cận phương sai giữa các lớp


2 2
σ B ( t ) =ωb ( t )∗ω f ( t )∗(μ ¿ ¿ b ( t )−μf ( t ) ) =2.6287 ¿

Phép tính tương tự này cần được thực hiện cho tất cả các giá trị ngưỡng có thể có từ 0 đến 5.
Bảng bên dưới hiển thị kết quả cho các phép tính này. Cột được tô sáng hiển thị các giá trị
cho ngưỡng được tính ở trên.

15
Ngưỡn
t=0 t=1 t=2 t=3 t=4 t=5
g

ωb 0 0.222 0.4167 0.4722 0.6389 0.8889

μb 0 0 0.4667 0.6471 1.2609 2.0313

σ2b 0 0 0.2489 0.4637 1.4102 2.5303

ωf 1 0.7778 0.5833 0.5278 0.3611 0.1111

μf 2.3611 3.0357 3.7143 3.8947 4.3077 5.000

σ2f 3.1196 1.9639 0.7755 0.5152 0.2130 0

σ2W 3.1196 1.5268 0.5561 0.4909 0.9779 2.2491

σ2B 0 1.5928 2.5635 2.6287 2.1417 0.8705

Bảng 1: Ví dụ về cách thức hoạt động của Otsu thresholding

16
Trong báo cáo này chúng ta sẽ thực hiện ứng dụng trên hướng tiếp cận thứ 2.

III.Phương pháp thực hiện


1. Phần mềm Pycharm và thư viện OpenCV

Trong báo cáo này ta sẽ sử dụng ngôn ngữ python thông qua phần mềm pycharm và thư
viện openCV để thực hiện lập trình cho ứng dụng Gaussian Otsu’s method trong tính
ngưỡng nhị phân và đưa ảnh về dạng nhị phân.

*) Phần mềm Pycharm

Hình 3. Phần mềm Pycharm

Python là một ngôn ngữ lập trình thông dịch và hướng đối tượng được phát triển vào cuối
những năm 1980. Nó có cú pháp đơn giản, dễ đọc và dễ hiểu, làm cho việc phát triển phần
mềm trở nên thuận tiện. Python có một cộng đồng lớn và phong phú, cung cấp rất nhiều thư
viện và công cụ hỗ trợ cho nhiều lĩnh vực, bao gồm cả xử lý ảnh.

PyCharm là một môi trường phát triển tích hợp (IDE) cho Python, do JetBrains phát triển.
Nó cung cấp một loạt các tính năng và công cụ giúp người phát triển dễ dàng tạo, sửa đổi và
quản lý mã nguồn Python. PyCharm có giao diện người dùng thân thiện, hỗ trợ gỡ lỗi, kiểm
tra cú pháp, tự động hoàn thành mã, và tích hợp với nhiều công cụ và khung làm việc khác.

17
Trong xử lý ảnh, Python cung cấp nhiều thư viện mạnh mẽ như OpenCV, PIL/Pillow, scikit-
image và NumPy, cho phép xử lý và phân tích ảnh một cách hiệu quả. Python kết hợp với
các thư viện này giúp người phát triển có thể thực hiện các tác vụ như đọc và ghi ảnh, áp
dụng các bộ lọc, biến đổi hình ảnh, phân đoạn ảnh, nhận diện đối tượng, và nhiều tác vụ xử
lý ảnh khác.

PyCharm là một công cụ hữu ích trong việc phát triển ứng dụng xử lý ảnh bằng Python. Nó
cung cấp các tính năng như gỡ lỗi, kiểm tra cú pháp, kiểm tra đơn vị, quản lý phiên bản và
tích hợp dễ dàng với các công cụ và thư viện khác. PyCharm giúp người phát triển tăng
năng suất và sắp xếp dự án một cách hiệu quả, đồng thời cung cấp các tính năng hỗ trợ như
gợi ý mã, tự động hoàn thành và phân tích mã để làm việc dễ dàng và thuận tiện hơn trong
quá trình xử lý ảnh.

*) Thư viện OpenCV

Hình 4. Thư viện OpenCV

Thư viện OpenCV là một thư viện mã nguồn mở phổ biến trong lĩnh vực thị giác máy tính
và xử lý hình ảnh. OpenCV viết tắt của "Open Source Computer Vision Library" (Thư viện
Thị giác Máy tính Mã nguồn mở), được phát triển bởi Intel và hiện được duy trì bởi một
nhóm lập trình viên trên toàn thế giới.

18
OpenCV cung cấp một loạt các công cụ và chức năng để thực hiện nhiều nhiệm vụ trong xử
lý ảnh và thị giác máy tính, bao gồm đọc và ghi hình ảnh, xử lý và biến đổi hình ảnh, nhận
dạng đối tượng, phát hiện biên, theo dõi chuyển động, và nhiều hơn nữa. Được viết chủ yếu
bằng C++ nhưng cũng có các liên kết cho các ngôn ngữ khác như Python và Java.

OpenCV là một công cụ quan trọng cho các nhà nghiên cứu và nhà phát triển trong lĩnh vực
thị giác máy tính, robotics, xử lý hình ảnh y tế, nhận dạng biển số, và nhiều lĩnh vực ứng
dụng khác.

Cách khai báo thư viện OpenCV trong python:

 import cv2

Một số hàm thông dụng của OpenCV trong python:

 cv2.imread(): Đọc ảnh từ file.


 cv2.imshow(): Hiển thị ảnh trên cửa sổ.
 cv2.cvtColor(): Chuyển đổi ảnh sang một không gian màu khác.
 cv2.GaussianBlur(): Áp dụng bộ lọc Gaussian để làm mờ ảnh.
 cv2.Canny(): Phát hiện biên cạnh trong ảnh bằng phương pháp Canny.

19
2. Sơ đồ thuật toán

*) Sơ đồ thuật toán

20
Hình 5. Sơ đồ thuật toán tìm ngưỡng tối ưu của G.Otsu’s method

*) Cụ thể hóa các bước tính phương sai trong Pseudo code

def otsu_threshold(image):
# Tính toán histogram của hình ảnh
histogram, _ = np.histogram(image.ravel(),256,[0,256])

# Tính tổng tích lũy của biểu đồ


cumulative_histogram = np.cumsum(histogram)

# Tính tổng số pixel


total_pixels = cumulative_histogram[-1]

# Khởi tạo ngưỡng tốt nhất và phương sai tốt nhất giữa các lớp
best_threshold = 0
best_between_class_variance = 0

# Lặp qua tất cả các ngưỡng có thể


for threshold in range(1, 256):
# Tính số pixel ở background và foreground
background_pixels = cumulative_histogram[threshold-1]
foreground_pixels = total_pixels - background_pixels

# Kiểm tra xem số pixel ở background hoặc foreground có bằng 0 không


if background_pixels == 0 or foreground_pixels == 0:
continue

# Tính cường độ trung bình của background và foreground


background_mean = np.sum([i*histogram[i] for i in range(threshold)]) /
background_pixels
foreground_mean = np.sum([i*histogram[i] for i in range(threshold, 256)]) /
foreground_pixels

21
# Tính toán phương sai giữa các lớp
between_class_variance = (background_pixels * foreground_pixels *
(background_mean - foreground_mean)**2) / (total_pixels**2)

# Cập nhật ngưỡng tốt nhất và phương sai tốt nhất giữa các lớp
if between_class_variance > best_between_class_variance:
best_threshold = threshold
best_between_class_variance = between_class_variance

# Trả về ngưỡng tốt nhất


return best_threshold

3. Kết quả

Một số hình ảnh được sử dụng để kiểm tra hiệu suất của phương pháp. Trong các ảnh được
chọn để kiểm là các ảnh kỹ thuật số với đa dạng kích thước và có độ đa dạng chi tiết khác
nhau để có thể quan sát và kiểm tra phương pháp G.otsu một cách toàn diện nhất.

Dưới đây là bảng kết của một số ảnh điển hình trong số ảnh đã chọn. Bảng gồm ảnh đa mức
xám, ảnh nhị phân, histogram và ngưỡng nhị phân đã tính toán được:

Bảng 2: Kết quả thực nghiệm

Ảnh đa mức xám Histogram Ảnh nhị phân

Threshold = 106

22
Threshold =82

Threshold = 99

Threshold =162

23
Threshold = 120

Threshold =146

Threshold = 97

24
IV. Đánh giá kết quả
1. Đánh giá trực quan ( định tính )

Trong lĩnh vực xử lý ảnh, ảnh nhị phân thường được sử dụng để biểu diễn các khu vực quan
trọng hoặc phân biệt vùng vật thể và nền. Bằng cách phân loại ảnh thành hai lớp dựa trên độ
sáng, Otsu thresholding có thể giúp làm sáng rõ các vùng quan trọng.

Trước hết nhị phân hóa ảnh là bước đầu cho nhiều công đoạn xử lý phía sau cho nên nếu
không có được 1 bức ảnh nhị phân tốt thì các công đoạn phía sau rất có thể cũng sẽ thu được
những kết quả sai lệch. Vậy thế nào là bức ảnh nhị phân tốt? Trong bài báo cáo này sẽ sử
dụng hai tiêu chí chính để đánh giá về mặt trực quan 1 bức ảnh nhị phân:

Tách biệt rõ ràng giữa các đối tượng và nền: Trong ảnh nhị phân, việc tách biệt giữa các đối
tượng và nền cần phải được thực hiện một cách rõ ràng. Điều này đảm bảo rằng các đối
tượng được phân biệt rõ ràng và dễ dàng nhận dạng.

Duy trì thông tin quan trọng: Mặc dù ảnh nhị phân chỉ có hai giá trị (đen và trắng), nhưng
nó vẫn cần duy trì các thông tin quan trọng về hình dáng và cấu trúc của các đối tượng. Điều
này đảm bảo rằng các đối tượng vẫn có thể được nhận dạng một cách chính xác sau khi áp
dụng phương pháp nhị phân hóa.

Sau đây ta sẽ sử dụng vài nhóm ảnh để đánh giá trực quan kết quả ảnh nhị phân.

+) Nhóm 1: những ảnh có nền đơn giản

Nhữn ảnh có nền đơn giản là những ảnh có nền thỏa mãn các điều kiện sau:

 Màu sắc đồng nhất: Nền của ảnh thường có màu sắc đồng nhất, không có nhiều biến
động màu sắc hoặc chi tiết phức tạp. Điều này làm cho việc phân loại đối tượng và nền
trở nên dễ dàng hơn.
 Không có nhiễu nền đáng kể: Các ảnh có nền đơn giản thường không chứa nhiều
nhiễu nền đáng kể, như các chi tiết nhỏ không mong muốn hoặc đám mây điểm ảnh,
giúp tăng khả năng nhận dạng và phân loại đối tượng.
 Không có đối tượng phức tạp chồng lấn lên nền: Trong các ảnh có nền đơn giản, đối
tượng thường được đặt trên một nền rõ ràng và không bị chồng lấn bởi các đối tượng
khác hoặc các chi tiết phức tạp khác trên nền.

25
 Nền không có cấu trúc phức tạp: Các ảnh có nền đơn giản thường có nền không có
cấu trúc phức tạp, ví dụ như nền trơn hoặc nền có cấu trúc đơn giản như biển trời, sàn
nhà phẳng, hoặc một màu sắc đồng nhất.
 Tập trung vào đối tượng chính: Trong các ảnh có nền đơn giản, sự chú ý thường được
tập trung vào đối tượng chính, vì nền không làm mất đi sự chú ý hoặc gây nhiễu cho đối
tượng.
 Hơn hết, histogram của loại ảnh này thường chỉ có 1 đến 2 đỉnh nhọn cao hơn hẳn so
với phần còn lại biểu thị cho sự tập trung của sự tập trung lớn của các giá trị pixel vào
một hay một vùng nhỏ cường nhỏ trên histogram của dải cường độ tạo ra sự tách biệt
đối tượng với nền.

Sau đây là một vài ảnh có nền đơn giản được nhóm tổng hợp:

Bảng 3: Kết quả thực nghiệm với nhóm ảnh 1

STT ảnh đa mức xám histogram ảnh nhị phân


1

Threshold = 127

Threshold = 91

26
3

Threshold = 124

Threshold = 71

Threshold = 150

Threshold = 140

27
*) Nhận xét:

 Đối tượng và nền :về cơ bản ta có thể dễ thấy rằng các ảnh nhị phân đều đã tách được đối
tượng hay nội chính của bức ảnh khỏi nền
 Đối tượng: ảnh nhị phân giữ được các yếu tố quan trọng để ta có thể nhận diện được vật
thể. Ví dụ trong trường hợp ảnh 2, 4, 5, 6 đối tượng là người khhi chuyển sang ảnh nhị phân
ta vẫn có thể nhận diện được khuôn mặt và nhận diện được mắt, mũi, lông mày và miệng
đặc biệt ở ảnh nhị phân số 2 còn giữ được nếp nhắn trên khuôn mặt người già; trong trường
hợp đối tượng là vật cụ thể là một kiến trúc đồ sộ như ảnh 1 ta vẫn có thể nhận diện được cơ
bản về hình dáng kiến trúc đồng thời nhờ vào những bóng đen ở dưới ta cũng có thể phân
biệt 2 nền trên là nền trời và ở dưới là nước tuy không quá cụ thể.
 Tuy nhiên ta vẫn có thể thấy những hạn chế đặc biệt ở ảnh 6 khi da mặt người phụ nữ và
nền phía sau có độ xám gần tương đương thì trong ảnh nhị phân ta đã bị mất đi đường viền
2 bên gò má người phụ nữ và rất có thể nếu không mặc chiếc áo hoa ta có thể nhận định đây
là đàn ông. Đây cũng chính là hạn chế của phương pháp ta đang sử dụng.

+) Nhóm 2: những ảnh có nhiều chi tiết hoặc nền phức tạp

 Là những ảnh mà đối tượng hoặc nền có nhiều chi tiết mà độ có


 Histogram của loại ảnh này thường có nhiều đỉnh tức là có nhiều giá trị pixel có tần suất
xuất hiện cao, tạo thành các "chế độ" (modals) riêng biệt trong phân phối cường độ của ảnh.
Khi một histogram có nhiều đỉnh, điều này thường chỉ ra rằng ảnh chứa các đối tượng hoặc
các vùng có cường độ sáng khác nhau. Điều này biểu hiện cho việc ở một hay một vùng nhỏ
cường độ sáng không tập trung đột biến số lượng điểm mà nó các điểm ảnh sẽ được phân bố
ra các mức cường độ sáng khác nhau

28
Bảng 4: Kết Quả thực nghiệm nhóm ảnh 2

ST Ảnh đa mức xám Histogram Ảnh nhị phân


T
1

Threshold = 105

Threshold = 106

Threshold = 138

29
Threshold = 127

Threshold = 149

*Nhận xét:

 Đối tượng và nền : trong 1 bức ảnh có quá nhiều chi tiết ta đã khó có thể phân biệt rõ đâu
là nền và đâu là đối tượng ảnh tập trung vào và sang đến ảnh nhị phân ta càng khó phân biệt
khi giữa các chi tiết với độ sáng gần nhau đã không còn ranh giới giữa chúng đã không còn.
Ví dụ hình trong hình 4 tóc và tay nhân vật trung tâm đã bị hòa vào với nền phía sau. Tuy
nhiên với hình ảnh mà chỉ có 1 đối tượng và nền tuy phức tạp ta vẫn tách biệt hoàn toàn
giống như hình 3 ta vẫn có thể phân định được vùng chưa đối tượng và vùng chưa nền.
 Bản thân đối tượng: khi đối tượng đã có quá nhiều chi tiết thì việc phân biệt các chi tiết
nhận diện đối tượng đã trở nên khó khăn. Ví dụ hình 1 hai nhân vật mặc áo trắng đứng cạnh
xe đạp đã gần như hòa vào làm một ta chỉ còn phân biệt khuôn mặt của họ còn phần thân
gồm có cánh tay nhân vật nữ và dáng đứng nhân vật nam đã không còn xác định được.
Trong hình hình 2 và 5 chi tiết đối tượng đã biến mất.

30
 Từ đây ta có thể thấy phương pháp G.otsu sẽ gặp khó khăn khi dùng để phân tích những
ảnh có nhiều chi tiết với các điểm ảnh có cường độ sáng tương đương nhau và còn ở gần
nhau trên ảnh.

+) Nhóm 3: Ảnh chứa ánh sáng mạnh

 Đây là những bức ảnh có thể ở cả 2 nhóm trên nhưng chúng có điểm chung là đối tượng
bị chiếu vào bởi một nguồn sang mạnh tạo ra một vùng sáng chói trên ảnh. Điều này dẫn
đến độ tương phản của vùng bị ánh sáng mạng ảnh hưởng giảm xuống và gây nhiễu cho
việc phân biệt nền và đối tượng cho phương pháp G.otsu.

ST Ảnh đa mức xám Histogram Ảnh nhị phân


T
1

Threshold = 162
2

Threshold =120
3

Threshold = 150

31
4

Threshold = 160
5

Threshold = 136
6

116

*) Nhận xét:

- Ta có thể dễ thấy cả 2 tiêu chí về phân biệt đối tượng với nền và nhận diện đối tượng đều
không được phương pháp G.otsu đảm bảo đối với nhóm ảnh này. Ví dụ trong hình 2 và 5 ta
đã không còn biết được đâu là đối tượng và đâu là nền, hình 5 còn khiến ta khó nhìn ra nội
dung của ảnh là gì. Thêm nữa hình 1 nhân vật hoàn toàn bị phủ trắng chỉ còn duy nhất đôi
mắt còn hình 4 nhân vật hoàn toàn bị bôi đen không thể nhận diện được và hình 3 một phần
đối tượng bị hòa vào với nền.

2. Đánh giá định lượng

Cho đến nay việc đánh giá các phương pháp đều dựa trên đánh giá chủ quan về mặt chất
lượng. Mặc dù nó có thể phục vụ đầy đủ nhu cầu đánh giá trực quan nhưng mong muốn có
cách định lượng hơn để đo lường hiệu quả của phương pháp. Đại lượng được gọi là tính
đồng nhất ban đầu được phỏng theo Levine và Nazif [4,5] sẽ được sử dụng cho mục đích

32
này để đánh giá định lượng hiệu suất của các phương pháp. Tham số này rất quan trọng để
mô tả sự tách biệt giữa đối tượng và nền.

Ở giá trị ngưỡng t, thước đo độ đồng đều U(t) được định nghĩa là:
2 2
σ b ( t )+ σ f ( t )
U ( t )=
Z

Trong đó σ 2b ( t ) và σ 2f ( t ) lần lượt là phương sai của lớp nền ( background (T0)) và đối tượng
(foreground (T1)) còn Z là hệ số chuẩn hóa được xác định bởi công thức:
2
( I max−I min )
Z=
2

Trong đó Imax và Imin lần lượt là cường độ sáng lớn nhất và nhỏ nhất của ảnh đầu vào.

Ta sẽ tiếp tục chia các ảnh được chọn thành 3 nhóm để đánh giá

+) Nhóm 1: Ảnh có nền đơn giản

Bảng 5: Kết Quả U(t) của nhóm ảnh 1

STT Ảnh đa mức xám U(t) STT Ảnh đa mức xám U(t)
1 0.9549 7 0.9372

33
2 0.928 8 0.9446

3 0.9902 9 0.9732

4 0.9699 10 0.9353

5 0.9104 11 0.9489

34
6 0.9279 12 0.9469

*) Nhận xét:

 Với nhóm ảnh này dựa và hệ số U(t) tương đối cao ta có thể thấy rằng phương pháp
G.otsu đã tìm được ngưỡng threshold phù hợp với từng ảnh. Điển hình với ảnh các ảnh QR
code giá trị U(t) đều rất cao. Tuy nhiên với một số ảnh có nhiều chi tiết như hình 2 và 5 thì
giá trị này có phần thấp hơn mặc dù trong phần đánh giá trực quan ảnh nhị phân được tạo ra
từ 2 ảnh này là tương đối tốt trong việc nhận diện đối tượng. Ảnh 6 cũng nhận một giá trị
U(t) thấp hơn đáng kể so với những ảnh còn lại, lý do có thể đến từ độ tương phản của nền
và đối tượng không cao.

+) Nhóm 2: Ảnh có nhiều chi tiết hoặc nền phức tạp

35
Bảng 6: Kết Quả U(t) của nhóm ảnh 2

ST Ảnh đa mức xám U(t) ST Ảnh đa mức xám U(t)


T T
1 0.9487 7 0.9543

2 0.9344 8 0.9482

3 0.9472 0.9539

36
4 0.9159 9 0.9427

5 0.9396 10 0.9838

*) Nhận xét:

 Ta thấy giá trị U(t) trong trường hợp nhóm ảnh đều khá cao và ổn định trong khoảng
(0.93,0.96). Trong phần nhận xét trực quan ta có thể thấy phương pháp G.otsu gặp khó khắn
khi tìm ngưỡng nhị phân tối ưu cho loại ảnh này do cho ảnh nhị phân kho nhận biết các chi
tiết tuy nhiên các thông sô U(t) tính toán được cho thấy ngưỡng mà phương pháp otsu tìm
được đã là tương đối tốt và đảm bảo ảnh nhị phân truyền đạt được những ý chính của ảnh đa
mức xám. Ví dụ như ảnh 10 là 1 ảnh vệ tinh chụp 1 vùng dân cư giá trị U(t) của ảnh này rất
cao và ảnh nhị phân ( phần phụ lục) cũng diễn tả tương đối những vùng của khu dân cư này.
Ảnh 4 có giá trị U(t) thấp hơn đáng kể và cũng cho ảnh nhị phân khó nhận biết đối tượng
nhất như đã nhận xét ở phần nhận xét trực quan, lý do tương tự như ảnh 6 của nhóm trên,
được cho là do độ sáng giữa nền và đối tượng gần nhau hay nói cách khác độ tương phản
của một số vùng đối tượng và nền trong ảnh không cao.

37
+) Nhóm ảnh 3: Ảnh chứa ánh sáng mạnh

Bảng 7: Kết Quả U(t) của nhóm ảnh 3

ST Ảnh đa mức xám U(t) ST U(t)


T T
1 0.917 6 0.918
8 6

2 0.938 7 0.937
4 6

3 0.933 8 0.939
8 3

38
4 0.926 9 0.918
8 7

5 0.932 10 0.942
3

*)Nhận xét:

 Có thể thấy giá trị U(t) trong nhóm ảnh này có xu hương thấp hơn hơn hai nhóm trên chỉ
trong khoảng (0.91,0.94) tuy nhiên đây cũng không phải quá thấp. Mặc dù vậy như đã nhận
xét ở phần nhận xét trực quan ảnh nhị phân được tạo ra rất kho để nhận diện đối tượng. Điều
này nói lên phương pháp G.otsu đã cố gắng chọn được ngưỡng phù hợp với thông số ảnh
đầu vào nhưng đã bị những vùng sáng do nguồn sáng lớn tạo ra làm nhiễu và rất có thể đã
cho ra ngưỡng nhị phân chưa tối ưu.

3. Kết luận

a) Ưu điểm

 Tự động: Phương pháp Otsu tự động xác định ngưỡng tối ưu mà không cần sự can thiệp
của người dùng. Điều này rất hữu ích khi xử lý hàng loạt hình ảnh hoặc khi không có thông
tin trước về dữ liệu.
 Hiệu quả: Phương pháp Otsu tối ưu hóa việc tách biệt foreground và background dựa trên
phân bố histogram của hình ảnh. Nó cung cấp một ngưỡng tối ưu để làm nổi bật đối tượng
trong hình ảnh và loại bỏ nhiễu.

39
 Áp dụng rộng rãi: Phương pháp Otsu có thể được áp dụng cho nhiều loại hình ảnh và tình
huống khác nhau, bao gồm cả hình ảnh y tế, công nghiệp và xử lý ảnh tự động.
 Tính ổn định: Phương pháp Otsu cho kết quả ổn định, không phụ thuộc vào sự lựa chọn
tùy ý của người dùng. Nó đáng tin cậy và thích hợp cho nhiều ứng dụng.
b) Nhược điểm
 Phụ thuộc vào biểu đồ histogram: Phương pháp Otsu dựa trên phân bố histogram của
hình ảnh. Nếu histogram không có đỉnh rõ ràng hoặc không có sự tách biệt rõ ràng giữa
foreground và background, phương pháp này có thể không cho kết quả tốt.
 Không phù hợp với hình ảnh có nhiều vật thể hoặc phần tử gần nhau: Trong trường hợp
hình ảnh chứa nhiều đối tượng hoặc các phần tử gần nhau, phương pháp Otsu có thể không
phân biệt được rõ ràng giữa các đối tượng hoặc có thể tạo ra một ngưỡng không chính xác.
 Không thích hợp cho hình ảnh có độ tương phản thấp: Nếu hình ảnh có độ tương phản
thấp, tức là khoảng cách giữa foreground và background không rõ ràng, phương pháp Otsu
có thể không xác định được ngưỡng tách biệt một cách chính xác.
 Tính toán phức tạp: Phương pháp Otsu đòi hỏi tính toán histogram và tính toán các giá trị
tương ứng, bao gồm phương sai và hệ số chuẩn hóa, để xác định ngưỡng tối ưu. Điều này có
thể tốn thời gian tính toán đáng kể, đặc biệt đối với hình ảnh lớn.

40
V. Tổng kết
Dự án tìm hiểu về phương pháp G.otsu đã giúp chúng tôi có cái nhìn tổng quan về phương
pháp này và hiểu rõ cách nó hoạt động trong việc tự động phân ngưỡng hình ảnh. Chúng tôi
đã nắm vững nguyên lý cơ bản của phương pháp G.otsu, trong đó tiêu chí phân ngưỡng tổng
thể được sử dụng để tìm giá trị ngưỡng tối ưu.

Qua quá trình nghiên cứu, chúng tôi đã hiểu rõ các bước thực hiện của phương pháp G.otsu,
bao gồm xác định histogram của hình ảnh, tính tổng xác suất của mỗi mức xám, tính tổng
trung bình của mỗi mức xám, xác định giá trị ngưỡng tối ưu và phân ngưỡng hình ảnh ban
đầu. Chúng tôi đã thực hiện các bước này và áp dụng phương pháp G.otsu vào một số hình
ảnh thử nghiệm để kiểm tra hiệu quả của nó.

Phương pháp G.otsu đã cho kết quả tốt trong việc tự động phân ngưỡng hình ảnh. Chúng tôi
đã quan sát thấy rằng phương pháp này có khả năng phân ngưỡng chính xác và đáng tin cậy,
đồng thời giúp tách biệt rõ ràng các đối tượng trong hình ảnh. Điều này giúp cải thiện quá
trình xử lý ảnh và thị giác máy tính trong nhiều ứng dụng khác nhau.

Tuy nhiên, chúng tôi cũng nhận thấy rằng phương pháp G.otsu có một số hạn chế. Nó giả
định rằng hình ảnh chỉ bao gồm hai lớp phân biệt rõ ràng và không phù hợp cho các hình
ảnh có sự chồng chéo giữa các đối tượng. Đồng thời, khi phân ngưỡng hình ảnh có nhiều
lớp, phương pháp G.otsu không hiệu quả.

Trong tương lai, chúng tôi hy vọng có thể tiếp tục nghiên cứu về phương pháp G.otsu và cải
thiện nó để đáp ứng tốt hơn cho các tình huống phức tạp. Đồng thời, chúng tôi cũng quan
tâm đến việc áp dụng phương pháp này vào các lĩnh vực cụ thể như xử lý ảnh y tế, nhận
dạng ký tự và xử lý ảnh công nghiệp để nâng cao hiệu suất và đưa ra những ứng dụng thực
tiễn.

41
Tài liệu tham khảo
[1] Image Binarization using Otsu Thresholding Algorithm [Jamileh Yousefi,University of
Guelph, Ontario, Canada,April 18, 2011]

[2] Comparison of Two Binary Image Thresholding Methods [Hanif Azhar, Taufiq
Widjanarko, Final Project Paper, EECE 6235 Random Signal Analysis, Fall 2002, EECE
Department, University of Memphis, Memphis, TN 38152]

[3] Lecture 4: Thresholding [Bryan S. Morse, Brigham Young University, 1998–2000]

[4] https://en.wikipedia.org/wiki/Otsu%27s_method

[5] Improvement in the Between-Class Variance Based on Lognormal Distribution for


Accurate Image Segmentation [ Walaa Ali H. Jumiawi and Ali El-Zaart]

[6] http://www.labbookpages.co.uk/software/imgProc/otsuThreshold.html

42

You might also like