Download as pdf or txt
Download as pdf or txt
You are on page 1of 36

LOGO

NH N D NG CH VI T TAY MỌ
HÌNH MARKOV N

H c viên : NGUY N MINH TRI T


Giáo viên h ớng dẫn : TS. VǛ Đ C LUNG
www.themegallery.com

NỘI DUNG

1 Gi I THI U Đ TẨI

2 TI N X Lụ VẨ TRệCH CH N Đ C TR NG

3 MỌ HÌNH MARKOV N

4 NG D NG MỌ HÌNH MARKOV N NH N D NG CH VI T TAY

5 CH NG TRÌNH DEMO

COMPANY LOGO
www.themegallery.com

GiỚI THIỆU Đ TÀI

- Các bài toán nhận d ng đang đ ợc ng dụng trong th c t , hi n


nay tập trung vào nhận d ng mẫu, nhận d ng ti ng nói và nhận
d ng ch …
-Nhận d ng ch vi t tay là bài toán đ ợc quan tâm rất nhi u và
nhận d ng ký t không dấu đư đ t đ ợc nhi u thành công lớn.
-Nhận d ng ch vi t tay ti ng Vi t vẫn còn là vấn đ thách th c
lớn đối với các nhà nghiên c u.
- Bài toàn này ch a th gi i quy t tr n vẹn đ ợc vì nó hoàn toàn
phụ thuộc vào ng i vi t và s bi n đổi quá đa d ng trong cách
vi t và tr ng thái s c khỏe, tinh thần c a t ng ng i vi t.

COMPANY LOGO
www.themegallery.com

GiỚI THIỆU Đ TÀI

- Hi n nay có một số đ tài nghiên c u nhận d ng ch vi t tay


ti ng Vi t nh m ng Nơron, máy Vector hổ trợ…., tuy nhiên k t
qu nhận d ng l i không cao .

Đó là lý do em ch n đ tài này với mong muốn nâng cao


k t qu nhận d ng đ c bi t là ti ng Vi t.

Trong đề tài tập trung vào nghiên cứu nhận dạng các ký
tự viết tay tiếng Việt đơn lẽ bằng mô hình Markov ẩn.

COMPANY LOGO
www.themegallery.com

QUI TRÌNH TH C HI N

Qui trình nh n d ng ch vi t tay đ c thực hi n


qua các b c nh sau :

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRÍCH CHỌN ĐẶC TR NG

1. Chuyển xám
- M c đích : Chuyển ảnh màu v ảnh đa cấp xám.
Ví d :
Chuyển xám

Trước khi chuyển xám Sau khi chuyển xám

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRÍCH CHỌN ĐẶC TR NG

-Thu t toán trung bình c ng :


Ýt ng c a thuật toán nh sau: Tính trung bình cộng
giá tr c a 1pixel, sau đó gán l i giá tr trung bình cộng đó cho
RGB.
Ví d :Quá trình chuy n xám nh sau :
TBC=(145+254+43)/3 = 147
Sau đó gán l i giá tr 147 cho R,G,B. Pixel mới đ ợc mô t
nh sau
Nh vậy nh đư đ ợc chuy n v nh đa cấp xám

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRÍCH CHỌN ĐẶC TR NG

2. Phơn ng ỡng
- M c đích: Chuy n nh đầu vào thành nh đen trắng (là nh có
các pixel chỉ mang giá tr 0 ho c β55)
- Thu t toán trung bình c ng:
Sau khi tính đ ợc giá tr TBC nh phần 1 ta đem so sánh
với ng ỡng .

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRÍCH CHỌN ĐẶC TR NG

Ng ỡng là một số nằm trong kho ng t 0255. Trong


bài này đang đ t ng ỡng là 1β8
Thuật toán này cụ thể như sau:
 N u TBC < 0: Gán giá tr R,G,B = 0
 N u TBC > β55: Gán giá tr R,G,B = β55
 N u TBC < Ng ỡng: Gán giá tr RGB = 0
 N u TBC >= Ng ỡng: Gán giá tr RGB=β55

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

3. L c nhi u
 Áp d ng b l c Median
- Mục đích: L c nhi u đốm, nhi u muối tiêu sau khi đư phân
ng ỡng nh.
-Với nh ng nh đầu vào là nh scan ho c nh chụp t đi n
tho i ho c máy nh, sau khi phân ng ỡng hay có các đi m đen
lốm đốm nằm r i rác trên toàn bộ vùng nh.
- Các đi m này g i là nhi u, mục đích c a bộ l c median là
lo i bỏ các đi m nhi u này.

COMPANY LOGO
Med 
n www.themegallery.com
2

TI N X LÝ VÀ TRệCH CH N Đ C TR NG
Kỹ thu t l c trung v
Gi s ta có nh I, đi m nh P, c a sổ w(p) và ng ỡng ᶲ
Khi đó l c trung v gồm các b ớc sau :
Bước 1 : Tính trung vị
{I (q) / q  W ( p)} 
 Med ( p)

Bước 2 : Gán giá trị

I ( p) Neu / I ( p)  Med ( p) /  
I kq ( p)  
Med ( p) Neu / I ( p)  Med ( p) /  

COMPANY LOGO
Med2n2 www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

Ví dụ :Cho nh I, đi m nh W(γxγ), ng ỡng   2


 1 0 1 4 1 2 
 
 2 4 31 7 4 1 
I 
2 1 4 2 2 7 
 
 7 2 0 4 1 2 

Med   2
n 4
2 2
 1 0 1 4 1 2 
 
 2 4 4 4 4 1 
I kq  
2 1 4 2 2 2 
 
 4 2 0 4 1 2 

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

4.Phát hi n biên vƠ tách ch


Mục đích: Tách riêng phần nh ch a ký t t nh đầu vào, lo i
bỏ phần d th a.
Ví dụ :1 nh đầu vào nh sau:

Tr ớc khi phát hi n biên Sau khi phát hi n biên

COMPANY LOGO
 www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

- Đ làm đ ợc đi u này ta ph i đi tìm các đi m cận c a ký t bao gồm:


+ Cận trên (Top)
+ Cận d ới (Bottom)
+ Cận trái (Left)
+ Cận ph i (Right)
- Vì nh sau khi đư qua ti n x lý là nh chỉ bao gồm β giá tr :
+ 0: Bi u di n b i màu đen
+ β55: Bi u di n b i màu trắng

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

Tìm c n trên (Top)


Ý tưởng: Quét nh theo chi u ngang t trên xuống
d ới. Đ n khi nào g p đi m đen đầu tiên thì d ng l i đó là
đi m cận trên.
Tìm c n d i (Bottom)
Ý tưởng: Quét nh theo chi u ngang t d ới lên trên.
Đ n khi nào g p đi m đen đầu tiên thì d ng l i đó là đi m
cận d ới.

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

Tìm c n trái (Left)


Ý tưởng: Quét nh theo chi u d c t trái sang ph i. Đ n
khi nào g p đi m đen đầu tiên thì d ng l i đó là đi m cận trái.
Tìm c n ph i (Right)
Ý tưởng: Quét nh theo chi u d c t ph i sang trái . Đ n
khi nào g p đi m đen đầu tiên thì d ng l i đó là đi m cận ph i.
Sau khi tìm đ ợc 4 đi m cận. Ta cắt nh theo 4 t a độ v a
tìm đ ợc thì s thu đ ợc vùng chỉ ch a ký t .

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG
5.Chỉnh nghiên : Ễp dụng ph ơng pháp tia quay (project profile)
Ví dụ :

Cách tính góc nghiêng như sau:


- Xoay nh trong 1 kho ng t góc a1a2
- B ớc nh y là 1 góc b
- nh đầu vào t v trí 1 xoay đ n v trí 4 và mỗi b ớc xoay 1
góc là b, sau mỗi lần xoay tính toán l i tr ng số c a nh .
- Tính max c a các tr ng số.
- b ớc xoay nào tr ng số đ t giá tr max thì đó là góc xoay
cần tính c a nh
COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

6. Trích ch n đ c tr ng
•M c đích: Trích ra các đ c tr ng c a nh để quá trình nh n
d ng chính xác.
- Đồng nhất các nh v cùng
kích th ớc (β0*γ0)
- Chia nh thành các vùng mang nh ng
đ c tr ng c a nh đó, ta chia chi u d c
thành γ đo n chi u ngang thành γ đo n :
- Sau khi chia ký t thành các đo n ta tính l i pixel nh .
Mỗi vùng s mang các vector đ c tr ng riêng

COMPANY LOGO
www.themegallery.com

TI N X LÝ VÀ TRệCH CH N Đ C TR NG
Marketing Diagram
7)L ng t hóa
- Đ c toàn bộ pixel nh c a ký t . T i nh ng pixel mầu đen giá tr
l ợng t là 1.
- T i nh ng pixel mầu trắng giá tr l ợng t là 0. Lúc này d li u
nh s chỉ còn là 0 và 1.
- Tr ơng trình s tính toán và ti n hành nhận d ng trên giá tr nh
phân này.

COMPANY LOGO
www.themegallery.com
•Ví dụ k t quả của ảnh sau khi l ợng t

TI N X LÝ VÀ TRệCH CH N Đ C TR NG

Ví d :K t qu c a nh sau khi l ợng t :

COMPANY LOGO
www.themegallery.com
•Ví dụ k t quả của ảnh sau khi l ợng t

MÔ HÌNH MARKOV ẨN

1. Đ nh nghĩa
Mô hình Markov ẩn (Hidden Markov Model) là mô hình
thống kê trong đó h thống đ ợc mô hình hóa đ ợc cho là quá
trình Markov với các tham số không bi t tr ớc và nhi m vụ là
xác đ nh các tham số ẩn t các tham số quan sát đ ợc d a trên
s th a nhận này. Các tham số c a mô hình đ ợc rút ra sau đó
có th s dụng đ ợc đ th c hi n các phân tích k ti p .

COMPANY LOGO
www.themegallery.com
•Ví dụ k t quả của ảnh sau khi l ợng t

MÔ HÌNH MARKOV Ẩn

 ng d ng c a mô hình Markov n :
Nhận d ng ti ng nói
Nhận d ng ch vi t tay
X lý ngôn ng thống kê
D ch máy
Tin sinh h c

COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN
2.Chuổi (Xích )Markov
V b n chất, mô hình Markov là một ph ơng pháp mô
hình tín hi u nh một chuỗi k t xuất có th quan sát, đ ợc sinh
ra b i một số ti n trình đ ợc g i là nguồn (source).

Ví dụ :

Mô hình Markov 3 trạng thái


COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN

- qt là tr ng thái đ t đ n đ ợc th i đi m t
- aij là xác suất chuy n t tr ng thái Si sang tr ng thái Sj :
Aij = P[qt+1 = j|qt = i], a
ij 1

- S là tr ng thái c a h thống th i đi m t

COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN
Ví dụ : Mô hình biểu diễn thời tiết

-M a : Tr ng thái 1
0.2
-Mây : Tr ng thái β
-Nắng : Tr ng thái γ  04 0.3 0.3 
0.2 -Ma trận xác suất A  0.2 06 0.2 
 0.1 0.1 0.8 
0.1

-Chuy n tr ng thái:
Hỏi : Xắc suất đ th i ti t 4 ngày liên ti p : Nắng, m a, mây, nắng ?
Tr l i : Dưy quan sát o là (nắng , m a, mây , nắng).
P(O) = P[3,1,2,3]
= P[3]*P[1,3]*P[2,1]*P[3,2]= 1 *a31 *a12 *a23

COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN
3.Mô hình Markov n
Trong mô hình Markov ẩn, các s ki n quan sát đ ợc nằm trong
mỗi tr ng thái và phụ thuộc vào hàm mật độ xác suất trong các tr ng thái
đó.
qt = Tr ng thái th i đi m t
Ví dụ : S={1,β,…,N} – Tập tất c các tr ng thái ẩn
Ot = (ký hi u) quan sát th i đi m t.
V = {1,β…,M}tập tất c các ký hi u quan sát
đ ợc.
aij= P(qt+1 =j|qt =i),aij 0, 1 i,j N

  {A, B,  }
B=[bij] xác suất nh ký hi u
b = P(o =k|q=i),b  0, 1 i N&1 k  M
  [ i ]xác suất kh i tr ng  i  P(q1  i)
A=[aij] xác suất chuy n tr ng thái

COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN
Ví dụ : Mô hình Markov ẩn

Hệ thống bình cầu bao gồm :


-N tr ng thái, M tín hi u quan sát.
-Kh năng ch n bình là xác suất chuy n tr ng thái.
- Kh năng ch n qu cầu là xác suất c a tín hi u quan sát.
COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN

Ba bài toán mô hình Markov n


Bài toán 1: cho tr ớc chuỗi tín hi u quan sát O = O1 O2 … OT
và mô hình HMM đ i di n b i bộ tham số λ = (A, B, π). Làm
sao đ tính toán một cách hi u qu p(O|λ) – xác suất phát sinh O
t mô hình λ?
Bài toán 2: cho tr ớc chuỗi tín hi u quan sát O = O1 O2 … OT
và mô hình HMM đ i di n b i bộ tham số λ = (A, B, π). Cần
tìm ra chuỗi tr ng thái tối u nhất Q = q1 q2 … qT đư phát sinh
ra O?
COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN

Bài toán 3: cho tr ớc chuỗi tín hi u quan sát O = O1, O2 … OT.


Làm th nào đ xác đ nh các tham số mô hình λ = (A, B, π) sao
cho c c đ i hóa xác suất p(O|λ)?
Bộ tham số λ có th đ ợc ch n sao cho xác suất p(O|λ) đ t c c
đ i cục bộ bằng thuật toán Baum-Welch:
- Tr ớc tiên, ta đ nh nghĩa ξt(i,j) là xác suất tr ng thái Si t i
th i đi m t và rơi vào tr ng thái Sj th i đi m t+1 cho tr ớc mô
hình λ và chuỗi tín hi u quan sát O:
ξt (i, j) =p(qt= Si , qt +1 = S j | O, λ)
COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN

Theo đ nh nghĩa này, ξt(i,j) có th đ ợc tính thông qua các bi n


forward α t(i) và backward t(i) nh sau:

M c khác, ta đư có t(i) là xác suất tr ng thái Si vào th i


đi m t cho tr ớc chuỗi tín hi u quan sát O và mô hình λ. Lấy tổng
ξt(i,j) trên j, ta đ ợc t ơng quan gi a t(i) và ξt(i,j) nh sau:

COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN

N u ta lấy tổng t(i) theo t ∈ [1, T-1], k t qu nhận đ ợc


là số lần kỳ v ng chuy n tr ng thái t Si. T ơng t , lấy tổng
ξt(i,j) theo t ∈ [1, T-1], ta s có số lần kỳ v ng chuy n t tr ng
thái Si sang Sj:
Với các đ i l ợng này, ta có các bi u th c cập nhật tham
số c a HMM nh sau:

COMPANY LOGO
www.themegallery.com

MÔ HÌNH MARKOV ẨN

  ( , A, B )

COMPANY LOGO
www.themegallery.com

NG D NG MỌ HÌNH MARKOV N NH N
D NG CH VI T TAY
Huấn ly n :
‒ nh ký t đ ợc scan, chụp đ ợc đ a vào h thống
‒ Ti n x lý và trích ch n đ c tr ng
‒ Các vector đ c tr ng s đ ợc đ a vào mô hình cần huấn luy n
t ơng ng với ký t đ a vào. Các vector đ c tr ng chính là
dưy quan sát đầu vào c a mô hình Markov ẩn
Nhận d ng: Cǜng t ơng t nh phần huấn luy n. nh scan s
đ ợc lấy đ c tr ng. Dưy vector đ c tr ng lần l ợt s đ a vào các
mô hình Markov ẩn đư đ ợc huấn luy n. Mô hình nào gần nhất
với mô hình huấn luy n thì s đ ợc ch n.
COMPANY LOGO
www.themegallery.com

CH ƠNG TRÌNH DEMO

- C u hình cƠi đ t : CPU pentium4, RAM 2G


- Ngôn ng l p trình : Ngôn ng C# , mư nguồn m
- Giao di n chính ch ng trình :

COMPANY LOGO
www.themegallery.com

K T LUẬN

 Đ tài đư ng dụng mô hình Markov ẩn vào nhận d ng ch


vi t tay cho thấy k t qu nhận d ng t ơng đối tốt.
 H ớng phát tri n ti p theo
- Nhận d ng đo n văn b n vi t tay….
- Phát tri n đ ch ơng trình có th tích hợp với các tr ơng trình
qu n lý sinh viên, h c sinh. Phát tri n thêm v m t d li u đ
tr ơng trình có th ho t động tốt với d li u c a các ch ơng trình
qu n lý.
- C i ti n một số thuật toán ti n x lý đ ch ơng trình có tốc độ
tốt hơn.
- Phát tri n giao di n thân thi n hơn với ng i s dụng.
COMPANY LOGO
LOGO

EM XIN C M N TH Y CỌ VẨ CÁC B N Đẩ
L NG NGHE !

You might also like