เอกสารภาษาไทย Image Processing 6

Image Processing6: Image Understanding and
Interpretation
1. กลาวนํา
ในบทสุดทายนี้ จะไดกลาวถึงการระบุหรือจําแนกวัตถุในรูป (Object

Identification หรือ Feature Extraction) อันเปนกระบวนการสุดทายของ
กระบวนการทางการประมวลผลทางภาพ (Image Processing) หรือ เพื่อ
บรรลุสูงสุดของ Image Processing ในการที่ทําใหเครื่องคอมพิวเตอร
สําหรับเทคนิคการทํา Object Identification หรือ Feature Extraction
สามารถจําแนกหรือแยกแยะวัตถุตางๆ ใน Digital Image เราอาจจะแยก
การศึกษานี้จาก Image Processing เปนหลายแขนงมาเกี่ยวของ เชน
Machine Vision หรือ Pattern Recognition โดยอาศัยคณิตศาสตรที่มี
ความซับซอนมากขึ้น แตในที่นี้ เราแนะนําหลักการพื้นฐานที่สําคัญของ
Image Understanding เชน Classification, Man-made Extraction
ดังตอไปนี้
2. การจําแนกรายละเอียด (Classification)
ในการสํารวจระยะไกล Classification คือ การจัดกลุมของวัตถุตางๆในภาพ

หรืออาจหมายถึง การสรางแผนที่เฉพาะ เรื่อง (Thematic Map) จากภาพ
ดาวเทียม โดยหลักการทางคณิตศาสตร
รูปที่ 1 Processing Procedure of Classification
2.1 ความรูพื้นฐานสําหรับการ Classification
เพื่อใหสามารถเขาใจ Classification ไดดีขึ้น เรามีความจําเปนที่จะตอง

ทราบความรูพื้นฐานทางคณิตศาสตรที่เกี่ยวของดังตอไปนี้
Discrimination Function
โดยความตามรูปแลว Discrimination Function หมายถึง ฟงกชั่นการแยก

ความแตกตาง โดยสามารถประยุกตกับการจําแนกรายละเอียดของวัตถุชนิด
ตางๆในภาพ อาจจะกลาวอยางๆ คือ การหาระยะที่มากที่สุดของคาเฉลี่ย
64
ของสองสิง่ หรือมากกวา โดยทั่วไปเราเรียกตัวที่ใชแยกหรือจําแนกวา
Discriminator หรือ Classifier ซึ่งสามารถอธิบายดวยสมการดังตอไปนี้
a 1 x 1 + a 2 x 2 + ... + a n x n > x 0 (1)
a 1, a 2 , … ,a n เปน Variable ที่เกี่ยวกับ x 1, x 2, …, n เปนคา Observation

และ x 0 คือ Vectorผลลัพธ ที่เรากําหนด หรืออาจจะนิยามอยางสั้นไดวา
(Ax > x 0 ) equiv B (2)
โดยที่ Ax= a 1 x 1 + a 2 x 2 + ... + a n x n และ B= Class ที่ใชในการ

แยกวัตถุ
รูปที่ 2 การทํางานของ Discrimination Function
จากรูปดังกลาวจะเห็นไดวา เราใชสมการเสนตรงในการแยกวัตถุ 2 ชนิด

และบนหลักการเดียวกันจะนํามาในการจําแนกรายละเอียด (Classification)
โดยทั่วไป Classification ที่นิยมในการสํารวจระยะไกล เราสามารถแบงได

เปน 2 ชนิดที่สําคัญคือ Supervised and Unsupervised Classification
โดยจะอธิบายรายละเอียดดังตอไปนี้
65
2.2 Supervised Classification
Supervised Classification หมายถึง การจําแนกรายละเอียดใชการคํานวณ

เปรียบเทียบชั้นการกําหนดความรูเบื้องตนของวัตถุใดๆในภาพที่ไดเปนชั้น
ของวัตถุนี้โดยที่เราทราบนัยสําคัญของวัตถุนั้นในภาพ เรียกวา Training
Data Set หรือ อาจจะกลาวอีกนัยหนึ่งคือ การใช Prior Decision สําหรับ
Supervised Classification นัน ้ ที่นิยมใชในงาน Remote Sensing มีอยู
หลายชนิด เชน Table Look-up, Parallelepiped, Minimal Distance เปน
ตน
แตในที่นี้ จะขอยกตัวอยาง Supervised Classification ที่นิยมใชกันอยาง

แพรหลายชนิดหนึ่งคือ Maximum likelihood Classification ซึ่งจะได
อธิบายในรายละเอียดดังตอไปนี้
Maximum likelihood Classification เปนวิธีหนึ่งที่นิยมใชใน Remote

Sensing โดยที่ Pixel ที่มีจะถูกจัดเขา Class ตามที่กําหนดดวยความ
เหมือน (Maximum likelihood) ของ Pixel นั้นเมื่อเปรียบเทียบกับ Class
นั้น โดยที่เราสามารถอธิบายดวยรูปที่ 3 และ สมการที่ 3 ดังตอไปนี้
รูปที่ 3 Maximal Likelihood Classification
66
รูปที่ 3 Maximal Likelihood Classification (ตอ)
โดยทั่วไปเรานิยาม Maximal Likelihood ในรูปของ the probability

density function ในกรณีของ normal distributions ดังตอไปนี้
1 ⎧ 1 t⎫
Lx ( X ) = 1/ 2
exp⎨− ( X − μ k ) ⎬
( 2Π ) n
∑ k
⎩ 2 ⎭
(3)
โดยที่ n: number of bands

X: image data of n bands
Lk(X) : likelihood of X belonging to class k
k : mean vector of class k
k : variance-covariance matrix of class k
โดยที่ตัวอยางของการจําแนกรายละเอียดวัตถุตางๆในภาพถายดาวเทียม
Aster ในชวงคลื่น visible (400-700μm) ดวยวิธี Maximum Likelihood
Classification จะไดอธิบายกระบวนการทํางานและผลลัพธในรูปที่ 4, 5, 6
และ 7 ตามลําดับ
67
รูปที่ 4 Procedure of Maximum Likelihood Classification สําหรับการ
จําแนกรายละเอียดภาพดาวเทียม
รูปที่ 5 Original Image เปนถายดาวเทียม Aster
68
รูปที่ 6 การเลือก Training Data Set
รูปที่ 7 ผลลัพธของการ Maximum likelihood Classification
69
2.3 Unsupervised Classification
Unsupervised Classification หมายถึง การจําแนกรายละเอียดดวย

คุณสมบัติของคาPixel Value ภายในภาพ (Image) เองโดยไมอาศัย
ความรูของวัตถุ (Training Data Set) หรือการสะทอนของวัตถุ
(Reflectance) หรือ อาจจะกลาวอีกนัยหนึ่งคือ การใช Posterior Decision
ขอดีในของ Unsupervised Classification คือ การลดคาใชจายในการออก
สํารวจในสนาม (Field Observation หรือ Ground Truth) แตอยาวไรก็
ตาม Unsupervised Classificationก็มีขอ เสียอยูบางประการ เชน การใช
เวลาคอนขางในการ Processing หรือ การไมรับชนิดของวัตถุใดๆในภาพ
สําหรับ Unsupervised Classificationมีหลายชนิดที่นิยมใชในงานทางการ

สํารวจระยะไกล (Remote Sensing) และงาน Digital Mapping เชน Non-
clustering: ISODATA หรือ K-means, Hierarchical Clustering:
Nearest neighbor, Furthest neighbor method, Centroid method เปน
ตน ในที่นี้จะขอยกตัวอยางของ Unsupervised Classification คือ
ISODATA ที่จะไดแสดงรายละเอียดดังตอไปนี้
ISODATA (Iterative Self-Organization Data Analysis Technique)

หรือ ในตําราบางเลมอาจนิยามเปน K- Mean ซึ่งมีความหมายตางกันเพียง
เล็กนอย กลาวคือ K-Mean คือ การจัดกลุม (Cluster) ของ Pixels ในภาพ
เปนจํานวน K ชั้น ซึ่งก็เริ่มดวยการกําหนดศูนยกลางของ Cluster จํานวน K
จากนั้นในขั้นที่สอง Pixels จะจัดรวมกับ Cluster ที่ใกลที่สุดดวยการใช
Euclidean Distance แลวศูนยกลางของ Cluster จะถูกคํานวณใหม และ
ทําการคํานวณขั้นที่สองซ้ําจนกระทั่งการเปลี่ยนแปลงนอยกวาขอจํากัด
(Tolerance) สวน ISODATA จะไดขั้นตอนของการรวม (Merge) และการ
แยก (Split) ของ Cluster ดวย
เพื่อใหเกิดความเขาใจกระบวนการทํางานของ ISODATA ใหชัอเจนมากขึ้น

จะไดกระบวนการทํางานและผลลัพธของการจําแนกรายละเอียดแบบ
ISODATA ในรูปที่ 8, 9 และ 10
70
Selection of parameters
Calculation of the center of

gravity of initial clusters
Relocation Method
Relocation of members
Correct the center of

Gravity of all clusters
No
Convergence
Yes
Removal of the minimum

Cluster and of isolated members
The clustering is Yes

Compute statistics of Clusters
complete?
No
Merging Division Stop
รูปที่ 8 Flowchart of ISODATA classification
71
รูปที่ 9 Original Image
รูปที่ 10 Classified Image with ISODATA unsupervised classification

โดยที่กําหนด 3 Classes และ 30 Iterations
3. Man-made Object Extraction
นอกจากการจําแนกรายละเอียด(Classification) ของวัตถุชนิดตางๆในภาพ
ดาวเทียม (Satellite Image) ที่ไดกลาวมาแลวยังมีอีกเรื่องที่นาสนใจและ
เปนงานวิจัยอยางแพรหลายสําหรับการนําหลักการ Image Processing มา
ประยุกตก็คือ Man-made Object Extraction หรือ การระบุชนิดของวัตถุ
72
หรือสิ่งที่มนุษยสรางขึ้นจากภาพ ในที่นี้จะขอยกตัวอยาง การระบุชนิดปาย
ควบคุมการจราจรจากภาพถายบนพื้นดิน (Traffic Sign Recognition from
Terrestrial Imagery) และ การคนหารถจากรูปถายทางอากาศ (Vehicle
Detection from Aerial Image) ซึ่งจะไดแสดงรายละเอียดดังตอไปนี้
3.1 Traffic Sign Recognition from Gray-Scale Image
ตัวอยางที่จะไดอธิบายดังตอไปนี้ซึ่งเปน Man-made object Recognition

ชนิดหนึ่งโดยนําหลักการพื้นฐานเรื่อง Template Matching และ Affine
Transformation คือ การระบุชนิดปายสัญณาณจากภาพ (Traffic Sign
Recognition from Gray-Scale Image) โดยที่กอนที่จะอธิบายใน
รายละเอียด จะไดอธิบายถึงหลักการพื้นฐานเรื่อง Template Matching
ดังตอไปนี้
3.1.1 Template Matching
Template matching หมายถึง การตรวจสอบชนิดของวัตถุที่เราทราบ

(Template) ในภาพ (Master) เราสามารถอธิบายดวยสมการดังตอไปนี้
(4)
โดยที่ g1 (r,c) = Master, g2 (r,c) =Template , p = Correlation
Coefficient หรือ CC และ (r,c) = ตําแหนงของ Pixel ใน Image
รูปที่ 11 Parabolic curve of Coefficient Correlation
73
จากสมการดังกลาวสามารถวัดความเหมือนวัตถุที่เราทราบในภาพดวยคา
Correlation Coefficient สูงสุดดังที่จะแสดงใหเห็นในรูปที่ ซึ่งโดยปกติการ
ทํางานของการคํานวณหา Correlation Coefficient ของ Template
Matching ที่สมบูรณจะมีรูป parabolic หรือระฆังคว่ํา
แตสําหรับในการศึกษานี้ขนาดของ Master และ Template เทากัน ดังนั้น

Template ในการศึกษานี้จะไมวิ่งคนหาแตจะคํานวณหา Correlation
Coefficient ระหวาง Master กับ Template ทุกตัว แลวหาคาสูดสุด โดยจะ
ไดแสดงในรายละเอียดในลําดับตอไป
3.1.2 วิธีการของการระบุชนิดปายสัญณาณจากภาพ (Methodology for

Traffic Sign Recognition from Gray-Scale Image)
รูปที่ 12 Systematic diagram of Road Sign Recognition
การทํางานของระบบ Road Sign Recognition เริ่มดวยในขั้นตอนแรก จะ

ไดทําการแยกปายสัญณาณจราจร (Extraction) จาก Original Image ดวย
มือ แตผลลัพธของปายฯดังกลาวที่ไดมีความบิดเบี้ยนจากการฉายของ
กลอง (Camera Perspective Projection) แลงจึงใช Affine
Transformation เพื่อทําการปรับแกความบิดเบี้ยนของปายดังกลาวและมี
ขนาดเทากับ Template ของปายสัญณาณจราจรในฐานขอมูล จากนั้นใน
ขั้นตอนตอมาใช Template Matching เพื่อการคํานวณหา Coefficient
Correlation จาก 4.2.1 โดยเปรียบเทียบ Template of signs ทั้งหมดใน
ฐานขอมูลและคํานวณหาคา Coefficient Correlation ที่เกิดจากการ
คํานวณเปรียบเทียบระหวางปายกับ Template แตละตัวในฐานขอมูล
จากนั้นคนหาคา Coefficient Correlation สูงสุด ซึ่งแสดงวาปาย จาก
Original Image มีความคลายหรือเหมือน Template ตัวนั้นในฐานขอมูล
74
มากที่สุด และ ในทายสุด Template จะแสดงเปนผลลัพธ โดยที่กระบวน
ทั้งหมดและตังอยางของผลลัพธแสดงในรูปที 13, 14 และ 15 ตามลําดับ
Recognition Procedure
Road Sign The image that is pre- processed

Library will be matched by using the
images in the road sign library and
measure the time in recognition
Image Matching
algorithm
Template
Matching
Techniques
รูปที่ 13 Template matching ในการทํา Road Sign Recognition
Result of traffic Geo-Corrected

Extracted Sign
sign Sign by
From Original Image
From database of Affine
Original Image
template Transformation
รูปที่ 14 ผลลัพธของ Road Sign Recognition
75
The Sign No.2 Recognition Result
0.003
0.002
0.001
0
10
13
16
19
22
25
28
31
34
37
40
43
46
1
4
7
The Number of Sign in Sing Library
The Normalized Euclidean Distance
รูปที่ 15 Sign Recognition Result
3.2 Vehicle Detection from Three Line Scanner Imagery
สําหรับอีกอยางของ การทํา Man-made Object Extraction ซึ่งมีความ

ซับซอนกวาตัวอยางแรกโดย การนําหลักการ Image processing ในหลาย
เรื่องตั้งแตพื้นฐาน เชน Image Enhancement, Image Restore จนความรู
ขั้นสูง เชน Model-based Detection และ Recognition เปนตน โดยที่
กระบวนดังกลาวเปนการบูรณาการ (Integration) หลายเทิคนิคของ
Image processing เขาดวยกันโดยประยุกตกับภาพชนิดใหมที่ออกสูตลาด
เมื่อไมนานมานี้ที เราเรียกวา Three Line Scanner
3.2.1 ความรูเกี่ยวกับ Three Line Scanner (TLS)
เมื่อไมนานมานี้ (ชวงค.ศ. 1999) บริษัท Starlabo จํากัดแหงประเทศญี่ปุน

มีการพัฒนาสราง Sensor ในการถายรูปทางอากาศชนิดใหม เรียกวา
Three Line Scanner หรือ TLS โดยที Sensor ชนิดนี้สามารถบันทึก
(Imaging) ดวยกลอง CCD จํานวน 3 ตัวในเวลาเดียวกัน นอกจากนี้แลวยัง
สามารถเก็บคาพิกัดและการเอียงของจุดเปดถายในขณะที่บันทึกดวย GPS
และ INS ที่ไดรับการปรับแกจากหองทดลอง (Calibration) ตามลําดับ (ดู
รูปที่ 16)
76
รูปที่ 16 ระบบการทํางานของ Three Line Scanner
จากคุณลักษณะ Three Line Scanner ที่ไดอธิบายมาแลว เราสามารถแบง

คุณประโยชนโดยพิจารณาจากอุปกรณตางๆที่ติดอยูบน Sensor ดังตอไปนี้
1. Multi-line CCD camera สามารถผลิตรูปถายที่ความละเอียดสูงยิ่ง

(Ultra-High Resolution) ในระดับ 3-5 เซนติมิเตอร (few centimeters)
และสามารถสรางความสัมพันธทาง 3 มิติจากสวนที่ซอนทับจากรูปทิศทาง
ตาง ๆ (Multi-directional Images) และดวยรูปทิศทางตาง ๆ จะสามารถ
เก็บรายละเอียดไดมากกวา Sensor ทีเปนการบันทึกเปนทิศทางเดียว
นอกจากนีจ ้ ากภาพสี เราสามารถใชประโยชนจากเนื้อของภาพ (Texture)
อีกดวย เชน การ Visualization เปนตน
2. Global Positioning Systems (GPS) ใหคาพิกัด (Coordination) ของ

จุดเปดถาย (Shutter) ซึ่งสามารถคํานาณหาคาพิกัดบนภูมิ-ประเทศที่
ปรากฎอยูบนจุดภาพ (Pixel) ของภาพโดยใชคาพารามิเตอรที่ไดจากการ
Calibration หาความสัมพันธเชิงที่ตั้งระหวาง INS, GPS และ จุดเปดถาย
(Shutter) จากหองทดลอง
3. Inertia Navigation Systems (INS) ใน Stabilizer นอกจากจะรักษา

สมดุลยของกลองในขณะที่ทําการบันทึกภาพ แลวยังสามารถชี้การหมุน
(Rotation) ของจุดเปดถาย (Shutter) ซึ่งคาการหมุน (Rotation) จะได
ชวยความถูกตองทางตําแหนงดีขึ้น
77
4. การบันทึกภาพจาก Sensor ที่ติดตั้งบน Helicopter ทําใหสามารถทํา
การบินบันทึกถายรูปดวยความเร็วและความสูงบินที่ต่ํากวาเครื่องบิน ซึ่งที่
กอใหเกิดประโยชน และสามารถผลิตภาพที่มีลักษณะ Seamless
ประโยชนตางที่ไดอธิบายมาแลวในขั้นตน สามารถสรุปและแสดงในรูปที่
17
รูปที่ 17 ประโยชนของ Three line scanner Image จากอุปกรณตางๆของ

Sensor
จากประโยชนดังกลาวจะเกิดคําถามวา ทําไมภาพชนิดนี้จึงเหมาะสมกับการ
คนหารถ ดังนั้นจะขออธิบายถึงความเหมาะสมดังกลาวโดยพิจารณาจาก
คุณสมบัติตางๆ ของ TLS ดังตอไปนี้
1. เมื่อพิจารณาวา ภาพ TLS สามารถใหความละเอียดของภาพสูงยิ่ง

(Ultra-High Resolution) ในระดับ 3-5 เซนติมิเตอร ดังนั้นดังจึงเหมาะกับ
การคนหาและระบุรถยนตจากภาพดังกลาว เพราะวา ภาพ TLS สามารถให
รายละเอียดหรือขอมูล (Information) ที่มีเพียงพอที่จะสามารถประยุกตรูป
จําลองทางคณิตศาสตรของการคนหารถได เนื่องสามารถอธิบายขนาดหรีอ
รายละเอียดของรถ เชน กระจกหนา ได ในขณะที่ภาพถายทางอากาศชนิด
อื่นไมสามารถใหรายละเอียดดังกลาวได
2. เมื่อพิจารณาวา ภาพ TLS ทีมีลักษณะภาพ Seamless หมายถึง ภาพที่

ถายตามยาวและตอเนื่อง ทําใหสามารถคนหาวัตถุบนวัตถุที่มีปนเสนตรง
78
เปนระยะทางยาว (Linear Ground Object) เชน ถนนหรือแนวคลอง
ชลประทาน เปนตน
รูปที่ 18 Ultra-high Resolution และ Seamless Image
3. เมื่อพิจารณา ภาพTLSนั้นเปนภาพที่มีสวนซอนทับจากการถายตางมุมใน
เวลาเดียวกัน เราทําการรังวัดความสูงของวัตถุที่อยูนิ่ง (Static Object)
เชน รถหยุด (Stopping Vehicle) โดยเทคนิคการสราง 3 มิติจากภาพคู
ซอน (Stereoscopic Measurement)
รูปที่ 19 การสราง 3 มิติจากภาพคูซอน (Stereoscopic Measurement

เพื่อการคนหารถหยุด
4. ถาเราใชการรังวัดหรือสํารวจซ้ํา (Repeated Observation) บนพื้นที่

เดียวกันจากภาพถายตางมุม (Multi-line images) ทําใหเราสามารถคนหา
79
วัตถุที่มีการเคลื่อนที่ (Dynamics Objects) เชน รถที่กําลังเคลื่อนที่
(Moving Objects) ในขณะที่เราทําการบันทึกภาพ
รูปที่ 20 การรังวัดซ้ํา (Repeated Observation) จากรูปตางมุมจากชุด

เดียวกันของภาพ TLS
จากประโยชนดังกลาวเราสามารถนําภาพ TLS มาใชคนหาและแยกประเภท

ของรถในบางลักษณะดังที่จะไดแสดงรายละเอียดตอไป
รูปที่ 21 Systematic diagram of Vehicle monitoring by using Three

Line Scanner
3.2.2 สมมุติฐานของรถ
80
สําหรับรถในการศึกษานี้ เราไดตั้งสมมุติฐานของรถชนิดตางๆดังตอไปนี้
1. รถในการศึกษาของเราคือ รถที่อยูบนถนน และ ทิศทางของรถขนานกับ
ถนน
2. รถหยุดคือรถที่ปรากฏอยูในรูปทั้ง 3 ทิศทาง: ทิศหนา, ทิศทางดิ่งตรง
และ ทิศทางหลังในภาพชุดเดียวกัน ในขณะที่รถที่มีการเคลื่อนที่จะปรากฏ
เพียงรูปใดรูปหนึ่งของภาพชุดเดียวกัน
3. รถหยุดจะประกอบดวยรถที่จอดเปนเวลานานและรถที่หยุดชั่งคราวเพื่อ
ธุระหรือหยุดเพื่อรอสัญณาณไฟเขียว
3.2.3 หลักการทํางานของระบบการคนหารถยนตจากภาพ TLS จะได

ประกอบ 5 ขั้นตอนที่จะไดแสดงใหรายละเอียดดังตอไปนี้
รูปที่ 22 Flowchart of Pre-Processing
1. Preprocessing เปนขั้นของการเตรียมขอมูลดังตอไปนี้
การกําหนดพื้นที่สนใจ (Region of Interest (ROI)) ในที่นี้ เรากําหนด

ROI คือ ถนนอันเปนที่ตั้งของรถยนตตางๆ ดังนั้น เพื่อจะลดเวลาของการ
ประมวลลง เราไดทําการปด (Masking) พื้นที่นอก ROI ซึ่งสามารถทําโดย
วิธีมือหรือวิธี Semi-Automatic Masking ที่กําลังทําการพัฒนาอยู จาก
กระบวนการนี้ ทําใหเราสามารถทราบถึงพื้นที่ของถนนและทิศทางของถนน
ในภาพ TLS ที่เปนฐานในการคํานวณ
81
Road Boundary Road Direction
รูปที่ 23 พื้นที่ของถนนและทิศทางของถนนในภาพ
หลังจากหลังแลวเราจะไดภาพที่มีเพียงถนน หรือ ROI จากขั้นตอนที่แลว

เราจะไดนําภาพที่มีเพียงถนน หรือ ROI มาทําการ Segment โดยวิธีการ
Region growing ทําใหเกิด Region ใน ROI ญซึ่งจะประกอบดวย Region
ของรถ, Regionของพื้นผิวถนน ตลองจน Region ของเครื่องหมายตางๆบน
พื้นผิว
Raw TLS
image
Undersegmentation
Segmented Region Growing
image Segmentation
Noise
Noise and
Under- Erosion Operation
segmented Nearest Interpolation
image
Cleaned
Image
รูปที่ 24 การทํา Segmentation ดวยวิธี Region Growing
ในขั้นตอไปคือการรัดรูป Polygon สีเหลี่ยมบลอมรอบ Region ตางๆ หรือ

Rectangular Polygon Fitting ใน ROI สําหรับ Polygon Fitting นี้พัฒนา
82
จากการนําหลักการดพื้นฐานตางๆของ Image Processing มารวมกัน
(Integration) เชน Radon Transformation, Scanning เปนตน ในที่สุด
เราสามารถวัดพารามิเตอรหลายตัว เชน ความกวาง, ความยาว หรือ การ
หมุนของ Region ตางๆ
รูปที่ 25 การทํา Rectangular Polygon Fitting
เมื่อใชพารามิเตอรเหลานั้นเปรียบเทียบกับขนาดรถยนตจากฐานขอมูลจาก
Internet ดังนั้น เราจึงสามารถแยก Region ที่ไมใชรถและมีขนาดใหญกวา
ขนาดรถยนตจากฐานขอมูล ซึ่งเปนขั้นสุดทายของ Pre-processing โดยจะ
ไดผลลัพธดังตอไปนี้คือ Region ตางๆที่คาดวาจะรถและสวนประกอบของ
มันและเครื่องหมายบนผิวถนน
83
รูปที่ 26 ผลลัพธของการ Mask บนพื้นที่ไมใชรถ
2. Discrimination of Stopping/Moving Vehicles
ผลลัพธจาก Pre-Processing จะประกอบไปดวย Regionที่เปนประกอบของ

รถเคลื่อนและรถหยุดตลอดจน Region ที่เปนสวนของเครื่องหมายบนถนน
ตางๆ ดังนั้นในกระบวนการนี้ เราจะทําแยก Region ดังกลาวออกเปน 2
ชนิด คือ Regionทีเปนสวนประกอบของรถหยุดเปนชนิดแรก และ ชนิดหลัง
คือ Regionทีเปนสวนประกอบของรถเคลื่อนที่และเครื่องหมายบนผิวถนน
โดยที่เราไดตั้งสมมุติฐานดังตอไปนี้ “ความสูงของรถหยุดสามารถคํานวณ
ไดจาก Stereo Matching จากภาพ TLS ที่ตางมุม ในขณะที่เราไมสามารถ
คํานวณหาความสูงของรถที่เคลื่อนที่ได”
รูปที่ 27 เงื่อนไขในการแยกรถเคลื่อนที่และรถหยุด
ดังนั้น เราจึงนําหลักการของ Stereo matching มาประยุกตในการ

คํานวณหาความสูงของ Region ตางๆบนพื้นผิวถนน นอกจากเราสามารถ
หาความสูงไดแลวยังสามารถระบุดีกรีความเหมือนกันของวัตถุที่เราทําการ
เปรียบเทียบความเหมือนของวัตถุที่ทําการจับคู (Matching) เราเรียกวา
Correction coefficient หรือ สัมประสิทธิ์ความสัมพันธรวมที่มีคาระหวาง 0
ถึง 1 ซึ่งมีหลักการทํางานเหมือน Template matching ที่ไดอธิบายใน
84
รูปที่ 28 Stereo Matching for Height Calculation
เพื่อทําการแยก Region ตางๆที่เปนประกอบของรถเคลื่อนและรถหยุด เรา

สามารถทําไดกําหนดคา Thresholding และใชคาดังกลาวในการแยก
สําหรับ Thresholding นี้จะประกอบดวยความสูงของรถที่จะตองสูงกวาพื้น
ถนนและ สัมประสิทธิ์ความสัมพันธรวม (Correction coefficient หรือ CC)
ซึ่งโดยทั่วไป CCของวัตถุที่นิ่ง (Static Object) เชน รถหยุด จะมีคาเขา
ใกล 1 มาก (รูปที่ 29)
Vehicle-Likely Regions Stopping Vehicle-Likely Regions Moving Vehicle-Likely Regions
รูปที่ 29 ผลลัพธของการแยก Region ที่เปนรถหยุดและรถเคลื่อนที่ออก

จากกัน
85
3. Refinement of Stopping Vehicle
ในขั้นตอนนี้ เปนขั้นตอนในการรวม Regionที่เปนประกอบมาเปนตัวรถ

(Refinement of Stopping Vehicle) สําหรับในขั้นแรก เราจะไดนํา
Regionที่ดังกลาวที่อยูติดกันมาเชื่อมติดกันโดยใชการทํา Clustering ชนิด
Nearest Neighborhood ทําใหเกิด Stopping Vehicle Candidate และใน
ขั้นตอมา Stopping Vehicle Candidate จะทําถูกทดสอบตามคุณสมบัติ
ของรถตามรูปจําลองทางคณิตศาสตรของรถ (Vehicle model) เฉพาะ
Stopping Vehicle Candidate ที่สอดคลองกับรูปจําลองนัน ้ จะถูกนิยาม
เปนรถหยุด
Stopping Vehicle-Likely Regions Stopping Vehicle Candidate
รูปที่ 30 การ Clustering ชนิด Nearest Neighborhood เพื่อสราง

Stopping Vehicle Candidate
86
Detected Stopping Vehicle
( As Stopping Vehicle Candidate
Agrees with stopping vehicle model)
Non Stopping Vehicle

(As Stopping Vehicle Candidate does
not Agree with stopping vehicle model)
รูปที่ 31 ผลลัพธของรถหยุดในกระบวนการ Refinement of Stopping

Vehicle
4. Discrimination of Parking/Signal-Waiting Vehicles
ดวยการใชผลลัพธของรถหยุด ในขั้นนี้เราสามารถแยกประเภทของรถหยุด
เปน 2 ประเภทคือ รถที่จอดเปนเวลาและรถที่หยุดเพื่อรอ โดยที่ไดใชเงื่อน-
ไขที่ไดรับการพัฒนาจากขอมูลที่เราจากการสังเกตุพฤติกรรมของการจอด
รถ ณ. ที่ชองจอดรถบนถนนและ การจอดเพื่อรอสัญณาณไฟเขียว ซึ่งเรา
พบวา “จากการสังเกตุบนถนนสายหลักในกรุงโตเกียว ประเทศญี่ปุน การ
จอดรถเปนเวลานานในที่จอดรถ ผูขับรถนั้นจะจอดรถชิดขอบถนน ในขณะที่
การจอดรถที่รอสัญณาณไฟเขียว” ดังนั้นถาเรากําหนดระยะคงที่เปนคาคา
หนึ่งเพื่อใชในการแยกชนิดของรถหยุด โดยถาเราทําการวัดระยะที่ตั้งฉาก
จากขอบถนนไปยังpolygonของรถหยุดใดๆ แลวเปรียบเทียบระยะที่ตั้ง-
ฉากกับระยะคงที่ ในกรณีที่ระยะที่ตั้งฉากมีนอยกวาหรือเทากับระยะคงที่
เราสามารถนิยามรถหยุดคันดังกลาวเปนรถที่จอดเปนระยะเวลานานในภาพ
TLS ชุดกลาว นอกจากนั้นแลวเราจะใหรถหยุดที่มีระยะตั้งฉากที่มีคา
มากกวาระยะคงที่ เราจะจัดรถหยุดคันดังกลาวอยูในชั้นรถที่หยุดเพื่อรอ
สัญณาณไฟเขียว โดยที่เงื่อนไขและตัวอยางของการแยกประเภทของรถ
หยุดจะไดอธิบายในรูปที่ 32 และ 33 ตามลําดับ
87
Dt =30 pixel
P1
o n ic le
l yg eh
.
Po d V
pe
op
P2
St
Dr
Stopped Vehicle is parked vehicle

if Dr <= Dt
รูปที่ 32 เงือนไขของการแยกประเภทของรถหยุด
Parked Vehicle Idling Vehicle
รูปที่ 33 ผลลัพธ Parked and Idling Vehicle Detection ตามลําดับ
88
5. Refinement of Moving Vehicle
สําหรับกระบวนสุดทายในงานวิจัยนี้ก็คือ การสรางตัวรถที่เคลื่อนที่จาก
Region ที่คาดวาจะเปนสวนประกอบของรถที่เคลื่อนที่ในชุดภาพ TLS ใดๆ
สําหรับการทํางานของกระบวนนี้จะเริ่มจาก ในแรกตอนแรก การนํา Region
ที่คาดวาจะเปนชิ้นประกอบของรถที่เคลื่อนแตอยางก็ตาม Region ดังกลาว
ยังประกอบดวย Regionที่เปนสวนเล็กๆของเครื่องหมายบนผิวถนน ซึ่งเรา
สามารถทําการแยก Regionที่เปนสวนเล็กๆของเครื่องหมายบนผิวถนน ได
โดยการใช Thresholding ซึ่งพัฒนาจากคาความสูงและCorrection
coefficient (CC) หรือ สัมประสิทธิ์ความสัมพันธรวมโดยปกติ Region
ดังกลาวจะมีการความสูงที่ต่ํากวารถแตให CC สูงเนื่องจากเครื่องหมาย
ตางๆบนผิวถนน เปนวัตถุนิ่ง (Static Object) เมื่อเราแยก Region ที่เปน
เครื่องหมายตางๆบนผิวถนนออกแลว Regionที่เหลือเพียงเปนชิ้นประกอบ
ของรถที่เคลื่อน เราจะใช Region เหลานี้เปน Seeding Point หรือ จุด
กําหนดในการสรางหรือการประกอบตัวรถที่เคลื่อนที สําหรับในขั้นตอนที่
สอง เราเรียกวา Expansion โดยเริ่มจากใช Seeding Point ขยายและรวม
กับ Regionของรถเคลื่อนที่อยูติดกับ Seeding Point นั้นโดยใชเงื่อนไข
ของการขยายและรวมนั้นจะตองไปตามทิศทางของถนน เมื่อ Seeding
Point และ Region รวมกันแลวจะเรียกวา Moving Vehicle Candidate ใน
ตอนสุดทาย Moving Vehicle Candidate จะถูกทดสอบกับ Moving
Vehicle Model ถา Moving Vehicle Candidate ยอบรับกับ Moving
Vehicle Model เราก็นิยาม Moving Vehicle Candidate เปนรถที่เคลื่อนที่
และทําการขยาย Seeding point จาก Region ที่เหลือจน Region ไมเหลือ
โดยที่กระบวนการ Refinement of Moving Vehicle และผลลัพธจะแสดง
ในรูปที 34 และ 35 ตามลําดับ
รูปที่ 34 กระบวนการของการ Refinement of Moving vehicle detection
89
รูปที่ 35 ผลลัพธ Moving Vehicle Detection ตามลําดับ
สรุป
จากที่ไดแนะนําความรูพื้นฐานของ Image processing ทั้งหมด ผูแตงหวัง

วา ผูอานจะไดนําไปเปนแนวทางในการนําไปประยุกตใชวิชาการประมวลผล
ทางภาพ Image processing ในงานตางๆในสาขาวิชาชีพของทานผูอาน
อันจะกอใหเกิดประโยชนไมมากก็นอยในโอกาศตอไป
อางอิง
Definition of Image Classification

http://aria.arizona.edu/courses/tutorials/class/html/classwhyp1.ht
ml
Discrimination Function
http://www.biorecipes.com/Classific/code.html
Unsupervised Classification
http://deathstar.rutgers.edu/courses/remsens/rem_cpe_1/remsens
ing6/sld015.htm
Desheng Liu, Lecture 8:Image Classification, PubHlth 274: GIS and

Remote Sensing in Public Health, Dept. of Environmental Science,
Policy & Management, University of California, Berkeley, March 1,
2005
Sompoch Puntavungour, Assignment3: Maximum Likelihood

Classification, Remote Sensing Course, Department of Civil
Engineering, The University of Tokyo, 2002
90
Sompoch Puntavungkour, Master Thesis: Asian Institute of
Technology, August 2000
Sompoch Puntavungkour, Doctoral Dissertation: The University of

Tokyo, September 2004
Shuji Murai, Unsupervised Classification: Lecture note on Remote

Sensing, CD-ROM, 1999
91

เอกสารภาษาไทย Image Processing 6

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

เอกสารภาษาไทย Image Processing 6

Uploaded by

Copyright:

Available Formats

Image Processing6: Image Understanding and

ในบทสุดทายนี้ จะไดกลาวถึงการระบุหรือจําแนกวัตถุในรูป (Object

ในการสํารวจระยะไกล Classification คือ การจัดกลุมของวัตถุตางๆในภาพ

รูปที่ 1 Processing Procedure of Classification

2.1 ความรูพื้นฐานสําหรับการ Classification

เพื่อใหสามารถเขาใจ Classification ไดดีขึ้น เรามีความจําเปนที่จะตอง

โดยความตามรูปแลว Discrimination Function หมายถึง ฟงกชั่นการแยก

a 1 x 1 + a 2 x 2 + ... + a n x n > x 0 (1)

a 1, a 2 , … ,a n เปน Variable ที่เกี่ยวกับ x 1, x 2, …, n เปนคา Observation

(Ax > x 0 ) equiv B (2)

โดยที่ Ax= a 1 x 1 + a 2 x 2 + ... + a n x n และ B= Class ที่ใชในการ

รูปที่ 2 การทํางานของ Discrimination Function

จากรูปดังกลาวจะเห็นไดวา เราใชสมการเสนตรงในการแยกวัตถุ 2 ชนิด

โดยทั่วไป Classification ที่นิยมในการสํารวจระยะไกล เราสามารถแบงได

Supervised Classification หมายถึง การจําแนกรายละเอียดใชการคํานวณ

แตในที่นี้ จะขอยกตัวอยาง Supervised Classification ที่นิยมใชกันอยาง

Maximum likelihood Classification เปนวิธีหนึ่งที่นิยมใชใน Remote

รูปที่ 3 Maximal Likelihood Classification

โดยทั่วไปเรานิยาม Maximal Likelihood ในรูปของ the probability

โดยที่ n: number of bands

รูปที่ 5 Original Image เปนถายดาวเทียม Aster

รูปที่ 7 ผลลัพธของการ Maximum likelihood Classification

Unsupervised Classification หมายถึง การจําแนกรายละเอียดดวย

สําหรับ Unsupervised Classificationมีหลายชนิดที่นิยมใชในงานทางการ

ISODATA (Iterative Self-Organization Data Analysis Technique)

เพื่อใหเกิดความเขาใจกระบวนการทํางานของ ISODATA ใหชัอเจนมากขึ้น

Calculation of the center of

Correct the center of

Removal of the minimum

The clustering is Yes

Merging Division Stop

รูปที่ 8 Flowchart of ISODATA classification

รูปที่ 10 Classified Image with ISODATA unsupervised classification

3. Man-made Object Extraction

3.1 Traffic Sign Recognition from Gray-Scale Image

ตัวอยางที่จะไดอธิบายดังตอไปนี้ซึ่งเปน Man-made object Recognition

3.1.1 Template Matching

Template matching หมายถึง การตรวจสอบชนิดของวัตถุที่เราทราบ

รูปที่ 11 Parabolic curve of Coefficient Correlation

แตสําหรับในการศึกษานี้ขนาดของ Master และ Template เทากัน ดังนั้น

3.1.2 วิธีการของการระบุชนิดปายสัญณาณจากภาพ (Methodology for

รูปที่ 12 Systematic diagram of Road Sign Recognition

การทํางานของระบบ Road Sign Recognition เริ่มดวยในขั้นตอนแรก จะ

Road Sign The image that is pre- processed

รูปที่ 13 Template matching ในการทํา Road Sign Recognition

Result of traffic Geo-Corrected

รูปที่ 14 ผลลัพธของ Road Sign Recognition

The Normalized Euclidean Distance

รูปที่ 15 Sign Recognition Result

3.2 Vehicle Detection from Three Line Scanner Imagery

สําหรับอีกอยางของ การทํา Man-made Object Extraction ซึ่งมีความ

3.2.1 ความรูเกี่ยวกับ Three Line Scanner (TLS)

เมื่อไมนานมานี้ (ชวงค.ศ. 1999) บริษัท Starlabo จํากัดแหงประเทศญี่ปุน

จากคุณลักษณะ Three Line Scanner ที่ไดอธิบายมาแลว เราสามารถแบง

1. Multi-line CCD camera สามารถผลิตรูปถายที่ความละเอียดสูงยิ่ง

2. Global Positioning Systems (GPS) ใหคาพิกัด (Coordination) ของ

3. Inertia Navigation Systems (INS) ใน Stabilizer นอกจากจะรักษา

รูปที่ 17 ประโยชนของ Three line scanner Image จากอุปกรณตางๆของ

1. เมื่อพิจารณาวา ภาพ TLS สามารถใหความละเอียดของภาพสูงยิ่ง

2. เมื่อพิจารณาวา ภาพ TLS ทีมีลักษณะภาพ Seamless หมายถึง ภาพที่

รูปที่ 18 Ultra-high Resolution และ Seamless Image

รูปที่ 19 การสราง 3 มิติจากภาพคูซอน (Stereoscopic Measurement

4. ถาเราใชการรังวัดหรือสํารวจซ้ํา (Repeated Observation) บนพื้นที่

รูปที่ 20 การรังวัดซ้ํา (Repeated Observation) จากรูปตางมุมจากชุด

Vehicle-Likely Regions Stopping Vehicle-Likely Regions Moving Vehicle-Likely Regions

Stopping Vehicle-Likely Regions Stopping Vehicle Candidate

Non Stopping Vehicle

Parked Vehicle Idling Vehicle