Download as pdf or txt
Download as pdf or txt
You are on page 1of 30

ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG TP.

HCM
KHOA HỆ THỐNG THÔNG TIN – VIỄN THÁM

THỰC HÀNH VIỄN THÁM


Bài 6: Phân loại ảnh vệ tinh quang học

Giảng viên: ThS. Đoàn Thị Tố Uyên


Email: uyendtt@hcmunre.edu.vn

Hồ Chí Minh, tháng 4 năm 2018 1


NỘI DUNG

 Lý thuyết: Phân loại ảnh vệ tinh


 Thực hành 1: Phân loại không giám sát ảnh vệ tinh
quang học theo phương pháp ISODATA
 Thực hành 2: Phân loại giám sát ảnh vệ tinh quang
học theo phương pháp Maximum Likelihood
 Thực hành 3: Tính toán độ chính xác sau phân loại

2
LÝ THUYẾT

3
1.1. Phân loại ảnh vệ tinh

Phân loại ảnh số là việc phân loại và sắp xếp các pixel trên ảnh
thành những nhóm khác nhau dựa trên một số đặc điểm chung
về giá trị độ xám, sự đồng nhất, mật độ, tone ảnh,… Có hai
kiểu phân loại chính:
 Phân loại không giám sát (Unsupervised classification):
Isodata và K-mean
 Phân loại giám sát (Supervised classification):
Parallelepiped, Maximun Likelyhood, Minimum Distance,
Mahalanobis Distance, Binary Encoding và Spectral Angle
Mapper

4
1.2. Phân loại ảnh vệ tinh – Không giám sát

Với phương pháp này:


 Các pixel sẽ được phân chia tự động vào các lớp dựa trên
một số đặc điểm về sự đồng nhất giá trị phổ.
 Sau khi phân chia tự động các pixel vào các lớp, các lớp
chưa được gán tên lớp do không có thông tin về lớp đó.
 Bằng cách thu thập thêm thông tin về lớp phân loại bằng
phương pháp thực địa, hoặc quan sát thủ công, các lớp
phân loại được đặt tên dựa theo thực tế.
 Phương pháp này loại bỏ sai số chủ quan của con người

5
1.3. Phân loại không giám sát - ISODATA

 Phân loại sẽ tự động xem xét cách thức phân lớp dữ


liệu không gian, nhóm đi nhóm lại các pixel bằng
phương pháp Khoảng cách tối thiểu (Minimum
Distance).
 Mỗi lần nhóm lại các lớp này, máy tính sẽ tự động
tính toán lại cách thức phân lớp và phân loại lại các
pixel theo cách thức phân lớp mới.
 Quá trình lặp đi lặp lại cho đến khi số các pixel trong
mỗi lớp nhỏ hơn ngưỡng thay đổi đã chọn hoặc số lần
lặp đạt tối đa.

6
1.3. Phân loại không giám sát - ISODATA

Một số lần chạy lặp của phân loại ISODATA 7


1.4. Phân loại ảnh vệ tinh – Có giám sát
Với phương pháp này:
 Ảnh được phân loại dựa trên các pixel mẫu đã được chọn sẵn bởi người
phân tích. Bằng cách chọn mẫu, người phân tích đã chỉ ra giúp máy
tính những pixel có cùng một số đặc trưng về phổ phản xạ.
Tập hợp các nhóm pixel khác nhau được xác định tên gọi là khóa phân
loại.
 Phương pháp yêu cầu người dùng phải chọn vùng mẫu làm cơ sở phân
loại.
Mẫu làm cơ sở phân loại (Region Of Interest) là tập hợp các điểm, đường
hoặc vùng chứa pixel đã được xác định đặc điểm bởi người phân tích.
 Sau khi có khóa phân loại bao gồm nhiều lớp, máy tính sẽ so sánh và
phân bố những pixel tương đồng với lớp nào dựa vào giá trị độ xám
của pixel, có thể gán lớp cho pixel đó không.
 Có thể phân loại chính xác hơn theo mục đích mà người phân tích
muốn.
8
1.5. Phân loại có giám sát – Maximum Likelihood
 Phân loại theo phương pháp Hợp lý cực đại (Maximum
Likelihood) coi số liệu thống kê của mỗi lớp trong mỗi
kênh ảnh được phân tán một cách ngẫu nhiên theo phân
bố Poisson và có tính toán đến khả năng một pixel thuộc
một lớp nhất định.
 Nếu như không chọn một ngưỡng xác xuất thì phải phân
loại tất cả các pixel. Mỗi pixel được gán vào lớp mà xác
xuất pixel đó thuộc về lớp đó là lớn nhất.
 Việc tính toán không chỉ dựa vào khoảng cách mà còn dựa
vào xu thế biến thiên độ xám trong mỗi lớp.
 Đây là phương pháp phân loại chính xác nhưng mất nhiều
thời gian và phụ thuộc vào sự phân bố chuẩn của dữ liệu.
9
1.5. Phân loại có giám sát – Maximum Likelihood

Phân bố ngẫu nhiên Poisson của các lớp giá trị Phân bố ngẫu nhiên Poisson của các lớp giá trị
tán xạ ảnh vệ tinh trong một kênh ảnh tán xạ ảnh vệ tinh giữa 2 10kênh ảnh khác nhau
10
THỰC HÀNH 1

11
2.1. Các bước chính phân loại không giám sát
Ảnh vệ tinh quang học

Unsupervised
classification

Ảnh phân loại không giám sát Tham khảo Điểm


tự động bao gồm các lớp để xác định khảo sát
phân loại chưa được xác định tên lớp mặt đất

Ảnh phân loại không giám sát


đã được xác định đặc điểm

Tính toán độ chính xác sau Khóa kiểm


phân loại tra 12
2.1. Phân loại không giám sát ISODATA
Bước 1: Mở ảnh RGB và NIR của ảnh vệ
tinh Landsat
Cắt lấy một khu vực mà em thích có
kích thước là (3000x3000)
Lưu ảnh đã cắt vào folder của em.
Bước 2: Phân loại không giám sát bằng
phương pháp ISODATA
Trên thanh công cụ, chọn Classification
 Unsupervised  IsoData
Bước 3: Lựa chọn file cần phân loại
Trong cửa sổ Classification Input File,
click chọn file cần phân loại ở mục
Select Input File  OK 13
2.1. Phân loại không giám sát ISODATA
Bước 4: Ra điều kiện cho phân loại ảnh ISODATA
 Number of classes: chọn số lớp tối thiểu – Min
và tối đa – Max để phân loại
 Maximum Iterations: Số lần tính toán lặp lại tối
đa. Việc phân loại sẽ dừng lại khi đạt tới số lần
lặp tối đa đưa ra.
 Change threshold: Ngưỡng thay đổi sau mỗi lần
tính toán lặp lại. Việc phân loại cũng sẽ dừng
lại khi sau mỗi lần tính toán lặp lại, số phần
trăm biến động của các lớp nhỏ hơn ngưỡng
biến động được xác định.
 Minimum # Pixel in Class: Số pixel nhỏ nhất có
thể có của một lớp.

14
2.1. Phân loại không giám sát ISODATA
Bước 4: Ra điều kiện cho phân loại ảnh ISODATA
 Maximum Class Stdv: Ngưỡng độ lệch chuẩn tối đa của một lớp.
Nếu độ lệch chuẩn của một lớp.
 Minimum Class Distance: Khoảng cách tối thiểu giữa các giá trị
trung bình của các lớp. Nếu khoảng cách giữa các giá trị trụng
bình của các lớp nhỏ hơn giá trị nhập vào thì các lớp đó sẽ được
gộp vào
 Maximum Merge Pairs: Số tối đa của các lớp được gộp.
 Maximum Stdev From Mean: Khoảng cách độ lệch chuẩn tối đa
từ giá trị trung bình của lớp
 Maximum Distance Error: Khoảng sai số tối đa cho phép xung
quanh giá trị trung bình của lớp.
Bước 5: Chọn OK để phân loại.
15
2.1. Phân loại không giám sát ISODATA

Bước 6: Xem kết quả phân


loại
Từ của sổ Image Window 
Click chuột vào Overlay 
Chọn Classification
Quan sát số lớp có thể có sau Ảnh gốc Ảnh sau phân loại
phân loại.
Quan sát khu vực nghiên cứu
bằng ảnh màu RGB và đoán
xem các lớp đó có thể là
lớp gì.

16
2.1. Phân loại không giám sát ISODATA

 Bước 7: Gộp những lớp hiển thị các giá


trị giống nhau.
Tích chọn hai hay nhiều lớp cần gộp.
Trong cửa sổ Interactive Class Tool  Chọn
Options  Merge Classes
Quan sát ảnh sau khi gộp lớp.

Chú ý khi phân loại:


Cần phải cực kì tỉ mỉ và cẩn thận phân loại
nhiều lần, chọn lọc kĩ càng thì kết quả
phân loại mới mô phỏng đúng với thực tế.
Tránh trường hợp “Garbage in, Garbage
out”
17
THỰC HÀNH 2

18
2.1. Các bước chính phân loại có giám sát
Ảnh vệ tinh quang học

Điểm
Supervised Khóa đào
khảo sát
classification tạo/ ROI
mặt đất

Ảnh phân loại có giám sát với


các lớp đã được phân loại
dựa vào khóa đào tạo

Tính toán độ chính xác sau Khóa kiểm


phân loại tra 19
2.1. Xây dựng khóa đào tạo ROI – Regions of
Interest
Bước 1: Mở ROI để xây dựng khóa
đào tạo phân loại
Trên thanh công cụ, chọn Basic
Tools  Region Of Interest  ROI
Tool
Bước 2:Trong cửa sổ ROI Tool, ở
mục Window, tiến hành lựa chọn
cửa sổ để thao tác chọn vùng.
Cửa sổ chi tiết nhất dùng để chọn
vùng ROI là cửa sổ Zoom.
20
2.1. Xây dựng khóa đào tạo ROI – Regions of
Interest

Bước 3: Thay đổi vị trí quan sát


bằng các di chuyển ô vuông đỏ
ở các cửa sổ còn lại, trừ cửa sổ
để chọn vùng ROI.
Ví dụ: Nếu chọn Zoom Window
là cửa sổ để lấy mẫu ROI,
Thì di chuyển vị trí lấy mẫu
bằng cách dịch chuyển ô vuông
ở hai cửa sổ Image Window và
Scroll Window.
21
2.1. Xây dựng khóa đào tạo ROI – Regions of
Interest
Bước 4: Lấy mẫu ngẫu nhiên cho các
loại thảm che phủ đất có thể có.
 Đặt lại tên cho lớp che phủ bằng
cách kích đúp vào ROI name  Đổi
tên
 Tạo ROI cho thảm che phủ mới bằng
cách click vào New region.
 Xóa mẫu khi lấy mẫu bị sai.
Chọn hàng ROI name có chứa mẫu sai
 Chọn Go to để đi đến phần mẫu bị
sai ở lớp ROI đó  Delete Part.
 Xóa ROI bằng cách chọn Delete
ROI. 22

22
2.1. Phân loại giám sát Maximum Likelihood
Bước 1: Sau khi xây dựng khóa đào tạo
phân loại ROI, trên thanh công cụ. Để tiến
hành chạy phân loại giám sát, chọn
Classification  Supervised  Maximum
Likelihood.
Bước 2: Trong bảng Classification Input file,
chọn file ảnh muốn phân loại.
Spatial Subset: Khi chỉ muốn phân loại một
phần nhỏ của ảnh phân loại
Spectral Subset: Chọn tổ hợp kênh dùng để
phân loại.
Chú ý: Tối thiểu là 3 kênh.
Không nên dùng quá nhiều kênh sẽ giảm độ
chính xác phân loại.
Các kênh phân loại phải chứa đặc điểm có ý 23
nghĩa bổ trợ cho phân loại. 23
2.1. Phân loại giám sát Maximum Likelihood
Bước 3: Nếu đã lỡ tắt ROI, khi
phân loại giám sát phần mềm
báo chưa có ROI, yêu cầu phải
mở ROI lại trước khi phân loại.
Basic Tools  Region of
Interest  ROI Tools  File 
Restore ROI.
Bước 4: Sau khi chọn file cần
phân loại, bảng Maximum
Likelihood Parameters, chọn
ROI  Save file sau khi phân
loại  OK.
24
2.1. Phân loại giám sát Maximum Likelihood
Bước 3: Nếu đã lỡ tắt ROI, khi phân
loại giám sát phần mềm báo chưa có
ROI, yêu cầu phải mở ROI lại trước
khi phân loại.
Basic Tools  Region of Interest 
ROI Tools  File  Restore ROI.
Bước 4: Sau khi chọn file cần phân
loại, bảng Maximum Likelihood
Parameters, chọn ROI  Save file
sau khi phân loại  OK.
Bước 5: Trong Image Window, mở
bảng chứa các lớp phân loại.
Overlay  Classification
Quan sát các lớp phân loại và phân
bố không gian của các lớp phân loại.
25
THỰC HÀNH 3

26
2.1. Tính độ chính xác sau phân loại

Độ chính xác sau phân loại giám sát hoặc không giám sát
thường dựa vào chênh lệch thông tin che phủ giữa:
 Thảm che phủ do phân loại ảnh vệ tinh
 Thảm che phủ trong thực tế
Xem xét mức độ chênh lệch thông tin che phủ dựa vào:
Tập hợp các điểm thực địa (Ground truth point) mang thông
tin về lớp che phủ được thu thập từ thực tế (hoặc thông qua
một ảnh vệ tinh với độ phân giải lớn hơn mà ở đó thông tin
về thảm che phủ có thể quan sát được một cách rõ rang) với
vị trí tọa độ cụ thể.

27
2.1. Tính độ chính xác sau phân loại

Ma trận sai số (Error Matrix):


Ma trận thống kê sự sai lệch của thông tin thảm phủ trong
thực tế và từ phân loại ảnh vệ tinh. Các điểm thực địa trùng
khớp hoặc sai khác thông tin thảm phủ được thống kê tới
từng lớp thảm che phủ.
Sai số phần trăm (Overall accuracy):
Phần trăm sai lệch thông tin thảm phủ của các điểm thực địa.
Chỉ số Kappa (Kappa index):
Chỉ số sai lệch thông tin thảm phủ của các điểm thực địa
được tính theo công thức có sẵn. Có giá trị từ 0 1 (theo
Congalton) và từ -1  1 (theo Khan).
28
2.1. Tính độ chính xác sau phân loại
Ma trận sai số:

TRUE CATEGORY (THỰC TẾ) Total

(1) (2) (3) (4) (5) (6) (7) (8) (9)

(1) Đất trống 3 1 0 0 1 0 1 0 2 8

(2) Đồng cỏ và bãi tha ma 0 6 0 0 0 0 0 0 0 6


ASSIGNED CATEGORY (THEO PHÂN LOẠI)

(3) Đồng ruộng 0 0 16 0 2 0 1 0 1 20

(4) Khu dân cư đông đúc 0 0 0 12 0 0 0 0 0 12

(5) Đất trũng và đất ngập 0 0 0 0 5 0 0 0 0 5

nước

(6) Sông hồ 0 0 0 0 0 11 0 0 0 11

(7) Đường xá 0 0 0 2 0 0 4 0 2 8

(8) Bãi cát 0 0 0 0 0 0 0 1 0 1

(9) Khu dân cư đông đúc 0 0 0 0 0 0 0 0 16 16


29
Total 3 7 16 14 8 11 6 1 21 87
2.1. Tính độ chính xác sau phân loại
Chỉ số Kappa:

𝑟 𝑟
𝑁 𝑖=1 𝑥𝑖𝑖 − 𝑖=1 𝑥𝑖+ × 𝑥+𝑖
𝜅=
𝑁 2 − 𝑟𝑖=1 𝑥𝑖+ × 𝑥+𝑖

Trong đó: N là tổng số điểm thực địa đùng để tính toán sai số; r là số hàng

trong ma trận; xii là số điểm thuộc hàng i và cột i; x+i là tổng số điểm ở hàng i;

xi+ là tổng số điểm ở cột i (Congalton, 1991).

30

You might also like