Download as pdf or txt
Download as pdf or txt
You are on page 1of 31

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN ĐIỆN TỬ - VIỄN THÔNG

Báo cáo
Viễn Thám và GIS
Đề tài:
Đánh giá tính chính xác (Accuracy Assessment)

Sinh viên thực hiện: NHÓM 14


Đặng Thị Phượng
Nguyễn Thị Thu Thủy
Nguyễn Thị Thu Hương
Nguyễn Trần Quân
Trần Hữu Tùng

Giảng viên hướng dẫn: Thầy Phương Xuân Quang

Hà Nội, 10/2019
MỤC LỤC
MỤC LỤC ........................................................................................................................................................ 1

Danh mục bảng biểu và hình ảnh ................................................................................................................... 2

Phần 1. Khái niệm và ý nghĩa ......................................................................................................................... 3


1.1 Accuracy và Precision............................................................................................................................. 3
1.2 Ý nghĩa .................................................................................................................................................... 5

Phần 2. Nguồn gốc của lỗi phân loại .............................................................................................................. 6

Phần 3. Các đặc điểm lỗi ................................................................................................................................. 8

Phần 4. Measurement of Map Accuracy ...................................................................................................... 10

Phần 5. Giải thích ma trận lỗi ....................................................................................................................... 19

Phần 6. Kết luận ............................................................................................................................................. 26

Phần 7. Trả lời câu hỏi .................................................................................................................................. 27


Câu 4.1 ........................................................................................................................................................ 27
Câu 4.2 ........................................................................................................................................................ 27
Câu 4.3 ........................................................................................................................................................ 27
Câu 4.4 ........................................................................................................................................................ 28
Câu 4.5 ........................................................................................................................................................ 28
Câu 4.6 ........................................................................................................................................................ 28
Câu 4.7 ........................................................................................................................................................ 28
Câu 4.8 ........................................................................................................................................................ 28
Câu 4.9 ........................................................................................................................................................ 28
Câu 4.10 ...................................................................................................................................................... 29
Câu 4.11 ...................................................................................................................................................... 29
Câu 4.12 ...................................................................................................................................................... 29
Câu 4.13 ...................................................................................................................................................... 29
Câu 4.14 ...................................................................................................................................................... 29

1
Danh mục bảng biểu và hình ảnh
Hình 1.1. Độ lệch và Precision .............................................................................................. 4
Hình 2.1. Những vùng điểm ảnh biên .................................................................................... 7
Hình 3.1. Các mẫu lỗi ............................................................................................................ 9
Hình 4.1. Độ chính xác không cụ thể .................................................................................. 11
Hình 4.2. Trang web chính xác cụ thể ................................................................................. 12
Hình 4.3. Đánh giá độ chính xác kích thước ....................................................................... 14
Hình 5.1. Ma trận minh họa k .............................................................................................. 23

Bảng 4-1. Ma trận lỗi ........................................................................................................... 15


Bảng 4-2. Accuracy Assessment Data ................................................................................. 17
Bảng 4-3. Ma trận lỗi từ Map 1 (bảng 4.2) .......................................................................... 18
Bảng 5-1. User's and producer's accuracies từ bảng 4.3 ...................................................... 20
Bảng 5-2. Tính tổng hàng và cột sử dụng bảng 3 ................................................................ 22
Bảng 5-3. Đường chéo McNemar’s Test ............................................................................. 24
Bảng 5-4. Dữ liệu đánh giá độ chính xác cho MCNemar Test ............................................ 24

2
Phần 1. Khái niệm và ý nghĩa
Ngày nay việc sử dụng dữ liệu và bản đồ trên mạng trở nên phổ biến, những bản đồ
này sử dụng hình ảnh viễn thám đưa ra cái nhìn khá tự nhiên và người dùng chúng ta vẫn
hay đặt ra câu hỏi về tính chính xác của chúng. Tuy nhiên các câu hỏi về độ chính xác rất
khó để giải quyết một cách thuyết phục. Trong phần này chúng ta sẽ tìm hiểu cách đánh
giá độ chính xác của một bản đồ và cách so sánh hai bản đồ để biết chúng có khác biệt về
mặt thống kê hay không.

1.1 Accuracy và Precision

Accuracy xác định tính chính xác, khi so sánh một bức ảnh chuẩn với một
bức ảnh đã được phân loại nhưng không rõ chất lượng, nếu hình ảnh được phân loại
tương quan chặt chẽ với chuẩn thì đó được gọi là chính xác. Có một số phương
pháp để xác định sự tương quan nói trên, tất cả được mô tả trong phần sau.

Precision là thước đo về độ chính xác của phép đo (hình 1.1). Trong viễn
thám, precision có 2 ý nghĩa: (1) quyết định phân loại bản đồ và (2) khoảng tin cậy
trong đó ước tính độ chính xác của bản đồ hoặc khu vực được bao hàm. Đối với các
biến liên tục, chẳng hạn như sinh khối trên mặt đất hoặc độ sâu Secchi (thước đo độ
trong của nước) thì được biểu diễn bằng sai số trung bình bình phương gốc hoặc sai
số chuẩn của công cụ ước tính. Tuy nhiên, trong cả hai trường hợp, việc tính toán
khoảng tin cậy nằm ngoài phạm vi chúng ta đang tìm hiểu nhưng các kỹ thuật đã
được dựng. Liên quan đến quyết định phân loại, người ta có thể tăng accuracy bằng
việc giảm precision (còn được gọi là phân loại không rõ ràng). Ví dụ, khi phân loại
hàng cây vào các lớp như rừng, rừng lá kim, rừng thông, rừng thông lá ngắn, rừng
thông lá ngắn trưởng thành, khi tính chi tiết càng tăng lên thì càng có khả năng có
lỗi (rõ ràng là khi phân loại các lớp chi tiết chính xác khó khăn hơn là gán vào các
lớp chung).

Thống kê cho thấy rằng, accuracy cao có nghĩa là độ lệch (bias) thấp (giá trị
ước tính rất gần với giá trị tham chiếu chuẩn), precision cao nghĩa là độ biến thiên
của các ước tính đó thấp (không phụ thuộc vào độ lệch của chúng). Tính hữu ích
của bản đồ không chỉ liên quan đến tính chính xác (accuracy) mà còn là độ chính

3
xác (precision) trong đó người dùng có thể khẳng định về địa điểm cụ thể trong bản
đồ. Một bản đồ chỉ cung cấp các lớp chung chung (ngay cả khi chính xác) thì người
dùng chỉ có thể đưa ra những kết luận mơ hồ về địa điểm trên bản đồ đó.

Hình 1.1. Độ lệch và Precision

Trên hình 1.1 accuracy bao gồm cả độ lệch và precision. Ở sơ đồ trên cùng, sự khác
biệt giữa giá trị thực và giá trị ước tính tạo ra sai lệch, sơ đồ bên dưới minh họa khái
niệm về precision, sự biến thiên cao của các ước tính dẫn đến precision thấp và
ngược lại.

4
1.2 Ý nghĩa
Accuracy có nhiều ý nghĩa thực tế; ví dụ như nó ảnh hưởng đến vị trí pháp lí
của bản đồ và các báo cáo có nguồn gốc từ dữ liệu viễn thám, tính hữu ích của dữ
liệu cho quản lí đất đai, tính hợp lệ của chúng để làm cơ sở cho nghiên cứu khoa
học. Tuy nhiên có rất ít nghiên cứu có hệ thống về accuracy tương đối của phân loại
thủ công và phân loại máy, về các thuật toán tiền xử lí và phân loại thay thế, hoặc
về độ chính xác liên quan đến các hình ảnh khác nhau của cùng một khu vực. Kết
quả là các nghiên cứu về accuracy sẽ có ý nghĩa ở cả lý thuyết và thực tiễn trong
viễn thám.
Mọi người thường đánh giá tính chính xác từ sự xuất hiện cảu bản đồ dựa
vào kinh nghiệm trong quá khứ hoặc từ kiến thức cá nhận về khu vực được thể hiện.
Những điều này có thể dẫn đến hiểu lầm vì tính chính xác nói chung có thể không
liên quan đến thẩm mỹ của bản đồ, và thường thì kinh nghiệm cá nhận không tránh
khỏi bị giới hạn. Thay vào đó accuracy cần được đánh giá thông qua phép đo định
lượng và so sánh với hình ảnh thay đổi của cùng một khu vực.
Đánh giá tính chính xác của thông tin thu được từ viễn thám đã được quan
tâm từ lâu, nhưng một mối quan tâm mới về tính chính xác của phân loại kĩ thuật số
đã thúc đẩy nghiên cứu về độ chính xác. Những phân loại máy thông thường trở nên
trừu tượng vì nó không thể được chấp nhận nếu không có bằng chứng.
Người dùng không nên chấp nhận tính hợp lệ của bất kì loại bản đồ nào bất
kể nguồn gốc hay diện mạo nếu không có bằng chứng về tính hợp lệ.

5
Phần 2. Nguồn gốc của lỗi phân loại
Những lỗi xảy ra trong bất kì trường hợp phân loại nào. Giải thích một cách
thuần túy, những lỗi được gây ra do bởi sự xác định sai về mặt phân chia, sự khái
quát quá mức, sự thay đổi chi tiết trong quá trình biểu diễn và các yếu tố tác động
khác. Nguyên nhân đơn giản nhất của lỗi sai liên quan đến sự phân bổ sai về các
loại thông tin trong các loại phổ (chương 12). Đá Granite trong khu vực núi, ví dụ,
có thể dễ nhầm lẫn với phổ bê tông ở khu vực thành thị. Tuy nhiên, đa số lỗi thì
phức tạp hơn. Những điểm phân giải bị trộn lẫn giống như những yếu tố nằm giữa
ranh giới của các vùng; những điểm phân giải này có thể có những giá trị số chính
xác không giống như một trong 2 loại được nêu ra và có thể thậm chí đã không
được phân nhóm bởi các phương thức phân loại rõ ràng và độ chính xác tốt nhất.
Nhiều lỗi có thể xuất hiện trong phân nhóm dữ liệu số như chuỗi điểm phân giải
chưa được phân nhóm, những phần đồng tính (Hình 14.2).
Bằng cách này, những hình ảnh của khung cảnh tạo nên những yếu tố tiềm ẩn
gây nên lỗi thông qua những mô hình phức tạp tạo nên khung cảnh. Một khung
cảnh đơn giản được cấu tạo từ những hạng mục lớn, riêng biệt, chúng dễ được phân
loại chính xác hơn 1 vùng nhỏ và không riêng biệt được sắp xếp trong 1 mạng phức
tạp. Những giá trị chính về khung cảnh thì bao gồm:
• Kích thước vùng
• Giá trị trong kích thước vùng
• Danh tính của vùng
• Số lượng hạng mục
• Sắp xếp các hạng mục
• Số vùng mỗi hạng mục
• Hình dạng của vùng
• Tương phản về quang phổ và X quang trong quang phổ với những vùng
xung quanh.

Những giá trị này thay đổi theo từng vùng (Podwysocki, 1976, Simonett and
Coiner, 1971) và trong những vùng được đưa ra từng thay đổi theo từng mùa.

6
Những lỗi xuất hiện trong một bức ảnh không nhất thiết phải được đoán theo những
dữ liệu từ những vùng trước hoặc từ những thời gian trước đó.

Hình 2.1. Những vùng điểm ảnh biên

Hình 2.1 Những vùng điểm ảnh biên được phân loại không chính xác ở góc các
vùng. Cả những ví dụ theo Musy et al. (2006) thể hiện những điểm xác nhận, những
điểm đó được phân loại không phải rừng nhưng nó được đánh dấu là rừng trong dữ
liệu tương ứng. Những ảnh đen trong vật liệu hồng ngoại tổng hợp (Landsat TM
bands 4, 3 và 2). Trong cả những trường hợp, rừng nằm tại góc ở khu vực nước.

7
Phần 3. Các đặc điểm lỗi
Lỗi phân loại là sư thể hiện của 1 điểm ảnh thuộc một hạng mục (được xác định
bằng cách quan sát mặt đất) đến một hạng mục trong quá trình phân loại. Có rất ít
nghiên cứu hệ thống về đặc điểm địa lí của những lỗi này, nhưng phững thí nghiệm
và sự đoán logic mà ở đó những lỗi đều chứa ít nhất 1 trong các đặc điểm được liệt
kê dưới đây:
• Những lỗi không được phân bố trên hình ảnh một cách ngẫu nhiên nhưng
hiển thị một mức độ hệ thống, có trật tự trong không gian. Tương tự, các lỗi
không được chỉ định ngẫu nhiên đến các danh mục khác nhau trên hình ảnh
nhưng có khả năng được liên kết tốt hơn với các lớp nhất định.
• Các pixel được gán sai thường không bị cô lập về mặt không gian nhưng gây
ra những nhóm khu vực có kích thước và hình dạng đa dạng. (Campbell,
1981)
• Lỗi có thể có mối quan hệ không gian cụ thể với các vùng mà chúng liên
quan; ví dụ chúng có thể có xu hướng xảy ra ở các góc cạnh hoặc bên trong
khu vực.

Hình 14.3 cho thấy ba kiểu lỗi từ phân loại Landsat được báo cáo bởi Congalton
(1984). Mỗi hình ảnh hiển thị một khu vực tương ứng với một hình tứ giác địa hình
7,5 phút của USGS; các bản phân phối cho thấy lỗi trong phân loại che phủ đất bắt
nguồn từ hình ảnh Landsat. Ba khu vực được lựa chọn đặc biệt để thể hiện sự tương
phản cảnh quan trong việc sử dụng đất chủ yếu là rừng, nông nghiệp và phạm vi ở
vùng nông thôn Hoa Kỳ. Do các quan sát mặt đất chính xác có sẵn cho từng khu
vực, nên có thể so sánh phân loại dựa trên dữ liệu Landsat với cảnh quan thực tế và
để tạo ra một bản kiểm kê đầy đủ các lỗi cho từng vùng trên cơ sở từng điểm ảnh.
Vùng tối biểu thị các pixel được phân loại không chính xác; khu vực màu trắng cho
thấy phân loại chính xác. (Ở đây tỷ lệ của hình ảnh quá nhỏ đến mức chúng ta chỉ
có thể nhìn thấy những đường viền rộng của mẫu mà không giải quyết từng điểm
ảnh.)

8
Hình 3.1. Các mẫu lỗi

Hình 3.1. Các mẫu lỗi. Các vùng tối được phân loại sai điểm ảnh cho ba vùng
được đề cập bởi Congalton (1984): (a) Vùng có rừng. (b) Cảnh nông nghiệp. (c)
Vùng đất. Những hình ảnh này được hiển thị ở quy mô rất nhỏ; ở quy mô lớn hơn,
có thể nhận ra vùng tối tại những điểm ảnh riêng biệt.
Mặc dù chúng tôi không thể xác định nguồn gốc của các lỗi này, chúng tôi có
thể thấy rõ các mẫu tương phản. Không có hình ảnh nào hiển thị các mẫu ngẫu
nhiên. Các pixel bị phân loại sai có xu hướng hình thành các mẫu đặc biệt. Trong
hình ảnh rừng, lỗi hình thành các dải hình lưỡi liềm tạo nên bởi địa hình bị che
khuất; trong bối cảnh nông nghiệp, các hệ thống tưới tiêu trung tâm tạo ra các mảng
bị bỏ lại do đất bỏ hoang hoặc đất trồng các loại cây trồng tương phản đã được phân
loại sai. Trên hình ảnh rangeland, chúng ta thấy rõ hiệu ứng của hệ thống. Hệ thống
khảo sát thị trấn và phạm vi, có thể thông qua ảnh hưởng của các pixel hỗn hợp tại
các cạnh của những vùng hình chữ nhật.
Trong phân loại hình ảnh riêng của chúng tôi, chúng tôi không có kiến thức về
lỗi tương ứng mẫu vì hiếm khi chúng ta có cơ hội quan sát tổng hàng tồn kho của
lỗi phân loại cho các khu vực lớn như những gì được thể hiện trong nghiên cứu của
Congalton. Nhưng những mô hình vẫn lỗi tồn tại, mặc dù chúng ta hiếm khi biết sự
phong phú hoặc phân chia của chúng.

9
Phần 4. Measurement of Map Accuracy
Nhiệm vụ đánh giá độ chính xác có thể được định nghĩa là một trong việc so
sánh hai nguồn thông tin, một nguồn dựa trên phân tích dữ liệu được cảm nhận từ
xa (bản đồ) và nguồn khác dựa trên nguồn thông tin khác nhau, được giả định là
chính xác, dữ liệu tham khảo. Các tài liệu tham khảo dữ liệu có ý nghĩa rõ ràng; nếu
chúng bị lỗi, thì việc thử đo độ chính xác sẽ có lỗi. Đối với thông tin thay đổi theo
mùa hoặc theo thời gian, điều quan trọng là dữ liệu tham chiếu phù hợp với thời
gian khác, so sánh có thể phát hiện sự khác biệt không chỉ gây ra bởi sự không
chính xác trong phân loại. Ví dụ, một số khác biệt có thể không thực sự là lỗi mà
chỉ là những thay đổi đã xảy ra trong khoảng thời gian trôi qua giữa thu thập hình
ảnh và thu thập dữ liệu tham chiếu. Trong một số trường hợp, chúng tôi có thể kiểm
tra hai bản đồ chỉ đơn giản để quyết định xem có sự khác biệt nào không mà không
kết luận rằng bản đồ này chính xác hơn bản đồ kia. Ví dụ, chúng tôi có thể so sánh
các bản đồ của cùng một khu vực được tạo từ dữ liệu thu được bởi các cảm biến
khác nhau hoặc sử dụng giao thức phân loại khác nhau. Phổ biến hơn trong những
trường hợp như vậy, tuy nhiên, chúng tôi sẽ sử dụng dữ liệu tham chiếu áp dụng
cho cả hai phân loại để xác định xem một bản đồ có nhiều hơn không chính xác
hơn.
Để đánh giá độ chính xác của bản đồ, cần có bản đồ và dữ liệu tham chiếu,
cả hai đều sử dụng cùng một hệ thống phân loại và ánh xạ tối thiểu đơn vị, và chúng
đã được phân loại ở mức độ chi tiết tương đương. Các chiến lược được mô tả ở đây
là không phù hợp nếu hai nguồn dữ liệu khác nhau về chi tiết, số lượng danh mục,
hoặc ý nghĩa của các danh mục.
Trong trường hợp hiếm hoi của dữ liệu tham chiếu phù hợp được hình thành
bởi một bản đồ khác của cùng khu vực, phương pháp đánh giá đơn giản nhất là so
sánh hai bản đồ với các khu vực giao cho từng hạng mục. Kết quả của một so sánh
như vậy là để báo cáo tỷ lệ diện tích của các loại (Hình 4.1). Các giá trị này báo cáo
mức độ thỏa thuận giữa hai bản đồ liên quan đến tổng diện tích trong mỗi loại
nhưng không tính đến bù các lỗi trong phân loại sai khiến loại biện pháp chính xác
này bị chính nó không chính xác. Ví dụ, đánh giá thấp rừng trong một phần của

10
hình ảnh có thể bù lại việc đánh giá quá cao rừng trong một phần khác của hình
ảnh; lỗi nghiêm trọng trong phân loại đã được thực hiện nhưng không được tiết lộ
trong báo cáo đơn giản về tổng diện tích trong từng loại.
Hình thức đánh giá lỗi này đôi khi được gọi là độ chính xác không theo trang
web cụ thể vì nó không xem xét thỏa thuận giữa hai bản đồ tại các địa điểm cụ thể
mà chỉ số liệu tổng thể cho hai bản đồ. Hình 4.1 minh họa điểm này. Hai mẫu là rõ
ràng khác nhau, nhưng sự khác biệt không được tiết lộ bởi tỷ lệ phần trăm chung
cho mỗi thể loại. Gersmehl và Napton (1982) gọi loại lỗi này là lỗi hàng tồn kho,
như quá trình chỉ xem xét các khu vực tổng hợp cho các lớp chứ không phải là vị trí
của các lớp học trên bản đồ.
Site-Specific Accuracy
Hình thức thứ hai của độ chính xác, độ chính xác cụ thể theo trang web, dựa
trên đánh giá chi tiết thỏa thuận giữa bản đồ và dữ liệu tham chiếu tại các vị trí cụ
thể (Hình 4.2)

Hình 4.1. Độ chính xác không cụ thể

Hình 4.1. Độ chính xác không cụ thể. Ở đây hai hình ảnh được so sánh chỉ dựa trên
tổng diện tích trong mỗi loại. Bởi vì tổng diện tích có thể tương tự nhau mặc dù vị
trí của ranh giới khác nhau rất nhiều, cách tiếp cận này có thể cho kết quả sai lệch,
như được hiển thị ở đây.

11
Hình 4.2. Trang web chính xác cụ thể

Hình 4.2. Trang web chính xác cụ thể. Dữ liệu tham khảo (hiển thị ở đây là chữ thập
đen hoặc trắng) với các vị trí đã biết được sử dụng để đánh giá độ chính xác của bản
đồ
Gersmehl và Napton (1982) gọi loại lỗi này là lỗi phân loại. Trong nhiều đánh giá
độ chính xác của bản đồ thu được từ hình ảnh độ phân giải vừa phải, các mẫu là các
pixel, nhưng chiến lược này không thực tế đối với rất lớn (và thường được trộn lẫn)
hoặc rất nhỏ pixel (trong đó, trong số các vấn đề khác, đăng ký chính xác giữa ánh
xạ pixel và dữ liệu tham chiếu trở nên khó khăn hơn). Do đó, thay vì so sánh pixel-
by-pixel, so sánh chính xác thường
Khi đơn vị mẫu đã được chọn, hai câu hỏi tiếp theo sẽ ngay lập tức phát sinh
là (1) Nên sử dụng sơ đồ lấy mẫu nào? và (2) Có bao nhiêu mẫu được thu thập? Đối
với sơ đồ lấy mẫu, vấn đề quan trọng nhất là nó cần phải có một yếu tố ngẫu nhiên.
Hãy nhớ rằng mục tiêu của đánh giá chính xác là ước tính độ chính xác của phân

12
loại hình ảnh (dân số, trong trường hợp này) bằng cách sử dụng một mẫu dữ liệu
tham khảo. Với kích thước mẫu đủ lớn, một mẫu ngẫu nhiên đơn giản là tốt nhất.
Tuy nhiên, khi kích thước mẫu giảm, các danh mục ít phổ biến hơn trên cảnh quan
có thể là bỏ lỡ bằng cách sử dụng một mẫu ngẫu nhiên đơn giản. Vì lý do này, phân
tầng dựa trên các loại bản đồ (dẫn đến mẫu ngẫu nhiên phân tầng) thường được sử
dụng, nhưng điều này gây khó khăn cho việc mẫu cho cả đào tạo và xác nhận đồng
thời. Hơn nữa, sự phân tầng sẽ là thích hợp nhất cho bản đồ mà tầng lớp được phát
triển, thực hiện xác nhận đặt ít phù hợp hơn cho các bản đồ khác trong cùng khu
vực (chẳng hạn như khi so sánh bản đồ được thực hiện bởi phân tích khác nhau và /
hoặc quy tắc quyết định phân loại khác nhau). Sự kết hợp của Lấy mẫu ngẫu nhiên
và có hệ thống thường được sử dụng, chẳng hạn như lấy mẫu không phân tầng có hệ
thống, để giải quyết cả hai mối quan tâm này (xem thảo luận bổ sung trong Chương
13). Tuy nhiên, một mẫu ngẫu nhiên đơn giản có kích thước đủ rõ ràng mang lại sự
mạnh mẽ nhất suy luận về độ chính xác của bản đồ.
Vì vậy, một kích thước mẫu “đủ điều kiện” là gì? Congalton và Green (2009)
đề nghị mua lại 50 mẫu cho mỗi danh mục theo hướng dẫn chung, tăng lên 75 mẫu
100 cho mỗi danh mục vì diện tích hoặc số lượng danh mục tăng vượt ngưỡng nhất
định (1 triệu mẫu Anh và / hoặc 12 loại). Tuy nhiên, họ cũng lưu ý rằng để chắc
chắn mẫu kích thước phải được tính toán dựa trên phân phối đa cực và độ chính xác
mong muốn để phân loại (thường là 5%). Như được hiển thị bởi đường liền nét
trong Hình 4.3, kết quả này trong một mẫu lớn hơn kết quả bằng cách lấy 50 mẫu
trên mỗi lớp (đường chấm chấm) với số lượng lớp nhỏ hơn. Tuy nhiên, khi số lượng
lớp học tiếp tục tăng lên, kịch bản trường hợp xấu nhất của nhóm này thực sự dẫn
đến ít mẫu cần thiết hơn.
Foody (2009) lưu ý rằng một trong những mục tiêu chính của đánh giá độ
chính xác thường là so sánh, cho dù đó là một trong các kết quả phân loại hoặc so
với tham chiếu tiêu chuẩn. So sánh hợp lệ thống kê phải có cỡ mẫu phù hợp với loại
về thử nghiệm, kích thước hiệu ứng (mà Foody định nghĩa là sự khác biệt có ý
nghĩa tối thiểu về độ chính xác), sức mạnh (xem thảo luận sau trong chương), mức
ý nghĩa và giới hạn tin cậy của so sánh. Trong nhiều nghiên cứu có quá ít mẫu cho
phép thống kê so sánh mạnh mẽ.

13
Ma trận lỗi
Biểu mẫu chuẩn để báo cáo lỗi cụ thể theo trang web là ma trận lỗi, đôi khi
được gọi là ma trận nhầm lẫn vì nó xác định không chỉ các lỗi tổng thể cho từng
danh mục mà còn phân loại sai (do nhầm lẫn giữa các loại) theo thể loại. Việc biên
soạn một ma trận lỗi là cần thiết cho bất kỳ nghiên cứu nghiêm túc nào về độ chính
xác. Nó bao gồm một n×n mảng, trong đó n đại diện cho số lượng danh mục (Bảng
14.1)
Phía bên trái (trục y) được gắn nhãn với các danh mục trên bản đồ; cạnh trên
(trục x) được gắn nhãn n cùng loại từ dữ liệu tham chiếu. (Lưu ý rằng ý nghĩa của
hai trục có thể được đảo ngược trong một số ứng dụng, vì quy ước không phải là
phổ quát.) Ở đây các giá trị trong ma trận biểu thị số pixel mà nhà phân tích đã có
thể so sánh các hình ảnh được đánh giá và tham khảo. Đôi khi ma trận là được xây
dựng bằng cách sử dụng tỷ lệ phần trăm thay vì giá trị tuyệt đối, nhưng ở đây chúng
tôi hiển thị tuyệt đối các giá trị được tính trực tiếp từ hình ảnh. Ngay cả khi tỷ lệ
phần trăm được sử dụng, nó vẫn hữu ích để cũng hiển thị số mẫu, đặc biệt khi
chúng có xu hướng làm nổi bật các phần tử ma trận với vài mẫu.

Hình 4.3. Đánh giá độ chính xác kích thước

Hình 4.3. Mẫu đánh giá độ chính xác kích thước. Đường liền nét (cho thấy một sự
bảo thủ trong trường hợp xấu nhất Green, 2009) dẫn đến một mẫu lớn hơn những gì

14
sẽ dẫn đến bằng cách lấy 50 mẫu trên mỗi lớp (đường chấm chấm) với nhỏ hơn số
lượng các lớp thông tin (loại). Trường hợp xấu nhất của kích thước mẫu đã được
tính toán sử dụng phân phối chi bình phương với một mức độ tự do, một mức ý
nghĩa (α) của 5%, tỷ lệ lớp giả định là 50%, và độ chính xác phân loại mong muốn
5%.
Bảng 4-1. Ma trận lỗi

Kiểm tra ma trận cho thấy cách phân loại đại diện cho các khu vực thực tế
trên cảnh quan. Ví dụ, trong Bảng 4.1, 58 mẫu tham chiếu được trồng theo hàng.
Trong số này 58 điểm, 46 được phân loại như vậy (hàng 1, cột 1); tất nhiên, đây là
những pixel của cây trồng phân loại chính xác. Đọc các giá trị thành công xuống cột
đầu tiên, chúng tôi tiếp theo tìm các pixel cắt hàng được phân loại không chính xác
và các danh mục mà chúng được được giao: kế vị sớm, 5; đồng cỏ hoặc cỏ khô, 7;
rừng lá kim, 0; rừng rụng lá, 0, mở nước, 0. Đọc qua từng hàng, chúng ta thấy
những pixel nào được ánh xạ như một danh mục nhất định thực sự là khi xác minh
thực địa. Đường chéo từ trên trái sang dưới phải cho số lượng pixel được phân loại
chính xác cho mỗi lớp. Lưu ý rằng một số yếu tố ngoài đường chéo của ma trận
không có mẫu; Điều này là bình thường, đặc biệt đối với các bản đồ có số lượng lớn
hơn các lớp học.
Kiểm tra thêm về ma trận cho thấy một bản tóm tắt các thông tin khác. Tổng
số hạng đưa ra tổng số pixel trong mỗi lớp như được ghi trên ảnh tham chiếu. Cột
tổng số hiển thị số pixel được gán cho mỗi lớp trên bản đồ chuyên đề.

15
Biên dịch ma trận lỗi
Để xây dựng ma trận lỗi, nhà phân tích phải so sánh hai nguồn dữ liệu của
các mẫu tham chiếu và hình ảnh được phân loại trên cơ sở từng điểm để xác định
chính xác làm thế nào mỗi mẫu xác nhận được trình bày trong phân loại. Rất quan
trọng rằng các mẫu xác nhận và bản đồ sẽ được liên kết tốt với nhau. Lỗi trong đăng
ký sẽ xuất hiện dưới dạng lỗi trong phân loại, vì vậy vấn đề đăng ký sẽ tạo ra lỗi
trong đánh giá độ chính xác. Điều này cũng đúng với thời gian; dữ liệu xác nhận và
hình ảnh nên được thu thập càng gần thời gian càng tốt.
Các danh mục cho bản đồ và dữ liệu tham chiếu được so sánh một cách có hệ
thống cho từng loại mẫu vật. Nhà phân tích hoặc phần mềm duy trì số lượng các số
trong mỗi loại tham chiếu khi chúng được gán cho các lớp trên bản đồ. Tổng kết
của bảng này trở thành ma trận lỗi.
Hãy thực hiện toàn bộ quá trình bằng cách sử dụng một bộ dữ liệu rất đơn
giản. Một hình ảnh Landsat đã được phân loại, sử dụng hai kỹ thuật khác nhau
(được dán nhãn là Bản đồ 1 và Bản đồ 2), thành rừng và phi rừng. Hai mươi mẫu,
đại diện cho pixel Landsat ở độ phân giải mặt đất, đã được chọn ngẫu nhiên (ít hơn
100 mà quy tắc ngón tay cái của chúng tôi sẽ cho chúng tôi biết bắt buộc) và được
phân loại bằng cách sử dụng cùng sơ đồ phân loại và ánh xạ tối thiểu đơn vị sử
dụng kết hợp chụp ảnh trên không và tham quan thực địa tại hoặc gần thời điểm thu
nhận ảnh. Bảng kết quả là Bảng 4.2, trong đó 1 = không có rừng và 2 = rừng.
Ma trận lỗi kết quả (cho Bản đồ 1) được hiển thị như Bảng 4.3.

16
Bảng 4-2. Accuracy Assessment Data

Lỗi omission và commission


Kiểm tra ma trận lỗi cho thấy, đối với mỗi loại, lỗi omission và lỗi
commission. Lỗi omission (Lỗi bỏ sót) là, ví dụ, việc gán pixel của rừng trên mặt
đất để phi thực tế trên bản đồ (nói cách khác, một khu vực của rừng Real thực sự
trên đường mặt đất đã được bỏ qua từ bản đồ). Sử dụng cùng một ví dụ, một lỗi
commission sẽ chỉ định một khu vực không có rừng trên mặt đất cho loại rừng trên
bản đồ. Nhà phân tích trong trường hợp này đã chủ động phạm lỗi bằng cách gán
một vùng rừng cho một loại sai. (Tất nhiên, lỗi commission cho một danh mục cũng
sẽ được lập bảng như là một lỗi thiếu sót cho một loại khác.) Sự khác biệt là rất cần
thiết, bởi vì nếu mọi pixel trong bản đồ được dán nhãn là rừng thì sẽ không có khu
rừng nào trên mặt đất được bỏ qua khỏi bản đồ. Tuy nhiên, nhiều pixel rừng sẽ
được cam kết không chính xác để phi thực tế.
Bằng cách kiểm tra mối quan hệ giữa hai loại lỗi, người dùng bản đồ sẽ đạt
được cái nhìn sâu sắc về độ tin cậy khác nhau của các lớp trên bản đồ và nhà phân
tích tìm hiểu về của quá trình tạo ra các bản đồ. Kiểm tra từ góc độ người dùng, ma
trận cho thấy độ chính xác của người dùng (hoặc độ chính xác của người tiêu dùng);
kiểm tra từ theo quan điểm của nhà phân tích, ma trận cho thấy độ chính xác của
nhà sản xuất. (Lỗi omission là 1 - độ chính xác của nhà sản xuất; lỗi commission là
1 - độ chính xác của người dùng.) Sự khác biệt giữa hai lời nói dối trong cơ sở mà
từ đó lỗi được đánh giá. Đối với độ chính xác của nhà sản xuất, cơ sở là khu vực

17
trong mỗi lớp trên bản đồ cuối cùng. Vì vậy, ví dụ trong Bảng 14.3, độ chính xác
của nhà sản xuất cho rừng là 9/10, hoặc 90%. Đối với cùng một lớp, độ chính xác
của người dung là 9/13, hoặc 69%. Độ chính xác của người dùng tạo thành một
hướng dẫn về độ tin cậy của bản đồ như là một dự đoán Thiết bị này nói với người
dùng bản đồ rằng trong ví dụ này, về khu vực được dán nhãn rừng trên bản đồ, 69%
thực sự tương ứng với rừng trên mặt đất. Độ chính xác của nhà sản xuất thông báo
cho nhà phân tích đã chuẩn bị phân loại rằng, của cảnh quan rừng thực tế, 90% là
phân loại chính xác. Trong cả hai trường hợp, ma trận lỗi cho phép nhận dạng các
lớp rừng bị dán nhãn sai và các khu vực có rừng bị dán nhãn sai là không có rừng.
Bảng 4-3. Ma trận lỗi từ Map 1 (bảng 4.2)

18
Phần 5. Giải thích ma trận lỗi
Error! Reference source not found. và Error! Reference source not
found. cho thấy các ví dụ về ma trận lỗi. Tổng cột cạnh phải (tổng hàng) của ma
trận cho thấy tổng số pixel trong mỗi loại trên bản đồ; tổng hàng ở phía dưới hiển
thị tổng số pixel trong mỗi danh mục được phân loại trong bối cảnh. Chuỗi các giá
trị kéo dài từ góc trên bên trái đến góc dưới bên phải được gọi là đường chéo chính.
Các đường chéo chính này cho thấy số lượng pixel được phân loại chính xác. Các
giá trị không thuộc đường chéo chính trong mỗi cột thể hiện lỗi omission. Ví dụ, khi
chúng ta đọc xuống cột thứ ba (Error! Reference source not found.), chúng ta
thấy rằng 11/70 mẫu tham chiếu trên đồng cỏ hoặc cỏ khô được ánh xạ thành hàng
mùa màng. Đây là một lỗi của lỗi thiếu sót vì nhà phân tích hình ảnh đã sai lầm khi
bỏ qua một số đồng cỏ hoặc cỏ khô từ hình ảnh được diễn tả. Cụ thể hơn, chúng ta
biết rằng đồng cỏ hoặc cỏ khô rất có thể bị phân loại sai thành cây trồng trên hình
ảnh được phân loại.
Ngược lại, các giá trị không giới hạn dọc theo các hàng cho commission. Để
tiếp tục ví dụ với danh mục đồng cỏ hoặc cỏ khô, lỗi sai cố ý được gây ra bởi sự
phân bổ chủ động các loại khác vào đồng cỏ hoặc lớp cỏ khô. Những lỗi này là
được tìm thấy bằng cách đọc trên hàng thứ ba (Bảng 1): cây trồng hàng, 7; kế vị
sớm, 1; rừng lá kim, 0; rừng rụng lá, 0; và sông hồ, 0. Những giá trị này cho thấy
rằng việc phân loại đồng cỏ hoặc cỏ khô thường xuyên nhất bằng cách gán đồng cỏ
thật hoặc cỏ khô cho lớp cây trồng. Ở đây, các lỗi omission và commission đều tiết
lộ rằng đồng cỏ hoặc cỏ khô thường bị nhầm lẫn với các cây trồng theo hàng và bản
đồ có thể gây nhầm lẫn cho hai loại này. Bảng 14.4 tóm tắt độ chính xác của nhà
sản xuất và người dùng và kết quả là lỗi omission và commission cho các ma trận
trong Error! Reference source not found.. Lưu ý rằng mặc dù rừng được phân
loại tốt theo quan điểm của nhà sản xuất, nhưng điều này là do việc dán nhãn không
chính xác cho nhiều pixel không phải là rừng.

19
Bảng 5-1. User's and producer's accuracies từ bảng 4.3
User”s Commission Producer’s Omission error
accuracy error accuracy
Nonforest 6 : 7 = 85.7 % 1 – 85. 7 % = 6 : 10 = 60 % 1 – 60% = 40
14.3 % %
Forest 9 : 13 = 69.2 1 – 69.2 = 30.8 9/10 = 90 % 1 – 90 % = 10
% % %

Độ chính xác tổng thể


Một trong những biện pháp chính xác được sử dụng rộng rãi nhất là độ chính
xác tổng thể, một báo cáo về tỷ lệ tổng thể của các pixel được phân loại chính xác
trong hình ảnh hoặc trong mẫu được sử dụng để xây dựng ma trận. Độ chính xác
tổng thể, tất nhiên, có thể dễ dàng tìm thấy; con số đúng là tổng của các mục chéo
(còn được gọi là dấu vết) chia giá trị này cho tổng số pixel được kiểm tra sẽ cho tỷ
lệ mẫu đã được chính xác phân loại. Đối với Error! Reference source not found.,
đây sẽ là

80.1 % (0-1)

Từ Bảng 4.2, độ chính xác tổng thể là

= = 75 %
(0-2)

Giá trị này ước tính giá trị thật sự không thể biết được sự chính xác của giá
trị này so với giá trị thực, một phần phụ thuộc vào cách lấy mẫu, như được giải
thích dưới đây. Độ chính xác tổng thể có thể được báo cáo với khoảng tin cậy (Hord
và Brooner, 1976). Thông thường độ chính xác tổng thể được sử dụng độc lập,
không có ma trận lỗi, như một thước đo chính xác đơn giản. Độ chính xác tổng thể
có thể gợi ý hiệu quả tương đối của phân loại, nhưng trong trường hợp không có cơ
hội để kiểm tra lỗi đầy đủ ma trận, nó không thể cung cấp bằng chứng thuyết phục
về độ chính xác của phân loại. Một đánh giá đầy đủ phải xem xét các loại được sử

20
dụng trong phân loại. Ví dụ: có thể dễ dàng đạt được độ chính xác cao tổng thể
bằng cách phân loại cảnh được tạo chủ yếu là sông hồ, một lớp dễ phân loại chính
xác. Hơn nữa, các biến thể trong tính chính xác của các lớp cụ thể cần được lưu ý,
cũng như độ chính xác của các lớp. Một phân loại chỉ sử dụng các lớp được xác
định rộng có thể đạt được độ chính xác cao nhưng sẽ không hữu ích cho người yêu
cầu chi tiết hơn. Cuối cùng, các phần sau của chương này sẽ chỉ ra rằng các giá trị
thô cho độ chính xác tổng thể có thể được tăng lên bằng cách gán các pixel cho các
lớp, một lý do khác để kiểm tra cẩn thận nhiệm vụ đánh giá.
Hay (1979) nói rằng cần phải xem xét năm câu hỏi để hiểu thấu đáo tính chính
xác của phân loại:

• Tỷ lệ nào của quyết định phân loại là đúng?


• Tỷ lệ bài tập cho một danh mục nhất định là chính xác?
• Tỷ lệ của một loại nhất định được phân loại chính xác?
• Là một thể loại nhất định được đánh giá quá cao hoặc bị đánh giá thấp?
• Lỗi có được phân phối ngẫu nhiên không?

Độ chính xác tổng thể có thể trả lời câu hỏi đầu tiên trong những câu hỏi này,
những câu hỏi khác chỉ có thể được trả lời bằng cách kiểm tra ma trận lỗi đầy đủ.

Đánh giá định lượng ma trận lỗi


Sau khi kiểm tra ban đầu về ma trận lỗi cho thấy bản chất tổng thể của các
lỗi hiện tại, thường cần phải đánh giá khách quan hơn về phân loại. Ví dụ: chúng tôi
có thể hỏi liệu hai bản đồ có thỏa thuận với nhau không, một câu hỏi rất khó để trả
lời bởi vì khái niệm về thỏa thuận trên mạng có thể khó xác định và thực hiện. Ma
trận lỗi là một ví dụ về một lớp ma trận tổng quát hơn, được gọi là dự phòng các
bảng, tóm tắt các phân loại tương tự như các bảng được xem xét ở đây. Một số quy
trình đã được phát triển để phân tích các bảng dự phòng có thể được áp dụng cho
kiểm tra ma trận lỗi. Chrisman (1980), Congalton và Mead (1983) và Congalton et
al. (1983) đề xuất áp dụng các kỹ thuật được mô tả bởi Bishop et al. (1975) và
Cohen (1960) là một phương tiện để cải thiện việc giải thích ma trận lỗi. Một thiếu
sót của các cách hiểu thông thường về ma trận lỗi là ngay cả việc gán các pixel cho

21
các lớp có thể mang lại kết quả tốt đáng ngạc nhiên, được đo bằng độ chính xác
tổng thể. Hord và Brooner (1976) và đồng nghiệp đã lưu ý rằng việc sử dụng các
biện pháp đó phụ thuộc nhiều vào các mẫu và do đó, dựa trên chiến lược lấy mẫu
được sử dụng để rút ra các quan sát được sử dụng trong phân tích.
k (kappa) là thước đo sự khác biệt giữa thỏa thuận được quan sát giữa hai
bản đồ (được thể hiện bởi các mục chéo trong ma trận lỗi) và thỏa thuận có thể đạt
được chỉ bằng cách khớp ngẫu nhiên của hai bản đồ. Không phải tất cả các thỏa
thuận có thể được quy cho sự thành công của phân loại. cố gắng cung cấp một biện
pháp thỏa thuận được điều chỉnh cho thỏa thuận cơ hội. được ước tính bởi k:

k=
(0-3)

Dạng phương trình này được đưa ra bởi Chrisman (1980) và đồng nghiệp là
một phiên bản đơn giản hóa của dạng hoàn chỉnh hơn được đưa ra bởi Bishop et al.
(1975). Ở đây quan sát chỉ định độ chính xác được báo cáo trong ma trận lỗi và dự
kiến sẽ chỉ định phân loại chính xác điều đó có thể được dự đoán bằng sự sai khác
giữa hai ảnh.
Observed là giá trị cho độ chính xác tổng thể của khu vực được xác định trước đó:
tổng các mục chéo được chia cho tổng số mẫu. Expected là một ước tính về sự
đóng góp của thỏa thuận cơ hội cho độ chính xác tổng thể quan sát được. Giá trị
Expected được tính bằng tổng hàng và cột. Các sản phẩm có tổng số hàng và cột
(Error! Reference source not found.) ước tính số lượng pixel được gán cho từng ô
trong confusion matrix, với điều kiện là các pixel được gán ngẫu nhiên cho từng
loại. Điều này có lẽ rõ ràng hơn nếu chúng ta xem xét tình hình trong bối cảnh
không gian của nó. Tổng số hàng và cột có thể được nhìn thấy để thể hiện các khu
vực chiếm đóng của từng loại trên bản đồ tham chiếu và hình ảnh, và ánh xạ cơ hội
của hai loại bất kỳ là sản phẩm của các phạm vi tỷ lệ của chúng trên hai bản đồ.
Bảng 5-2. Tính tổng hàng và cột sử dụng bảng 3

Nonforest column total Forest column total


Nonforest row total 10 x 7 = 70 10 x 7 = 70
Forrest row total 10 x 13 = 130 10 x 13 = 130

22
k và các hệ số liên quan được thảo luận bởi Rosenfield và. Theo Cohen
(1960), bất kỳ giá trị âm biểu thị phân loại kém, nhưng phạm vi có thể có của các
giá trị âm phụ thuộc vào ma trận cụ thể được đánh giá. Do đó, độ lớn của một giá trị
âm không được giải thích chặt chẽ như là một chỉ dẫn về hiệu suất của phân loại.
Giá trị gần bằng 0 cho thấy sự đóng góp của cơ hội bằng với hiệu ứng của phân loại
và rằng quá trình phân loại mang lại kết quả không tốt hơn so với việc giao cơ hội
pixel cho các lớp. được phân phối bình thường.

Hình 5.1. Ma trận minh họa k

Một trong những lợi ích đáng kể của việc tính toán kappa là phương sai mẫu
lớn có thể được ước tính, sau đó được sử dụng trong bài kiểm tra z để các định xem
điểm k của từng cá nhân có khác biệt đáng kể với nhau không. Thật không may,
ngay khi sử dụng một phương pháp thích hợp tính toán phương sai mẫu, so sánh hai
phân loại sử dụng k và phương sai s cho mỗi yêu cầu độc lập.
Thống kê NCNemar thực hiện tính toán dễ dàng bằng phương trình (04.6) và
số b’s và c’s tìm thấy khi xây dựng Bảng 14.8

23
Z= = = -0.45
(04.6)

Giả sử, theo Foody( 2009), bản đồ khác nhau về mặt thống kê tại = 0.05
nếu |z| > 1.96. Như vậy, kể từ |-0.45| không lớn hơn 1.96, bản đồ không khác nhau.
Cần lưu ý rằng dù đây là cấp độ chung, sẽ không có cấp độ nào phù hợp cho tất cả
các nghiên cứu. Ngoài có một giá trị khác là , trong trường hợp
này |z| > 2.58.
Mặc dù thường bị các nhà nghiên cứu và nhà thực hành bỏ qua, lỗi loại II
( xác suất được biểu diễn là β) xảy ra khi thực sự có sự khác biệt đáng chú ý giữa
các bản đồ, điều đó khó phát hiện. Hiệu suất của bài kiểm tra là 1 – β. Khi tăng hiệu
suất mong muốn và giảm giá trị mong muốn, cần có cỡ mẫu lớn hơn. Độ chính
xác của các đánh giá chứa quá ít mẫu để có thể thấy sự khác biệt rất nhỏ giữa các
bản đồ. Kiểm tra McNemar được trình bày ở đây thường yêu cầu kích thước mẫu
lớn hơn “ rule of thumb” được trình bày trước đó để giảm thiểu khả năng lỗi Loại II
với các mức điển hình.
Bảng 5-3. Đường chéo McNemar’s Test

Map 2 Map 1
Correct Incorrect
Correct a b
Incorrect c d

Bảng 5-4. Dữ liệu đánh giá độ chính xác cho MCNemar Test
Point number Map 1 Map 2 Reference Letter
1 1 1 1 a
2 1 2 1 c
3 1 1 1 a
4 1 1 2 d

24
5 1 1 1 a
6 1 2 1 c
7 1 1 1 a
8 2 2 2 a
9 2 1 1 b
10 2 2 2 a
11 2 2 1 d
12 2 2 1 d
13 2 2 2 a
14 2 1 2 c
15 2 1 1 b
16 2 2 2 a
17 2 2 2 a
18 2 2 2 a
19 2 2 2 a
20 2 2 2 a

25
Phần 6. Kết luận
Đánh giá độ chính xác là một quá trình rất phức tạp. Chương 14 này không
thể đề cập chi tiết tất cả các vấn đề liên quan, bởi vì ngay cả cuộc thảo luận cụ thể
nhất cũng để lại nhiều vấn đề. Các nghiên cứu vẫn đang tiến hành, và mặc dù có
thảo luận về nhiều khía cạnh quan trọng của đánh giá độ chính xác, các vấn đề khác
vẫn có thể sẽ được đưa ra tranh luận mà một thời gian dài mới giải quyết được
chúng. Ví dụ, không có phương pháp lấy mẫu của hình ảnh để đánh giá độ chính
xác và sự khác biệt khi so sánh hai bản đồ theo chủ đề. Với các vấn đề khác nhau,
không có cách chính xác nào để thực hiện việc phân tích nhưng chúng tôi có thể
loại trừ một số lựa chọn, thay thế và nói về sự giống nhau cũng như khuyết điểm
của nó. Chương này sẽ cung cấp nền tảng để đánh giá tính chính xác của phân loại
bằng cách sử dụng các quy trình, ít nhất có thể so sánh về chất lượng với các quy
trình sử dụng phổ biến hiện nay. Hơn nữa, các bạn nên chuẩn bị để đọc một số
nghiên cứu hiện tại về chủ đề này và có thể góp phần cải thiện nghiên cứu về đánh
giá độ chính xác.

26
Phần 7. Trả lời câu hỏi
Câu 4.1

Từ Matrix A ta có bảng
User’s accuracy Error Producer’s Omission error
commission accuracy
Urban 510:738 =69.1% 1–69.1%=30.9% 510:621=82.1% 1-82.1%=17.9%
Agricu 1155:1732=66.7% 1–66.7%=33.3% 1155:1672=69.1% 1-69.1%=30.9%
lture
Range 930:1343=69.2% 1–69.2%=30.8% 930:1511=61.5% 1-61.5%=38.5%
Forest 864:1339=64.5% 1–64.5%=35.5% 864:1324=65.3% 1-65.3%=34.7%
Water 265:321 =82.6% 1– 82.6=17.4% 265:345=76.8% 1-76.8%23.2%

Từ Matrix A, class Forest có error commission lớn nhất

Câu 4.2
Sau khi kiểm tra matrix A ta thấy class Range hay bị nhầm lẫn với Agriculture

Câu 4.3
Từ ma trận A, Water có độ chính xác cao nhất, Forest có độ chính xác thấp nhất

27
Câu 4.4
Từ ma trận A, Range có omission error cao nhất

Câu 4.5
Từ bảng 1 và bảng 2 ta có hình ảnh ở ma trận A là chính xác nhất.
Câu 4.6
Tham khảo ma trận A và B. Nếu quan tâm đến việc phân định chính xác đất nông
nghiệm thì hình ảnh đất nông nghiệm ở ma trận B được quan tâm hơn. Nếu quan
tâm đến phân loại chính xác đất rừng thì hình aarnh ở ma trân A được quan tâm
hơn.
Câu 4.7
Hậu quả của việc không có cách chích xác đánh giá phân loại hình ảnh từ xa là xác
định sai vật thể gây nhầm lẫn giữ các vật thể, ví dụ như giũa cỏ khô và cây tròng
được nêu trong phần 5- Giải thích ma trận lỗi.
Câu 4.8
Các ứng dụng đánh giá độ chinh xác như kỹ thuật mô tả bởi Bishop et al (1975) và
Cohen(1960), Kỹ thuật được mô tả bởi Chrisman(1980) và đồng nghiệp một phiên
bản hoàn chỉnh hơn từ Bishop, các hệ số liên quan được thảo luận bởi Rosenfiled và
Theo Cohen(1960).

Câu 4.9
Các yêu cầu đưa ra để chọn hệ số phù hợp đánh giá độ chính xác:
+ Công thức

k=
(0-1)

Dạng phương trình này được đưa ra bởi Chrisman (1980) và đồng nghiệp là
một phiên bản đơn giản hóa của dạng hoàn chỉnh hơn được đưa ra bởi Bishop et al.
(1975). Ở đây quan sát chỉ định độ chính xác được báo cáo trong ma trận lỗi và dự
kiến sẽ chỉ định phân loại chính xác điều đó có thể được dự đoán bằng sự sai khác
giữa hai ảnh.
Observed là giá trị cho độ chính xác tổng thể của khu vực được xác định trước đó:
tổng các mục chéo được chia cho tổng số mẫu. Expected là một ước tính về sự

28
đóng góp của thỏa thuận cơ hội cho độ chính xác tổng thể quan sát được. Giá trị
Expected được tính bằng tổng hàng và cột. k và các hệ số liên quan được thảo luận
bởi Rosenfield và. Theo Cohen (1960), bất kỳ giá trị âm biểu thị phân loại kém,
nhưng phạm vi có thể có của các giá trị âm phụ thuộc vào ma trận cụ thể được đánh
giá. Do đó, độ lớn của một giá trị âm không được giải thích chặt chẽ như là một chỉ
dẫn về hiệu suất của phân loại. Giá trị
gần bằng 0 cho thấy sự đóng góp của cơ hội bằng với hiệu ứng của phân loại
và rằng quá trình phân loại mang lại kết quả không tốt hơn so với việc giao cơ hội
pixel cho các lớp. được phân phối bình thường.

Câu 4.10
Từ bảng 1 ta có độ chích xác của agriculture and forested lands

Câu 4.11
Một trong những lợi ích đáng kể của việc tính toán kappa là phương sai mẫu lớn có
thể được ước tính, sau đó được sử dụng trong bài kiểm tra z để các định xem điểm k
của từng cá nhân có khác biệt đáng kể với nhau không. Khi sử dụng một phương
pháp thích hợp tính toán phương sai mẫu, so sánh hai phân loại sử dụng k và
phương sai s cho mỗi yêu cầu độc lập

Câu 4.12
Kích thước mẫu trong một thử nghiệm có thể gây không đúng trong việc đánh giá
độ chích xác vì kích thước tập mẫu rất quan trọng việc sử dụng đánh giá. Một mẫu
lớn hoặc nhỏ không phù hợp có thể dẫn đến các đánh giá hạn chế và đôi khi sai về
độ chính xác và sự khác biệt về độ chính xác

Câu 4.13
Nếu producer’s accuracy và user’s accuracy khác nhau, các nhà sản xuất và người
dùng có thể chuẩn bị và sử dụng một bản đồ cụ thể để đáp ứng tùy theo nhu cầu.
Các loại cả khóa và giá trị đều do người dùng xác định. Truy cập dựa trên khóa vào
các mục bản đồ cho phép các khả năng xử lý cụ thể của bản đồ khác nhau và nhận
giá trị theo khóa để tách riêng các khóa và giá trị.

Câu 4.14
Trong thục tế có lỗi loại I và lỗi loại II. Trong giả thuyết thống kê thử nghiệm, lỗi
loại I là bác bỏ một giả thuyết đúng (còn được gọi là "dương tính giả" phát hiện
hoặc kết luận), trong khi một lỗi loại II là không bác bỏ một giả thuyết sai (còn
được gọi là một Phát hiện hoặc kết luận "âm tính giả". Phần lớn lý thuyết thống kê

29
xoay quanh việc giảm thiểu một hoặc cả hai lỗi này, mặc dù việc loại bỏ hoàn toàn
một trong hai được coi là không thể thống kê

30

You might also like