Cơ sở lý thuyết Toán học

Cơ sở lý thuyết Toán học
• Kỳ vọng
• Phương sai
• Độ lệch chuẩn
• Hiệp phương sai
• Ma trận hiệp phương sai
• Trị riêng và Vector riêng
Giá trị kỳ vọng
Giá trị kỳ vọng(tt)
• Ví dụ: Khảo sát chiều cao của một nhóm
26 học sinh cho kết quả như sau:
Số
đo 155 156 158 159 160 161 162 163 164 165 166 167 168
(cm)
Số
1 1 2 3 2 1 4 5 2 1 2 1 1
học sinh
Phương sai
Phương sai(tt)
• Ví dụ:
Số
đo 155 156-6.8158
= 155159
- 161.8
160 161 162 163 164 165 166 167 168
(cm)
SHS 1 1 2 3 2 1 4 5 2 1 2 1 1
-6.8 -5.8 -3.8 -2.8 -1.8 -0.8 0.2 1.2 2.2 3.2 4.2 5.2 6.2
46.24 33.64 14.44 7.84 3.24 0.64 0.04 1.44 4.84 10.24 17.64 27.04 38.44
Độ lệch chuẩn
• Ý nghĩa:
Độ lệch chuẩn là một đại lượng thống kê dùng
để đo mức độ phân tán của dữ liệu so với giá
trị kỳ vọng.
• Cách tính:
Phương sai và độ lệch chuẩn
Hiệp phương sai
• Ý nghĩa:
Hiệp phương sai là độ đo sự biến thiên cùng
nhau của hai biến ngẫu nhiên (khác với
phương sai – độ đo sự biến thiên của một
biến).
• Cách tính:
• Ví dụ:
kiểu liên hệ hàm số giữa 2 đại lượng biến
thiên chiều cao và cân nặng
Hiệp phương sai
• Ví dụ:
Số
đo 155 156 158 159 160 161 162 163 164 165 166 167 168
(cm)
SHS 1 1 2 3 2 1 4 5 2 1 2 1 1
-6.8 -5.8 -3.8 -2.8 -1.8 -0.8 0.2 1.2 2.2 3.2 4.2 5.2 6.2
Cân
nặng 40 41 42 43 44 45 46 47 48 49 50 51 52
(kg)
SHS 1 1 2 3 2 1 4 5 2 1 2 1 1
-5.9 -4.9 -3.9 -2.9 -1.9 -0.9 0.1 1.1 2.1 3.1 4.1 5.1 6.1
Ma trận hiệp phương sai
• Định nghĩa:
Ma trận hiệp phương sai của tập hợp m
biến ngẫu nhiên là một ma trận vuông (m
× m), trong đó :
– các phần tử nằm trên đường chéo lần lượt
là phương sai tương ứng của các biến này.
– các phần tử còn lại là các hiệp phương sai của
đôi một hai biến ngẫu nhiên khác nhau trong
tập hợp
Ma trận hiệp phương sai
Ví dụ: Tập dữ liệu gồm 3 biến ngẫu nhiên (x,y,z)
Ma trận hiệp phương sai được xây dựng như
sau:
Ma trận hiệp phương sai(tt)
Trị riêng và Vector riêng
Trị riêng và Vector riêng(tt)
Trị riêng và Vector riêng(tt)
MÁY HỌC
Phần II – PHƯƠNG PHÁP PCA
Nhận dạng khuôn mặt
• Tại sao?
– Là nơi chủ yếu tập trung sự chú ý trong giao thiệp
– Thể hiện nhân dạng và xúc cảm
– Nhiều thay đổi
7/23/2014 17
Nhận dạng khuôn mặt
• Các mô hình tính toán
– Nhận dạng tội phạm
– Hệ thống an ninh
– Tương tác giữa người và máy…
• Mục tiêu
– Nhanh
– Đơn giản
– Chính xác trong những môi trường có ràng buộc
• Các đặc trưng cá nhân
– Mắt, mũi miệng, viền đầu…
– Mối quan hệ giữa vị trí và kích cỡ
7/23/2014 18
EigenFaces
• Cách tiếp cận eigenface
– Các ảnh là những điểm trong một không gian vector
– Dùng PCA để giảm số chiều
– Face space
• Sirovich & Kirby 1987
• Kirby & Sirovich 1990
– So sánh phép chiếu trên face space để nhận dạng
7/23/2014 19
Giới thiệu PCA
• Là một trong những kỹ thuật thành công nhất
dùng để nhận dạng và nén ảnh
• Mục tiêu của PCA: giảm số chiều của một tập các
vector sao cho vẫn đảm bảo được tối đa thông
tin quan trọng nhất của tập học.
• PCA có thể: dự đoán, rút trích đặc trưng, nén dữ
liệu,…
• Phù hợp với các ứng dụng có mô hình tuyến tính:
xử lý tín hiệu, xử lý ảnh, truyền thông,…
• Được ứng dụng nhiều nhất trong nhận dạng mặt
người.
7/23/2014 20
Giới thiệu PCA
• Ứng dụng PCA vào trích chọn vector đặc trưng
trong nhận dạng mặt người:
– Ví dụ: Một face image I(x,y) là 1 mảng 2 chiều NxN, cũng
được xem như 1 vector có N2 chiều.
– Ảnh có size 256x256 → 1 vector 65.536 chiều hay 1
điểm trong không gian 65.536 chiều.
– Mỗi pixel sẽ được mã hóa bởi một thành phần của
vector
7/23/2014 21
Giới thiệu PCA
• Ứng dụng PCA vào trích chọn vector đặc trưng
trong nhận dạng mặt người:
– ánh xạ 1 vector từ không gian n chiều xuống
không gian m chiều (m<n), sẽ đi tìm các trị riêng
và vector riêng của ma trận hiệp phương sai C của
tập X và giữ lại m vector riêng ứng với m trị riêng lớn
nhất làm cơ sở cho không gian m chiều này.
• Dựa trên mô hình của lý thuyết thông tin
– Phân chia gương mặt người thành một tập nhỏ các ảnh
đặc trưng gọi là các mặt riêng (eigenface).
– Các mặt riêng này được xem như các thành phần chính
của tập các ảnh gương mặt ban đầu.
7/23/2014 22
Phương pháp PCA
• Quá trình nhận dạng được thực hiện bằng cách:
– Chiếu gương mặt mới lên không gian con được định
hướng bởi các mặt riêng,
– Sau đó so sánh nó với vị trí của các ảnh trong tập ban
đầu trong không gian mặt riêng. Tìm ra ảnh học gần với
ảnh cần nhận dạng nhất.
• Chia thành 2 giai đoạn chính:
– Giai đoạn tìm các mặt riêng (EigenFace)
– Giai đoạn nhận dạng
7/23/2014 23
Phương pháp PCA
Bắt đầu Giai đoạn 1: tìm các mặt riêng (EigenFace)
Tập dữ liệu khuôn E= eigenfaces(trainingSet) W= weights(E, trainingSet)

mặt huấn luyện
(trainingSet)
Input: Ảnh X
Wx=weight(E,X) D=avg(distance(W,Wx))
chưa biết
X là khuôn mặt X không là

khuôn mặt
Giai đoạn 2: nhận

dạng Lưu X và Wx Kết thúc
7/23/2014 24
24
• Training set Ví dụ
7/23/2014 25
Ví dụ (tt)
• Ảnh trung bình
7/23/2014 26
• Eigengace Ví dụ (tt)
7/23/2014 27
• Face space
Ví dụ (tt)
7/23/2014 28
Ví dụ (tt)
• Test image 1
• Test image 2
7/23/2014 29
Giai đoạn 1: Tìm mặt riêng (EigenFace
• Bước 1: Giả sử tập ảnh huấn luyện gồm M ảnh
khuôn mặt: {ᴦ1, ᴦ2,…, ᴦM } có kích thước N*N.
7/23/2014 30
• Bước 2: Tìm ảnh trung bình theo công thức:
• Với tập ảnh huấn luyện trên ta tính được ảnh trung
bình như sau:
7/23/2014 31
Giai đoạn 1: Tìm mặt riêng (EigenFace)
• Bước 3: Tính độ sai khác giữa ảnh huấn luyện ᴦi so
với ảnh trung bình Ψ:
Φi = Γi – ψ
• Bước 4: Tính ma trận hiệp phương sai C (covariance
matrix)
Với A = [Φ1, Φ2,…, ΦM]
7/23/2014 32
Vậy C có kích thước: N2 x N2

Vấn đề về tìm vector riêng (eigenvector) ui của ma trận C
khó thực hiện được vì kích thước quá lớn.
• Để tìm eigenvector ui của C ta thực hiện như sau:
– Giả sử vi là vector riêng của ma trận ATA, tức là:
– Nhân 2 vế với ma trận A ta được:
Như vậy là eigenvector của C 33

• Để tìm eigenvector ui của C ta thực hiện như sau (tt):
– Tìm eigenvector và eigenvalue của ma trận L:
• Hay:
– Khi đó L là ma trận có kích thước là MxM

– Giả sử vi là eigenvector của L tính được:
là eigenvector của C hay còn gọi là mặt riêng (eigenface).

7/23/2014 34
• Từ M eigenvector (ui), chọn ra M’ eigenvector ứng
với M’ giá trị riêng đầu tiên trong mảng các giá trị
riêng (được sắp xếp giảm dần).
• Thường chọn M’ sao cho [3]:
7/23/2014 35
• M=40
7/23/2014 36
Giai đoạn 1: Tìm mặt riêng (EigenFace)
• Với ví dụ tập huấn luyện trên tìm được 7 mặt riêng
có giá trị riêng lớn nhất (M=40 > M’=8)
7/23/2014 37
Giai đoạn 2: Nhận dạng
• Bước 1: Với mỗi ảnh huấn luyện ᴦ1, ᴦ2,…, ᴦM, ta
chiếu lên không gian mặt M’ chiều:
• Với:
7/23/2014 38
• Bước 2: Khuôn mặt mới ᴦ sẽ được chiếu lên không
gian M’ chiều. Kết quả:
• Với:
• Bước 3: Tìm mặt thứ k sao cho:

2
     k   
2
k
Với Ωk là vector mô tả hay đại diện cho mặt thứ k trong tập
huấn luyện, θ là ngưỡng xác định. (khoảng cách Euclide)
7/23/2014 39
• Tuy nhiên, ta cũng cần tính khoảng cách của ảnh
mới đến face space
  f
2
• Với: Φ = Γ – ψ và
 f   i 1 i ui
M'
7/23/2014 40
• Có 4 trường hợp khi nhận dạng khuôn mặt mới:
– Ảnh ở gần không gian mặt và gần 1 lớp ảnh:
   và  k  
• Known faces
– Ảnh ở gần không gian mặt và xa tất cả các lớp ảnh
   và  k  
• Unknown faces
– Ảnh ở xa không gian mặt và ở gần một lớp ảnh
• Non-faces
– Ảnh ở xa không gian mặt và ở xa tất cả các lớp ảnh
• Non-faces
7/23/2014 41
• Nếu ảnh mới được phân lớp thuộc về lớp k nào đó,
ảnh này có thể được thêm vào tập các ảnh ban đầu,
và eigenfaces được tính lại.
• Điều này tạo cơ hội để sửa đổi không gian mặt vì hệ
thống có thêm các mặt được học.
• Khi ảnh được phân lớp là “unknown” thì nó được
dùng để bắt đầu một lớp mặt mới.
7/23/2014 42
Nhận xét
• Các bước xử lý trong phương pháp PCA kết
hợp với phương pháp tính khoảng cách
Euclides tạo nên một thuật toán nhanh, đơn
giản.
• Phương pháp này có ưu điểm:
– Nhanh
– Đơn giản
– Làm việc tốt trong môi trường có ràng buộc về điều kiện
(tập đặc trưng nhỏ, góc nghiên bé, ánh sáng…)
– Không nhạy cảm với những tương đối nhỏ hay từ từ của
gương mặt
– Không phụ thuộc vào mô hình 3 chiều hay các đặc điểm
trên khuôn mặt (mắt, mũi, miệng,…)
7/23/2014 43
Nhận xét
• Nhược điểm:
– PCA phân loại theo chiều phân bố lớn nhất của tập
vector. Tuy nhiên, chiều phân bố lớn nhất không phải
lúc nào cũng mang lại hiệu quả tốt nhất cho bài toán
nhận dạng.
– PCA rất nhạy với nhiễu.
7/23/2014 44
Mở rộng
• Định vị và phát hiện khuôn mặt trong ảnh và video
• Nhận dạng các khuôn mặt mới

7/23/2014 45
Những vấn đề khác
• Khử nền (Eliminating the background)
– Trong thực tế, nền có ảnh hưởng đáng kể đến việc nhận
dạng
– Nhân ảnh đầu vào với “cửa sổ” gaussian 2 chiều trên
khuôn mặt.
• Tỉ lệ (head size) và hướng không thay đổi
• Phân bố trong face space
• Nhiều góc nhìn
7/23/2014 46

Cơ sở lý thuyết Toán học

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Cơ sở lý thuyết Toán học

Uploaded by

Copyright:

Available Formats

Cơ sở lý thuyết Toán học

Tập dữ liệu khuôn E= eigenfaces(trainingSet) W= weights(E, trainingSet)

X là khuôn mặt X không là

Giai đoạn 2: nhận

Với A = [Φ1, Φ2,…, ΦM]

Vậy C có kích thước: N2 x N2

– Nhân 2 vế với ma trận A ta được:

Như vậy là eigenvector của C 33

– Khi đó L là ma trận có kích thước là MxM

là eigenvector của C hay còn gọi là mặt riêng (eigenface).

• Bước 3: Tìm mặt thứ k sao cho:

• Nhận dạng các khuôn mặt mới

You might also like