Download as pdf or txt
Download as pdf or txt
You are on page 1of 46

Cơ sở lý thuyết Toán học

• Kỳ vọng
• Phương sai
• Độ lệch chuẩn
• Hiệp phương sai
• Ma trận hiệp phương sai
• Trị riêng và Vector riêng
Giá trị kỳ vọng
Giá trị kỳ vọng(tt)
• Ví dụ: Khảo sát chiều cao của một nhóm
26 học sinh cho kết quả như sau:
Số
đo 155 156 158 159 160 161 162 163 164 165 166 167 168
(cm)

Số
1 1 2 3 2 1 4 5 2 1 2 1 1
học sinh
Phương sai
Phương sai(tt)
• Ví dụ:
Số
đo 155 156-6.8158
= 155159
- 161.8
160 161 162 163 164 165 166 167 168
(cm)
SHS 1 1 2 3 2 1 4 5 2 1 2 1 1
-6.8 -5.8 -3.8 -2.8 -1.8 -0.8 0.2 1.2 2.2 3.2 4.2 5.2 6.2

46.24 33.64 14.44 7.84 3.24 0.64 0.04 1.44 4.84 10.24 17.64 27.04 38.44
Độ lệch chuẩn
• Ý nghĩa:
Độ lệch chuẩn là một đại lượng thống kê dùng
để đo mức độ phân tán của dữ liệu so với giá
trị kỳ vọng.
• Cách tính:
Phương sai và độ lệch chuẩn
Hiệp phương sai
• Ý nghĩa:
Hiệp phương sai là độ đo sự biến thiên cùng
nhau của hai biến ngẫu nhiên (khác với
phương sai – độ đo sự biến thiên của một
biến).
• Cách tính:

• Ví dụ:
kiểu liên hệ hàm số giữa 2 đại lượng biến
thiên chiều cao và cân nặng
Hiệp phương sai
• Ví dụ:
Số
đo 155 156 158 159 160 161 162 163 164 165 166 167 168
(cm)
SHS 1 1 2 3 2 1 4 5 2 1 2 1 1
-6.8 -5.8 -3.8 -2.8 -1.8 -0.8 0.2 1.2 2.2 3.2 4.2 5.2 6.2

Cân
nặng 40 41 42 43 44 45 46 47 48 49 50 51 52
(kg)
SHS 1 1 2 3 2 1 4 5 2 1 2 1 1
-5.9 -4.9 -3.9 -2.9 -1.9 -0.9 0.1 1.1 2.1 3.1 4.1 5.1 6.1
Ma trận hiệp phương sai
• Định nghĩa:
Ma trận hiệp phương sai của tập hợp m
biến ngẫu nhiên là một ma trận vuông (m
× m), trong đó :
– các phần tử nằm trên đường chéo lần lượt
là phương sai tương ứng của các biến này.
– các phần tử còn lại là các hiệp phương sai của
đôi một hai biến ngẫu nhiên khác nhau trong
tập hợp
Ma trận hiệp phương sai
Ví dụ: Tập dữ liệu gồm 3 biến ngẫu nhiên (x,y,z)
Ma trận hiệp phương sai được xây dựng như
sau:
Ma trận hiệp phương sai(tt)
Trị riêng và Vector riêng
Trị riêng và Vector riêng(tt)
Trị riêng và Vector riêng(tt)
MÁY HỌC
Phần II – PHƯƠNG PHÁP PCA
Nhận dạng khuôn mặt
• Tại sao?
– Là nơi chủ yếu tập trung sự chú ý trong giao thiệp
– Thể hiện nhân dạng và xúc cảm
– Nhiều thay đổi

7/23/2014 17
Nhận dạng khuôn mặt
• Các mô hình tính toán
– Nhận dạng tội phạm
– Hệ thống an ninh
– Tương tác giữa người và máy…
• Mục tiêu
– Nhanh
– Đơn giản
– Chính xác trong những môi trường có ràng buộc
• Các đặc trưng cá nhân
– Mắt, mũi miệng, viền đầu…
– Mối quan hệ giữa vị trí và kích cỡ
7/23/2014 18
EigenFaces
• Cách tiếp cận eigenface
– Các ảnh là những điểm trong một không gian vector
– Dùng PCA để giảm số chiều
– Face space
• Sirovich & Kirby 1987
• Kirby & Sirovich 1990
– So sánh phép chiếu trên face space để nhận dạng

7/23/2014 19
Giới thiệu PCA
• Là một trong những kỹ thuật thành công nhất
dùng để nhận dạng và nén ảnh
• Mục tiêu của PCA: giảm số chiều của một tập các
vector sao cho vẫn đảm bảo được tối đa thông
tin quan trọng nhất của tập học.
• PCA có thể: dự đoán, rút trích đặc trưng, nén dữ
liệu,…
• Phù hợp với các ứng dụng có mô hình tuyến tính:
xử lý tín hiệu, xử lý ảnh, truyền thông,…
• Được ứng dụng nhiều nhất trong nhận dạng mặt
người.
7/23/2014 20
Giới thiệu PCA
• Ứng dụng PCA vào trích chọn vector đặc trưng
trong nhận dạng mặt người:
– Ví dụ: Một face image I(x,y) là 1 mảng 2 chiều NxN, cũng
được xem như 1 vector có N2 chiều.
– Ảnh có size 256x256 → 1 vector 65.536 chiều hay 1
điểm trong không gian 65.536 chiều.
– Mỗi pixel sẽ được mã hóa bởi một thành phần của
vector

7/23/2014 21
Giới thiệu PCA
• Ứng dụng PCA vào trích chọn vector đặc trưng
trong nhận dạng mặt người:
– ánh xạ 1 vector từ không gian n chiều xuống
không gian m chiều (m<n), sẽ đi tìm các trị riêng
và vector riêng của ma trận hiệp phương sai C của
tập X và giữ lại m vector riêng ứng với m trị riêng lớn
nhất làm cơ sở cho không gian m chiều này.
• Dựa trên mô hình của lý thuyết thông tin
– Phân chia gương mặt người thành một tập nhỏ các ảnh
đặc trưng gọi là các mặt riêng (eigenface).
– Các mặt riêng này được xem như các thành phần chính
của tập các ảnh gương mặt ban đầu.
7/23/2014 22
Phương pháp PCA
• Quá trình nhận dạng được thực hiện bằng cách:
– Chiếu gương mặt mới lên không gian con được định
hướng bởi các mặt riêng,
– Sau đó so sánh nó với vị trí của các ảnh trong tập ban
đầu trong không gian mặt riêng. Tìm ra ảnh học gần với
ảnh cần nhận dạng nhất.
• Chia thành 2 giai đoạn chính:
– Giai đoạn tìm các mặt riêng (EigenFace)
– Giai đoạn nhận dạng

7/23/2014 23
Phương pháp PCA
Bắt đầu Giai đoạn 1: tìm các mặt riêng (EigenFace)

Tập dữ liệu khuôn E= eigenfaces(trainingSet) W= weights(E, trainingSet)


mặt huấn luyện
(trainingSet)

Input: Ảnh X
Wx=weight(E,X) D=avg(distance(W,Wx))
chưa biết

X là khuôn mặt X không là


khuôn mặt

Giai đoạn 2: nhận


dạng Lưu X và Wx Kết thúc
7/23/2014 24
24
• Training set Ví dụ

7/23/2014 25
Ví dụ (tt)
• Ảnh trung bình

7/23/2014 26
• Eigengace Ví dụ (tt)

7/23/2014 27
• Face space
Ví dụ (tt)

7/23/2014 28
Ví dụ (tt)
• Test image 1

• Test image 2

7/23/2014 29
Giai đoạn 1: Tìm mặt riêng (EigenFace
• Bước 1: Giả sử tập ảnh huấn luyện gồm M ảnh
khuôn mặt: {ᴦ1, ᴦ2,…, ᴦM } có kích thước N*N.

7/23/2014 30
Giai đoạn 1: Tìm mặt riêng (EigenFace
• Bước 2: Tìm ảnh trung bình theo công thức:

• Với tập ảnh huấn luyện trên ta tính được ảnh trung
bình như sau:

7/23/2014 31
Giai đoạn 1: Tìm mặt riêng (EigenFace)
• Bước 3: Tính độ sai khác giữa ảnh huấn luyện ᴦi so
với ảnh trung bình Ψ:
Φi = Γi – ψ
• Bước 4: Tính ma trận hiệp phương sai C (covariance
matrix)

Với A = [Φ1, Φ2,…, ΦM]

7/23/2014 32
Giai đoạn 1: Tìm mặt riêng (EigenFace

Vậy C có kích thước: N2 x N2


Vấn đề về tìm vector riêng (eigenvector) ui của ma trận C
khó thực hiện được vì kích thước quá lớn.
• Để tìm eigenvector ui của C ta thực hiện như sau:
– Giả sử vi là vector riêng của ma trận ATA, tức là:

– Nhân 2 vế với ma trận A ta được:

Như vậy là eigenvector của C 33


Giai đoạn 1: Tìm mặt riêng (EigenFace
• Để tìm eigenvector ui của C ta thực hiện như sau (tt):
– Tìm eigenvector và eigenvalue của ma trận L:

• Hay:

– Khi đó L là ma trận có kích thước là MxM


– Giả sử vi là eigenvector của L tính được:

là eigenvector của C hay còn gọi là mặt riêng (eigenface).


7/23/2014 34
Giai đoạn 1: Tìm mặt riêng (EigenFace
• Từ M eigenvector (ui), chọn ra M’ eigenvector ứng
với M’ giá trị riêng đầu tiên trong mảng các giá trị
riêng (được sắp xếp giảm dần).
• Thường chọn M’ sao cho [3]:

7/23/2014 35
Giai đoạn 1: Tìm mặt riêng (EigenFace
• M=40

7/23/2014 36
Giai đoạn 1: Tìm mặt riêng (EigenFace)
• Với ví dụ tập huấn luyện trên tìm được 7 mặt riêng
có giá trị riêng lớn nhất (M=40 > M’=8)

7/23/2014 37
Giai đoạn 2: Nhận dạng
• Bước 1: Với mỗi ảnh huấn luyện ᴦ1, ᴦ2,…, ᴦM, ta
chiếu lên không gian mặt M’ chiều:

• Với:

7/23/2014 38
Giai đoạn 2: Nhận dạng
• Bước 2: Khuôn mặt mới ᴦ sẽ được chiếu lên không
gian M’ chiều. Kết quả:

• Với:

• Bước 3: Tìm mặt thứ k sao cho:


2
     k   
2
k

Với Ωk là vector mô tả hay đại diện cho mặt thứ k trong tập
huấn luyện, θ là ngưỡng xác định. (khoảng cách Euclide)
7/23/2014 39
Giai đoạn 2: Nhận dạng
• Tuy nhiên, ta cũng cần tính khoảng cách của ảnh
mới đến face space
  f
2

• Với: Φ = Γ – ψ và
 f   i 1 i ui
M'

7/23/2014 40
Giai đoạn 2: Nhận dạng
• Có 4 trường hợp khi nhận dạng khuôn mặt mới:
– Ảnh ở gần không gian mặt và gần 1 lớp ảnh:
   và  k  
• Known faces
– Ảnh ở gần không gian mặt và xa tất cả các lớp ảnh
   và  k  
• Unknown faces
– Ảnh ở xa không gian mặt và ở gần một lớp ảnh
• Non-faces
– Ảnh ở xa không gian mặt và ở xa tất cả các lớp ảnh
• Non-faces

7/23/2014 41
Giai đoạn 2: Nhận dạng
• Nếu ảnh mới được phân lớp thuộc về lớp k nào đó,
ảnh này có thể được thêm vào tập các ảnh ban đầu,
và eigenfaces được tính lại.
• Điều này tạo cơ hội để sửa đổi không gian mặt vì hệ
thống có thêm các mặt được học.
• Khi ảnh được phân lớp là “unknown” thì nó được
dùng để bắt đầu một lớp mặt mới.

7/23/2014 42
Nhận xét
• Các bước xử lý trong phương pháp PCA kết
hợp với phương pháp tính khoảng cách
Euclides tạo nên một thuật toán nhanh, đơn
giản.
• Phương pháp này có ưu điểm:
– Nhanh
– Đơn giản
– Làm việc tốt trong môi trường có ràng buộc về điều kiện
(tập đặc trưng nhỏ, góc nghiên bé, ánh sáng…)
– Không nhạy cảm với những tương đối nhỏ hay từ từ của
gương mặt
– Không phụ thuộc vào mô hình 3 chiều hay các đặc điểm
trên khuôn mặt (mắt, mũi, miệng,…)
7/23/2014 43
Nhận xét
• Nhược điểm:
– PCA phân loại theo chiều phân bố lớn nhất của tập
vector. Tuy nhiên, chiều phân bố lớn nhất không phải
lúc nào cũng mang lại hiệu quả tốt nhất cho bài toán
nhận dạng.
– PCA rất nhạy với nhiễu.

7/23/2014 44
Mở rộng
• Định vị và phát hiện khuôn mặt trong ảnh và video

• Nhận dạng các khuôn mặt mới


7/23/2014 45
Những vấn đề khác
• Khử nền (Eliminating the background)
– Trong thực tế, nền có ảnh hưởng đáng kể đến việc nhận
dạng
– Nhân ảnh đầu vào với “cửa sổ” gaussian 2 chiều trên
khuôn mặt.
• Tỉ lệ (head size) và hướng không thay đổi
• Phân bố trong face space
• Nhiều góc nhìn

7/23/2014 46

You might also like