Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 5

Đại học Bách Khoa TP.HCM ĐỀ THI HỌC KỲ 1.

Năm học 2018-2019


Khoa Điện – Điện Tử Môn: Thị giác máy tính
Bộ môn ĐKTĐ Ngày thi: 16/01/2019
------ Thời gian làm bài: 90 phút
(Học viên được phép sử dụng tài liệu và laptop không nối mạng)

Họ tên: MSHV:
Bài 1: (1 điểm) Trình bày những nội dung cơ bản của phép biến đổi Hough.
Biến đổi từ miền x,y sang miền a,b với a,b là hệ số đường thẳng đi qua 2 điểm trong mặt phẳng x,y.
Ứng với mỗi điểm x,y sẽ có 1 đường thẳng quỹ tích đi qua các điểm a,b trong mặt phẳng a,b. Biểu
diễn tất cả đường thẳng quỹ tích a,b trong miền a,b ứng với mỗi điểm x,y trong mặt phẳng x,y. Các
đường thẳng a,b giao nhau tại a’,b’. a’,b’ chính là hệ số đường thẳng đi qua các điểm x,y trong mặt
phẳng x,y
Bài 2: (1 điểm) Trình bày những nội dung cơ bản của phương pháp nhận dạng khuôn mặt Viola –
Jones.
- Sử dụng 1 cửa sổ trượt trên từng vùng trên khung hình với bước nhảy cố định, và phân loại
trong cửa sổ đó là khuôn mặt hay không phải khuôn mặt
- Sử dụng 4 loại đặc trưng + vị trí và kích thước tạo ra 160K features. Chọn lọc ra các đặc
trưng tốt nhất, có trường hợp sai là ít nhất  6K features.

-
1 là Face, 0 là non face
fi là độ chênh lệch giữa tổng pixel bên vùng đen và tổng giá trị pixel bên vùng trắng
pi quyết định đến dấu của đẳng thức, ví dụ quyết định đến vùng trắng của đặc trưng nằm
bên trái hay bên phải

Quá trình training là để tìm ra ngưỡng theta phù hợp cho mỗi classifer đặc trưng
- Mỗi 1 đặc trưng là một bộ classifer yếu
- Sử dụng thuật toán Adaboost để kết hợp classifer yếu thành 1 classifer mạnh
- Sử dụng Cấu trúc cascade để phân loại với 38 tầng. (Mỗi tầng gồm nhiều classifer yếu được
kết hợp với nhau thành classifer mạnh)

Bài 3: (1 điểm) So sánh thuật toán Meanshift và Camshift.


1
Bài 4: (2 điểm) Cho ảnh 3 bit kích thước 5x5, bộ lọc thông thấp và bộ lọc Laplacian như hình vẽ.

a. Xác định giá trị tại điểm ảnh (2,1) sau khi áp dụng bộ lọc trung bình kích thước 3x3 lên ảnh gốc
= (0+5+1+2+3+3+2+3+7)/9=2.888  3
b. Xác định giá trị tại điểm ảnh (2,1) sau khi áp dụng bộ lọc trung vị kích thước 3x3 lên ảnh gốc
Sắp xếp các giá trị 0 1 2 2 3 3 3 5 7  3
c. Xác định giá trị tại điểm ảnh (2,1) sau khi áp dụng bộ lọc Laplacian lên ảnh gốc
(5+2+3+3+3*-4) = 1
d. Xác định giá trị tại điểm ảnh (2,1) sau khi áp dụng bộ lọc thông thấp lên ảnh gốc
0.02(0+1+2+7)+0.1(2+3+3+5)+0.52*3 = 3.06  3
e. Xác định dx, dy tại điểm ảnh (2,1)
dx = 3 – 3 =0
dy = 3 - 3 = 0
f. Xác định và vẽ lược đồ histogram của ảnh gốc
0: 2/25
1: 4/25
2: 4/25
3: 4/25
4: 2/25
5: 4/25
6: 2/25
7: 3/25

g. Xác định ảnh mới sau khi cân bằng histogram.


S0 = T(0) = 2/25 ~ 1/7 = 1
S1 = T(1) = 2/25 + 4/25 ~ 2/7  2
S2 = T(2) = 2/25 + 4/25 + 4/25 ~ 3/7  3
S3 = T(3) = 2/25 + 4/25 + 4/25 +4/25 ~ 4/7  4
S4 = T(4) = 2/25 + 4/25 + 4/25 +4/25 + 2/25 ~ 4/7  4
S5 = T(5) = 2/25 + 4/25 + 4/25 +4/25 + 2/25 + 4/25 ~ 6/7  6
S6 = T(6) = 2/25 + 4/25 + 4/25 +4/25 + 2/25 + 4/25 + 2/25 ~ 6/7  6
2
S7 = T(7) = 1  7
7 2 6 4 2
1 6 2 1 3
3 4 4 6 6
3 4 7 3 6
6 4 4 2 7

Bài 5: (1 điểm) Cho ảnh nhị phân kích thước 6x6 như hình vẽ trong đó các ô trống có giá trị 0. Xác
định ma trận accumulator cell A ( ρ , θ ) (xét các giá trị θ=00 , 450 , 900 và các giá trị ρ thích hợp).

0 45 90
0 0 0 1
1 4 1 2
2 1 1 2
3 1 2 2
4 1 2 0
5 4 0 4

Bài 6: (1.5 điểm) Cho ảnh và structuring element SE (gốc tọa độ SE trùng với tâm SE) như hình vẽ.
Xác định ảnh cuối cùng thu được sau khi áp dụng lần lượt dilation và erosion (HV ghi vào hình bên
phải và nộp lại đề).

1 1 1 1 1
1 1 1 1 1
1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1

1 1 1
1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1 1
1 1 1 1 1 1

Bài 7: (1.5 điểm) Cho mạng CNN như hình vẽ.

3
a. Có những loại lớp (layer) nào? Số lượng lớp của mỗi loại?
+ Input layer : 1
+ Output layer : 1
+ Convolution layer : 3
+ Fully connected layer : 3
+ Pooling layer: 3
b. Ảnh đầu vào có kích thước bao nhiêu, biết stride S = 1 và biết số zero-padding P = 0?
Là ảnh màu hay ảnh xám?
Do convolution có kích thước 94x94 nên kích thước ngõ vào là (94+1)x(94+1) =
95x95 và ảnh xám.
c. Lớp tích chập thứ hai có bao nhiêu kernel? Mỗi kernel có kích thước bao nhiêu? Lớp
này có tổng cộng bao nhiêu tham số?
Có 96 kernel, mỗi kernel có kích thước 2x2x32 nên có 96(2x2x32+1) thông số
d. Mạng này có thể dùng để phân loại 35 loài động vật khác nhau hay không? Tại sao?
Không, vì ở lớp output layer có 30 ngõ ra trong khi 35 loài động vật cần có 35 ngõ ra
theo one hot coding

Bài 8: (1 điểm) Cho mạng CNN có lớp đầu tiên là lớp tích chập với stride S = 1, số zero padding P
= 0 và 2 kernel K1, K2 như sau:

Ngõ vào I của mạng CNN là một ảnh màu gồm 3 kênh màu I r, Ig, Ib, mỗi kênh có kích thước 3 pixel
x 3 pixel.

Xác định các activation map, biết mạng sử dụng hàm ReLU và bias1 = –14, bias2 = –10.
Activation map có kích thước 2x2x2:
Ứng với kernel 1 2x2x3:

A11 = (2 + 1) + (1+2) + (3+1+3) -14 = -1

4
A12 = (0+4) + (4+0) + (2+3+2) -14 = 1
A21 = (0+3)+(0+0)+(1+2+1) - 14 = -7
A22 = (1+1) + (2+3) + (3+1+0) - 14 = -3
0 1
0 0
Ứng với kernel 2 2x2x3:
1 2
0 (A = -2) 5

Lưu ý: HV tự nêu thêm các giả thiết và dữ liệu nếu cần.

Hết.

GV ra đề Trưởng Bộ môn

Phạm Việt Cường

You might also like