Professional Documents
Culture Documents
Padding과 Stride, Max Pooling과 Average Pooling
Padding과 Stride, Max Pooling과 Average Pooling
Padding과 Stride,
Max Pooling과 Average Pooling
3차시
학습목표
합성곱 레이어의 효율을 올리기 위한 방법들, Padding과
Stride, Pooling에 대해 설명할 수 있다.
학습내용
1 Padding과 Stride
2 Pooling
3 NHWC Format
01
Padding과 Stride
출력 이미지 크기
[ Kernel 크기 ] [ 입력 이미지 크기 ]
WK : 가로 W : 가로
HK : 세로 H : 세로
<input>
1 0 0 0 0 <kernel> <output>
0 1 0 0 0 1 0 0 3 0 0
𝑾𝑾 − 𝑾𝑾 0 +0 𝟏𝟏 ×0 1𝑯𝑯 0− 𝑯𝑯𝒌𝒌0 +3 𝟏𝟏0
0 0 1 𝒌𝒌
0 0 0 1 0 0 0 1 0 0 3
0 0 0 0 1
Padding
0 0 0 0 0 0 0
0 1 0 0 0 0 0
0 0 1 0 0 0 0
0 0 0 1 0 0 0
0 0 0 0 1 0 0
0 0 0 0 0 1 0
0 0 0 0 0 0 0
Padding
<input>
0 0 0 0 0 0 0 <output>
0 1 0 0 0 0 0 <kernel>
0 0 1 0 0 0 0 1 0 0
0 0 0 1 0 0 0 0 1 0
0 0 0 0 1 0 0 0 0 1
0 0 0 0 0 1 0
0 0 0 0 0 0 0
Padding을 사용하면 기존 크기를 보존하거나 줄어들도록 할 수 있음
출력 이미지 크기
[ Kernel 크기 ] [ 입력 이미지 크기 ]
WK : 가로 W : 가로
HK : 세로 H : 세로
[ Padding ]
WP : 좌우
HP : 위아래
출력 이미지 크기
Same Padding
<input>
0 0 0 0 0 0 0 <output>
0 1 0 0 0 0 0 <kernel> 2 0 0 0 0
0 0 1 0 0 0 0 1 0 0 0 3 0 0 0
0 0 0 1 0 0 0 0 1 0 0 0 3 0 0
0 0 0 0 1 0 0 0 0 1 0 0 0 3 0
0 0 0 0 0 1 0 0 0 0 0 2
0 0 Valid
0 Padding
0 0 0 0
<input>
1 0 0 0 0 <kernel> <output>
0 1 0 0 0 1 0 0
0 0 1 0 0 0 1 0
0 0 0 1 0 0 0 1
0 0 0 0 1
<input>
1 0 0 0 0 <kernel> <output>
0 1 0 0 0 1 0 0 3 0
0 0 1 0 0 0 1 0 0 3
0 0 0 1 0 0 0 1
0 0 0 0 1
출력 이미지 크기
<input>
0 0 0 0 0 0 0
0 1 0 0 0 0 0 <kernel> <output>
0 0 1 0 0 0 0 1 0 0 2 0 0
0 0 0 1 0 0 0 0 1 0 0 3 0
0 0 0 0 1 0 0 0 0 1 0 0 2
0 0 0 0 0 1 0
0 0 0 0 0 0 0
출력 이미지 크기
[ Kernel 크기 ] [ 입력 이미지 크기 ]
WK : 가로 W : 가로
HK : 세로 H : 세로
[ Padding ] [ Stride ]
WP : 좌우 Ws : 수평방향
HP : 위아래 Hs : 수직방향
출력 이미지 크기
<input>
0 0 0 0 0 0 0
0 1 0 0 0 0 0 <kernel> <output>
0 0 1 0 0 0 0 1 0 0 2 0 0
0 0 0 1 0 0 0 0 1 0 0 3 0
0 0 0 0 1 0 0 0 0 1 0 0 2
0 0 0 0 0 1 0
0 0 0 0 0 0 0 𝑾𝑾 + 𝟐𝟐𝟐𝟐𝑷𝑷 − 𝑾𝑾𝒌𝒌 𝑯𝑯 + 𝟐𝟐𝟐𝟐𝑷𝑷 − 𝑯𝑯𝒌𝒌
+ 𝟏𝟏 × + 𝟏𝟏
𝑾𝑾𝑺𝑺 𝑯𝑯𝑺𝑺
출력 이미지 크기
<input>
0 0 0 0 0 0 0
0 1 0 0 0 0 0 <kernel> <output>
0 0 1 0 0 0 0 1 0 0 2 0 0
0 0 0 1 0 0 0 0 1 0 0 3 0
0 0 0 0 1 0 0 0 0 1 0 0 2
0 0 0 0 0 1 0
0 0 0 0 0 0 0 𝟓𝟓 + 𝟐𝟐 − 𝟑𝟑 𝟓𝟓 + 𝟐𝟐 − 𝟑𝟑
+ 𝟏𝟏 × + 𝟏𝟏 = 𝟑𝟑 𝑿𝑿 𝟑𝟑
𝟐𝟐 𝟐𝟐
02
Pooling
Max pooling
Max pooling
<input>
1 0 0 0 <output>
0 0 0 1 1 1
0 0 0 0 0 1
0 0 0 1
Kernel 영역 내 가장 큰 값을 선택하므로
정보의 손실 발생
Average Pooling
<input>
1 0 0 0 <output>
0 0 0 1 1/4 1/4
0 0 0 0 0 1/4
0 0 0 1
03
NHWC Format
Channel Shape
입력 이미지나 첫 번째 레이어는 조정 필요