study

CNN — ConvNet Max pooling 과 Full Network

kmk_sweetlife 2023. 10. 9. 18:31
반응형

CNN 구조는 몇가지 종류의 레이어로 구성이 되는데, 보통 conv(olutional)레이어, Relu, Pooling, FC 레이어로 구성이 된다.

Pooling

컨볼루셔널 레이어를 거쳐 추출된 특징들은 샘플링의 과정을 거치는데, 이 중 하나인 pooling을 일종의 (down)sampling 과정으로 볼 수 있다. 고해상도 이미지를 보면 이미지가 나타내는 물체가 무엇인지 한번에 파악할 수 있지만, 저해상도 이미지를 보더라도 우리는 어렵지 않게 판단을 내릴 수 있는 원리다.

직전 포스팅에서 필터를 이용해 원본 이미지 사이즈에서 output 사이즈를 구하는 과정에 대해 작성했는데 이 output 을 우리는 activation map이라고 한다. pooling은 이 activation map을 인위적으로 줄이는 작업(=resizing)으로 보면된다.

pooling에는 여러가지 방법이 있고 그 중 Max Pooling은 activation map을 MxN의 사이즈로 잘라낸 후 그 안에서 가장 큰 값을 선택하는 것이다.

가장 큰 값을 갖는 부분이 그 외 부분에 비해 두드러진 특징을 나타내는 영역이라고 보면 된다.