티스토리 뷰
CNN의 시작은 고양이의 시신경을 실험하면서 어떤 이미지를 보여줄 때 뇌 전체가 아닌 일부만 활성화된다는 사실을 알게되면서 부터다.
이미지로 시작하기
32X32X3 사이즈의 이미지를 입력받는다고 가정했을 때, 이미지의 일부인 5X5X3사이즈의 영역만 -이 일부를 필터라고 부른다- 읽어들인다. 이 때 필터가 하는 일은 궁극적으로 하나의 값(number)을 만들어내는 것이다. = Wx+b를 이용해 한 값을 만들어낸다.

전체 이미지에 대해 몇개의 필터 즉, 값이 필요한 것일까?
이 전체 사이즈(32X32X3)중 일부만 잘라내기 위해 5X5X3 필터를 이용한다고 가정해보자. 이 때 필터의 역할은 잘라낸 이미지를 통해 하나의 값을 추출해 내는 것이다. W의 값은 필터의 값이라고 보면된다.
필터는 전체 이미지를 훑으면서 NxN 형태의 결과값을 리턴한다.

Stride는 필터가 한번 움직일때 얼마나 큰 보폭으로 움직이는가를 의미한다. 1이면 1칸씩, 2면 2칸씩.
Stride의 값에 따라서 output이 정해지는데 이 때 output을 구하는 공식은 아래와 같다.
OUTPUT = (원본이미지 사이즈 — 필터이미지 사이즈)/stride + 1
이런식으로 계속 진행하다보면 output의 사이즈가 원본이미지의 사이즈와 비교했을 때 점점 작아지는 결과가 발생하는데, 이를 방지하기 위해 기존 원본이미지에 0 사이즈의 패딩을 추가해준다. 예를 들면 위 7x7의 원본 사이즈에 패딩이 추가되면 9x9사이즈가 되고, stride = 1 로 3x3필터를 적용하면 7x7의 output, 즉 원본 사이즈와 동일한 사이즈가 출력될 수 있다.
'study' 카테고리의 다른 글
Q-learning, Exploitation & Exploration (0) | 2023.10.12 |
---|---|
CNN — ConvNet Max pooling 과 Full Network (0) | 2023.10.09 |
ML — NN Dropout & Model Ensemble (0) | 2023.10.09 |
ML — weight 값 초기화하기 (0) | 2023.10.09 |
ML — 딥러닝으로 XOR 문제 풀기 (0) | 2023.10.09 |
- Total
- Today
- Yesterday
- 아야진
- 안젤라유강의
- 안젤라유파이썬
- 고성
- 파이썬초급강의
- 프랑스어문법
- 파이썬 안젤라유 강의
- 파이썬thonny
- 파이썬for문
- 파이썬 초급강의
- 파이썬안젤라유강의
- 유데미파이썬강의
- 반과거
- 파이썬디버거
- 아야진해변
- 숫자업다운게임
- 파이썬 게임 만들기
- higherlower게임
- 파이썬안젤라유
- 복합과거
- 파이썬반복문
- 벡터
- 파이썬전역범위
- higher lower game
- 파이썬강의소개
- 불어문법
- 선형대수
- 큐러닝
- qlearning
- 파이썬디버깅
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |