Basic | CNN(Convolutional Neural Network) 딥러닝 모델 기초

난 CNN에서 이해가 안되는 게 너무 많아

합성곱 연산을 통해 이미지의 feature를 extract하고 마지막에 fc 레이어를 통해 분류하는 구조

  • 그런데 channel이랑 filter 개수랑 어떻게 다른거임 -> channel은 conv 연산시에만 분리되고 결국 하나의 feature map으로 합쳐진다. filter는 개수에 따라 feature map이 생김 ??? 근데 구조 표시할 때 (가로 x 세로 x 채널)
  • filter 개수 = output 채널 = feature map 개수 ?????????

  • filter에 따라 conv 연산 결과로 나오는 feature map이 다 다를텐데 filter는 어떻게, 누가 만드는 건가.

  • 우리가 지정해주는 64개의 filter는 각 채널에 적용되는 건지?
  • 이미지가 흑백 또는 컬러니까 채널은 1개 혹은 3개 뿐인지
  • RGB 컬러 이미지에서 채널이 3개이면, 채널마다 각각 다른 필터가 적용되지만 결국 출력 feature map은 하나다. (해당 위치의 값들을 다 더함)

  • 이미지의 채널이 3개면, 적용되는 필터의 채널도 3개다. -> feature map은 한 개
  • 채널이 3개인 필터가 n개 있는거임.

Reference

  • https://rubber-tree.tistory.com/entry/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EB%AA%A8%EB%8D%B8-CNN-Convolutional-Neural-Network-%EC%84%A4%EB%AA%85
  • http://taewan.kim/post/cnn/