본문 바로가기
Deep learning

[Deep Learning] Faster R-CNN

by boooluve2 2024. 5. 23.
반응형

Faster R-CNN(Faster Region with Convolutional Neural Networks)

- GPU에서 4~5FPS 성능 도달

- 정확한 결과를 얻기 위해 두 단계로 작동

  1. 관심영역(RoI) : 이미지에서 객체를 포함할 수 있는 영역
  2. 분류단계(=탐지단계) : 2,000개 RoI 각각에 대해 합성곱 네트워크의 입력에 맞춰 정사각형으로 크기를 조정 -> 그 다음 CNN을 사용해 RoI 분류

1단계 - 영역제안

  • 관심 영역은 영역 제안 네트워크(region proposal network, RPN)를 사용해 생성
  • ROI를 생성하기 위해 합성곱 계층 사용
  • YOLO와 완전히 동일하지는 않음
  • RPN은 입력으로 이미지를 받고 관심 영역을 출력 -> 각 관심영역은 경계 상자와 객체성 확률로 구성
  • 숫자를 생성하기 위해 CNN을 사용해 특징 볼륨 추출 -> 영역, 좌표, 확률 생성

2단계 - 분류

  • 최종 경계 상자를 출력하고, 이전 단계의 RoI 리스트와 입력 이미지에서 계산된 특징 볼륨을 두개의 입력으로 받음
  • 가중치 공유 - 다른 CNN을 사용하려면 두개의 백본(RPN, 분류)에 대한 가중치를 저장해야 함
  • 계산 공유 - 하나의 입력 이미지에 대해 한 개의 특징 볼륨만 계산
반응형