본문 바로가기

Deep learning

[Deep Learning] Faster R-CNN

by boooluve2 2024. 5. 23.

Faster R-CNN(Faster Region with Convolutional Neural Networks)

- GPU에서 4~5FPS 성능 도달

- 정확한 결과를 얻기 위해 두 단계로 작동

관심영역(RoI) : 이미지에서 객체를 포함할 수 있는 영역
분류단계(=탐지단계) : 2,000개 RoI 각각에 대해 합성곱 네트워크의 입력에 맞춰 정사각형으로 크기를 조정 -> 그 다음 CNN을 사용해 RoI 분류

1단계 - 영역제안

관심 영역은 영역 제안 네트워크(region proposal network, RPN)를 사용해 생성
ROI를 생성하기 위해 합성곱 계층 사용
YOLO와 완전히 동일하지는 않음
RPN은 입력으로 이미지를 받고 관심 영역을 출력 -> 각 관심영역은 경계 상자와 객체성 확률로 구성
숫자를 생성하기 위해 CNN을 사용해 특징 볼륨 추출 -> 영역, 좌표, 확률 생성

2단계 - 분류

최종 경계 상자를 출력하고, 이전 단계의 RoI 리스트와 입력 이미지에서 계산된 특징 볼륨을 두개의 입력으로 받음
가중치 공유 - 다른 CNN을 사용하려면 두개의 백본(RPN, 분류)에 대한 가중치를 저장해야 함
계산 공유 - 하나의 입력 이미지에 대해 한 개의 특징 볼륨만 계산

'Deep learning' 카테고리의 다른 글

[ Yolov5/object detection] Custom Dataset을 통한 객체 탐지 모델 구현하기 (0)	2024.08.14

티스토리툴바