반응형
Faster R-CNN(Faster Region with Convolutional Neural Networks)
- GPU에서 4~5FPS 성능 도달
- 정확한 결과를 얻기 위해 두 단계로 작동
- 관심영역(RoI) : 이미지에서 객체를 포함할 수 있는 영역
- 분류단계(=탐지단계) : 2,000개 RoI 각각에 대해 합성곱 네트워크의 입력에 맞춰 정사각형으로 크기를 조정 -> 그 다음 CNN을 사용해 RoI 분류
1단계 - 영역제안
- 관심 영역은 영역 제안 네트워크(region proposal network, RPN)를 사용해 생성
- ROI를 생성하기 위해 합성곱 계층 사용
- YOLO와 완전히 동일하지는 않음
- RPN은 입력으로 이미지를 받고 관심 영역을 출력 -> 각 관심영역은 경계 상자와 객체성 확률로 구성
- 숫자를 생성하기 위해 CNN을 사용해 특징 볼륨 추출 -> 영역, 좌표, 확률 생성
2단계 - 분류
- 최종 경계 상자를 출력하고, 이전 단계의 RoI 리스트와 입력 이미지에서 계산된 특징 볼륨을 두개의 입력으로 받음
- 가중치 공유 - 다른 CNN을 사용하려면 두개의 백본(RPN, 분류)에 대한 가중치를 저장해야 함
- 계산 공유 - 하나의 입력 이미지에 대해 한 개의 특징 볼륨만 계산
반응형
'Deep learning' 카테고리의 다른 글
[ Yolov5/object detection] Custom Dataset을 통한 객체 탐지 모델 구현하기 (0) | 2024.08.14 |
---|