목록paper_review/CNN (7)
RECORD AI

EfficientDet : Scalable and Efficient Object Detection 1. Introduction 정확한 object detection을 위한 발전이 이루어지지만 그만큼 비용이 비싸지고 있다. 큰 모델 사이즈와 비싼 계산비용으로 대기시간(latency)이 매우 제한되어 로봇 공학 및 자율주행 자동차와 같은 application 배포를 하는데 어려움이 발생한다. one-stage, anchor-free detectors, 기존모델을 압축한것과 같은 효율적인 detertor architecture를 개발하는 것을 목표로 이전에 많은 작업들이 있었지만 efficiency를 높일수는 있으나 accuracy는 낮아지는 trade-off 현상이 발생한다. 이 논문은 이를 해결하기 위한 ..

Retina-net (Focal Loss for Dense Object Detection) 1. Introduction state-of-art object detector은 two-stage를 기반으로 하는데 one-stage로 two-stage만큼의 정확성을 높일수 있을까?하는 질문에서 시작된다. 또한 Object detection 모델은 이미지 내의 객체의 영역을 추정하고 IoU threshold에 따라 positive(object)와 negative(background) sample로 구분한 후, 이를 활용하여 학습한다. 하지만 일반적으로 이미지 내 object의 수가 적기 때문에 positive sample(object, foreground)은 negative sample(background)에 ..

FPN (Feature Pyramid Network) 1. Introduction 1-1. object detection 에 사용된 다양한 방법 이미지 내 존재하는 다양한 크기의 객체를 인식하는 것은 Object detection task의 핵심적인 문제다. 모델이 크기에 상관없이 객체를 detect할 수 있도록 다양한 방법을 사용해왔다. 아래는 object detection에 사용된 방법들이다. 1) Featurized image pyramid ex) MTCNN input되는 이미지를 각기 다른 scale로 resize하여 image pyramid를 만든다. 단점> 각각 이미지 스케일에 따라 독립적으로 compute되어야하기 때문에 매우 느리다. 또한 메모리를 지나치게 많이 사용한다. 2) Single..

SSD : Single Shot MultiBox Detector 1. Introduction 1-stage detector인 YOLO는 45 frames per second(FPS:Frame Per Sec)로 7 FPS인 Faster R-CNN보다 속도가 크게 향상되었지만 YOLO mAP : 63.4%과 Faster R-CNN : mAP 74.3% 비교했을때 정확도가 낮다는것을 알 수 있다. 이를 개선하기위해 만든것이 SSD이다. 2-stage detector인 Faster R-CNN의 정확도와 1-stage detector의 성능을 가지는 모델 논문의 저자들이 요약한 contribution은 다음과 같다. 1) 작은 convolutional Predictor filter들을 사용하여 feature ma..

Faster R-CNN Faster R-CNN Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun 1. Introduction 기존 fast R-CNN에서 object detection 작업을 end-to-end모델로 학습시켰지만 region proposal을 selective search로 해야한다는 단점을 극복한것이 바로 Faster R-CNN이다. 이때부터 본격적으로 RealTime Object Detection이 가능해졌고 성능 또한 놀라울정도로 향상되었다. "Anchor box 개념을 도입하며 Region Proposal또한 전체 네트워크속으로 가져오는것(RPN)"이 Faster R-CNN의 핵심이다. 2. Orders of algorithm Fast..

Fast R-CNN https://arxiv.org/pdf/1504.08083.pdf Ross Girshick Microsoft Research 1. Introduction SPPNet (Spatial Pyramid Pooling Network)은 기존 R-CNN이 proposal method (Selective Search)로 찾아낸 RoI (Region of Interest)들 2K에 대해서 모두 Convolution 연산하는 문제를, 인풋 이미지에 대해 한번만 수행하고 피쳐맵을 공유하는 방식으로 해결했다. ㅇ 그러나 여전히 모델을 학습 시키기 위해선 여러단계를 거쳐야 했고 Fully Connected Layer밖에 학습 시키지 못하는 한계점이 있었다. ㅇ 이것을 개선하기위해 Fast R-CNN 이 ..

R-CNN 0. Object Detection이란? 객체 감지는 여러 물체에 대해 어떤 물체인지 분류하는 Classification 문제와 그 물체가 어디 있는지 박스(Bounding box)를 통해 위치 정보를 나타내는 Localization 문제를 둘 다 해내는 분야를 뜻한다. 현대 obj detection의 시초인 two stage object detection R-CNN을 알아보자. 1. 정의 Figure 1 : R-CNN classification을 수행하는 CNN과 localization을 위한 regional proposal을 연결한 two-stage detector 모델 regional proposal로 selective search 사용 Figure 1-1 : two-stage detec..