반응형 전체 글72 Fast R-CNN main Paper arxiv.org/pdf/1504.08083.pdf 1. Introduction 최근, Deep ConvNets는 iamge classification와 object detection 정확도를 크게 향상시켰다. image classification에 비해 object detection는 더 어려운 작업이다. 큰 복잡성 때문에, 현재 접근 방식은 느린 multi-stage pipeline에서 모델을 훈련시킨다. detection는 object의 정확한 위치 지정을 요구하기 때문에 complexity가 발생하며, 이는 두 가지 주요 과제를 야기한다. - 첫째, 수많은 proposal region object location를 처리해야 한다. (selective search로 거의 2000.. 2021. 4. 5. Support Vector Machine(SVM) definition : 결정 경계(Decision Boundary), 즉 분류를 위한 기준 선을 정의하는, 주어진 데이터가 어느 카테고리에 속할지 판단하는 이진 선형 분류 모델이다. 그래서 분류되지 않은 새로운 점이 나타나면 경계의 어느 쪽에 속하는지 확인해서 분류 과제를 수행할 수 있게 된다. support vector: decision boundary에 가장 가까운 각 클래스의 점들 decision boundary: 가운데를 가로지르는 선 margin: support vector와 decision boundary 사이의 거리 margin : 선과 가장 가까운 양 옆 데이터와의 거리로, Decision Boundary(구분하는 선)과 support vector와의 거리를 의미한다. 위 그림에서는 양쪽 .. 2021. 4. 3. intersection-overunion(IoU) definition : 두 영역의 교차영역의 넓이를 합영역의 값으로 나눈 값 object detection에서 예측된 boundingbox의 정확도를 평가하는 지표 중 하나로 사용되며, predicted boundingbox와 실제 참값(ground truth) boundingbox의 IOU를 해당 boundingbbox의 ‘정확도’로 간주한다. object detection 모델의 정확도는 모델을 테스트용 데이터셋에서 실행해본 다음 정밀도-재현율 곡선(precision-recall curve)과 평균 정밀도(mean average precision)를 구해 수치화할 수 있는데, 이 과정에서 IOU 값이 사용된다. 두 box의 크기가 동일할 경우 두 box의 2/3 이상은 겹쳐줘야 0.5의 값이 나오기 .. 2021. 4. 3. mean Average Precision(mAP) Object detection에서 논문에서 자주 언급되는 모델의 성능평가지표이다. Precision / Recall Precision (Precision = TP / TP + FP) : 분류기의 성능평가지표로 사용하는 Precision-Recall 에서의 Precision과 같은 의미이다. 인식기 (object-detector) 가 검출한 정보들 중에서 Ground-Truth 와 일치하는 비율을 의미한다. 모델이 정답이라고 답한것들(위 그림의 파란 박스) 중, 실제로 맞은(TP) 비율 Recall (Recall = TP / TP + FN) : 실제 정답들(위 그림의 빨간 박스) 중에서 내가 정답이라고 말한 비율 definition AP는 precision과 recall을 그래프로 나타냈을 때의 면적이다... 2021. 4. 3. Non-maximum suppression(NMS) 영상처리에서의 blured된 edge를 찾는 과정에서나 딥러닝에서의 object detection 분야에서 자주 사용되는 중복 제거를 위한 과정으로 NMS를 사용하면 연산량을 줄이고, mAP도 올리는 성능향상을 보여준다고 한다. 1. image pixel case what is non - maximum suppression? : 중심 pixel을 기준으로 8-way의 pixel value들을 비교하여 중심 pixel이 가장 클 경우 그대로 두고, 아닐 경우 제거해주는 과정 Assume that an image with the pixel value below exists 중심 픽셀인 빨간 테두리 픽셀을 기준으로 8방향의 픽셀 값들을 비교했을 때 파란색 테두리 픽셀 값인 7이 가장 큰 것을 알 수 있다. 이.. 2021. 4. 3. R-CNN main Paper arxiv.org/pdf/1311.2524.pdf 1. Introduction feature이라는 것은 매우 중요하다. 기존의 visual recognition task는 ensemble 시스템을 구축하고 이 방법에 대한 사소한 변형만을 통해 개선시켰기에 성능 향상이 더디었던 상황이었다. 따라 visual recognition에 훨씬 더 유용한 feature를 계산하기 위한 multi-stage process에 대한 초점이 맞춰지게 되었고, 과거에 사용되었던 CNN을 사용하여 성능을 개선하자는 아이디어를 통해 R-CNN을 만들어냈다. single image를 region proposal로 만들어 pre-trained CNN에서 SVM을 통해 classification를 학습하는 과정과.. 2021. 4. 1. 이전 1 ··· 6 7 8 9 10 11 12 다음 반응형