출처: Stanford CS231n 2017 CS231N 2017 www.youtube.com *참고 https://github.com/visionNoob/CS231N_17_KOR_SUB GitHub - visionNoob/CS231N_17_KOR_SUB: CS231N 2017 video subtitles translation project for Korean Computer Science students CS231N 2017 video subtitles translation project for Korean Computer Science students - GitHub - visionNoob/CS231N_17_KOR_SUB: CS231N 2017 video subtitles translation pro..
- 이미지를 cnn에 통과시켜 feature map을 얻는다 - 이 feature map을 두 군데로, 하나는 rpn 하나는 그냥 통과 - rpn은 feature map에서 objcet가 있을 만한 곳을 추출 -생성된 영역들을 roi pooling 층에 통과시킨다 - 이미지에 대해 주어진 데이터는 pixel 값, target 은 ground truth bounding box 가 주어지는데 이를 이용해 어떻게 selective search 수준의 region proposal을 할 수 있을까? 1. Anchor Box -이론적인 설명은 다음과 같다. - 이 때 region proposal network 를 구현하기 위해선 Anchor box 구현해야 함 - Anchor box : Object 가 있는지 없는..
1. Fast RCNN 특징 1-1 SPP Layer 를 ROI Pooling Layer 로 변환 - SPPNet에서 SPP Layer를 ROI Pooling 으로 바꿔주는 것이 FastRCNN 이라고 보면 된다. - Featrure Map 에서 Selective Search 와 매칭된 서로 다른 크기의 Feature Map region 들을 max pooling 하여 고정된 크기의 벡터를 전달해주거나 Feature Map region를 억지로 고정된 크기로 바꿔준 다음에 전달 - SPPNet에서는 매핑된 Feature Map 은 분면별로 나눠서 1차원 형식으로 SPP Layer에 전달 했지면, Fast RCNN에선 7x7로 전달 - FC 층을 거쳐 softmax 와 bounding box regress..
출처: Stanford CS231n 2017 CS231N 2017 www.youtube.com *참고 https://github.com/visionNoob/CS231N_17_KOR_SUB GitHub - visionNoob/CS231N_17_KOR_SUB: CS231N 2017 video subtitles translation project for Korean Computer Science students CS231N 2017 video subtitles translation project for Korean Computer Science students - GitHub - visionNoob/CS231N_17_KOR_SUB: CS231N 2017 video subtitles translation pro..
1. SPPNet 등장 배경 - SPPNet은 RCNN의 한계점을 극복하기 위해 나온 모델이기 때문에 RCNN의 한계점을 아는 것이 중요 - R-CNN에서 살펴봤듯이 FC layer가 고정된 입력 크기를 필요로 하기 때문에 크기를 고정시키기 위해서 crop, wrap을 적용하여 이미지가 변형되고 손실되는 현상이 발생 - 각 Region Proposal 마다 Object Detection을 별도로 수행해야 되게 때문에 학습시간이 길어짐 2. 긴 학습시간 문제를 해결 - Feature Extractor 를 통과하여 생성된 [Feature Map]과 Selective Search로 형성된 [Region Proposal]들 중 비슷한 region들 끼리 매핑을 해준다. - 이러한 방식으로 기존 R-CNN에서 하..
1. 객체 검출 방식 * 2-Stage Dectector 방식 - resion proposals는 하나의 이미지 안에서 사물이 존재할만한 위치를 제안하는 것 - 각각의 위치에 대해서 피쳐를 추출해서 분류(Classification)하고 위치에 대한 정보를 조정하는 과정(Regression, 이미지 내 사물이 존재하는 bounding box의 좌표를 예측하는 문제 ) *1-Stage Dectector - 2-stage 보다 빠르지만 정확도는 낮다 - yolo에 해당 2. R - CNN 2-1 R-CNN 개요 - image classification 과 object detection 의 차이는 object의 위치 정보를 찾는 것 - object detetion을 수행하기 위해선 우선 object 가 있을만한..
출처: Stanford CS231n 2017 CS231N 2017 www.youtube.com *참고 https://github.com/visionNoob/CS231N_17_KOR_SUB GitHub - visionNoob/CS231N_17_KOR_SUB: CS231N 2017 video subtitles translation project for Korean Computer Science students CS231N 2017 video subtitles translation project for Korean Computer Science students - GitHub - visionNoob/CS231N_17_KOR_SUB: CS231N 2017 video subtitles translation pro..