본문 바로가기

Computer Vision

(11)
Gaussian Mixture Model - GMM Gaussian Mixture Model (가우시안 혼합 모델) 말그대로 여러개의 모델이 Mixture 되었다는 전제에서 시작한다. 어떤 픽셀값, 데이터가 들어오면 걔가 어떤 모델(분포) 출신인지 유추할 수 있는 모델을 생성하는 것이다. 그러려면 일단 모델의 후보가 있어야 되는데, Gaussian Mixture에 여러 모델(분포)가 섞여있기 때문에, 섞인 그 모델들이 후보들이고 그 중 최종적으로 픽셀값이 그중에 어떤 애로부터 왔느냐를 유추하면 된다. Gaussian 이라 하면, 우리는 쉽게 Gaussian 분포를 떠올릴 수 있다. 맞다, 그 분포. 우리가 아는 아래와 같은 분포가 여러개 있다고 생각하면 된다. 그런데 이러한 Gaussian 분포가 여러개 있다는 것은? 위와 같이 "점선"만을 본다면 개별적..
SNIPER: Efficient Multi-Scale Training 딥러닝의 분야별, Data Set 별 State-Of-the-Art 랭킹을 확인할 수 있는 사이트 의 Pascal VOC 2007 데이터 셋의 Object Detection 분야 1위인 "SNIPER" 논문을 리뷰하고자 한다. Multi Scale 에 대해 학습할 때 효율적으로 쓰일 수 있다고 한다. 아주 최근의 논문은 아니고, 2018년 말에 나온 논문. Youtube의 논문 review PR-199를 참고하였다. 논문의 도입은 RCNN과 Fast RCNN의 소개로 시작한다. RCNN detector에서 진화된 Object Detection 알고리즘들은 비지도 (unsupervised) 알고리즘으로 Object Proposal을 생성했다. 이렇게 생성된 proposal들을 224 x 224 로 resi..
Feature Pyramid Network - FPN 이번 포스팅은 Object Detection을 위한 Neural Network에서 자주 보는 Image Pyramid와, 이와 연관한 Object Detection Network의 Feature 추출 단계에 대한 것이다. Image Pyramid란 Input Image의 Size를 단계별로 변화시키면서 쌓은 형태를 말한다. 위의 사진은 Gaussian Pyramid로 한 단 올라갈 때 마다 해상도가 절반으로 줄어드는 것을 볼 수 있다. 해상도가 절반으로 줄어든다는 것은 즉 픽셀 수의 감소를 뜻하는데, 보통 짝수 픽셀을 모두 지우고 홀수 픽셀만 남겨두는 식으로 해상도를 저하시킨다고 한다. 이렇게 만들어진 Image Pyramid에서 각 단계 (level)마다 고정된 크기의 윈도우를 이동시키며 Object를..