목록전체 글 (145)
공부 기록장
IoU (Intersection Of Union) -> (Area of Overlap) / (Area of Union) mAP(Mean Average Precision) -> 정확성 FPS(Frame Per Seconds) -> 속도 YOLO 이전의 RCNN 계열의 모델들은 일정 수준의 정확성은 있으나, 실제 적용하기에 신속성이 떨어지는 문제가 있었다. YOLO v2에 비해서 v3가 네트워크가 커짐으로 인해 빨라진 건 아니지만, 성능은 더 좋아졌다고 한다. YOLO의 핵심 내용 1) Bounding box prediction YOLOv3는 logistic regression를 이용해 각각의 예측된 bbox마다 objectness에 대한 점수를 구한다. 만약 예측된 어떤 bbox가 다른 bbox들보다 Io..
Faster R-CNN을 사용하면 이미지 속의 여러 사물을 한꺼번에 분류할 수 있으며 데이터 학습에 따라서 겹쳐 있는 부분들 까지도 정확하게 분류해 낼 수 있다고 한다. Object detection과 관련된 알고리즘에는 R-CNN, Fast R-CNN, Faster R-CNN, Mask R-CNN, YOLO, YOLO v2 등등 여러가지가 있는데, 그 중 R-CNN이 최초가 된 분석방법이고 YOLO의 경우 속도가 Faster R-CNN보다 훨씬 빠르지만 예측률이 떨어진다고 한다. Object Detection 방식에는 2-stage 방식과 1-stage 방식이 있다. 1) 2-stage 방식 : 물체의 위치를 찾는 문제와 분류하는 문제를 순차적으로 해결한다. (R-CNN은 2-stage 방식을 따른다...
[Semantic Segmentation을 해결하기 위한 성능 좋은 DeepLab 시리즈] DeepLab V1 : Atrous convolution을 처음 적용 DeepLab V2 : multi-scale context를 적용하기 위한 Atrous Spatial Pyramid Pooling(ASPP) 기법을 제안 DeepLab V3 : 기존 ResNet 구조에 Atrous Convolution을 활용해 좀더 Dense한 feauture map을 얻는 방법을 제안 DeepLab V3+ : Depthwise Separable Convolution과 Atrous Convolution을 결합한 Atrous Separable Convolution의 활용을 제안 논문 읽기 전 1) Atrous Convolution..
convolutional network를 이용해 생물의학적 사진들 분류하기 [요약] 이 논문에서 소개할 U-Net은 속도도 빠르고 적은 수의 데이터로 최상의 학습 효과를 낼 수 있다. cf) et al : "and others" (저자가 여러 명일 때 사용) 1. 소개 sliding-window 기법에 기반한 신경망은 대회에서 수상을 할 정도로 좋았지만 크게 두 가지 단점이 있었다. 첫번째는 각 패치에 대해 별도로 실행되어야 하기 때문에 상당히 느리고, 패치들 끼리도 중복이 많아서 비효율적이다. 두번쨰는 localization accuracy와 use of context 사이의 trade-off 가 존재한다는 것이다. 패치가 클수록 context는 파악하기 쉽지만, max-pooling layer가 더 ..