본문 바로가기
728x90
반응형
SMALL

전체 글83

Augmentation for small object detection 논문 : Augmentation for small object detection 1. Introduction 이미지에서 객체를 검출하는 것은 오늘날의 컴퓨터 비전 연구의 근본적인 task들중 하나이다. 객체 검출은 로봇, 자율주행, 인공위성, 항공 영상 분석 그리고 의료 영상에서 장기와 덩어리의 위치 파악을 포함하여 실제로 적용되기 위한 시작점이 된다. 객체검출의 이 중요한 문제는 최근에 많은 발전이 있었다. MSCOCO로 객체 검출의 경쟁에서 정확도가 2015년 0.373에서 2017년 0.525로 증가하였다. 비슷한 진전은 MSCOCO의 segmentation 분야에서도 관찰할 수 있었다. 이러한 성능향상에도 불구하고 소형 객체에 대한 성능은 실적이 저조하다. MSCOCO 데이터셋에서의 객체 크기를 .. 2021. 11. 2.
CBAM 논문 : CBAM: Convolutional Block Attention Module 1. Introduction CNN은 큰 표현력에 기반하여 vision tasks의 성능에 많은 영향을 끼쳤다. CNN의 성능을 향상시키기 위해서, 최근의 연구들은 주로 중요한 요소인 depth, width, cardinality 를 연구하고 있다. LeNet부터 ResNet까지 rich representation을 가지며 네트워크는 깊어졌다. VGGNet은 같은 형태의 블럭을 쌓는 것도 같은 결과를 내는 것을 알려주었다. 같은 맥락으로, ResNet은 깊은 구조를 만들기위해 skip-connection과 함께 같은 형태의 residual blocks를 쌓았다. GoogleNet은 width가 모델의 성능을 향상시키기 .. 2021. 10. 28.
YOLO_v4 Introduction 다수의 cnn기반의 객체검출기들은 대체로 추천시스템에만 적합했다. 예를 들어 도시의 카메라를 통한 주차 빈자리 찾기는 느리지만 정확한 모델에 의해 실행되지만 자동차 충돌 주의는 빠르지만 정확하지 않은 모델을 통해 실행된다. 실시간의 객체 검출기의 정확도를 높이는 것이 추천시스템에 대한 힌트를 생성하는 것 뿐만아니라 독립형 프로세스 관리와 사람이 입력해야하는 것을 감소시키는것을 가능하게한다. 전통적인 GPU를 사용한 실시간 객체검출 수행은 방대한 사용량을 허용한다. 가장 정확한 신상의 neural network들은 실시간에서 동작하지 않으며 큰 mini-batch-size를 요구하면서 여러개의 GPU 사용을 필요로한다. 이러한 문제점에 직면하면서 하나의 GPU만을 사용하는 모델을 만.. 2021. 10. 27.
DFS/BFS 탐색 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정 자료구조 데이터를 표현하고 관리하고 처리하기 위한 구조 - 삽입 : 데이터를 삽입 - 삭제 : 데이터를 삭제 - 오버플로 : 데이터가 용량을 다 차지했을 때 삽입 연산을 수행할 때 발생 - 언더플로 : 데이터가 전혀 없는데 삭제 연산을 수행할 때 발생 스택 먼저 들어가면 가장 나중에 나올 수 있다. 선입후출 append() : 리스트의 가장 뒤쪽에 데이터를 삽입 pop() : 리스트의 가장 뒤쪽에서 데이터를 꺼냄 큐 먼저 들어가면 먼저 나온다. 선입선출 위와 같은 deque 라이브러리를 사용해서 구현가능하다. DFS(Depth-First Search) 깊이 우선 탐색, 그래프에서 깊은 부분을 우선적으로 탐색 그래프는 노드와 간선으로 표현 - 인접 .. 2021. 10. 14.
구현 * 구현 유형의 문제란? : 풀이를 떠올리는 것은 쉽지만 소스코드로 옮기기 어려운 문제 ex) 알고리즘은 간단하지만 코드가 길어지는 문제, 실수연산을 다루면서 특정 소수점 자리까지 출력해야 하는 문제, 문자열을 특정한 기준에 따라서 끊어 처리해야하는 문제, 적절한 라이브러리를 찾아서 사용해야 하는 문제 * 시뮬레이션 및 완전 탐색 문제가 구현 유형에 포함됨 : 시뮬레이션 은 문제에서 제시한 알고리즘을 한 단계씩 차례대로 직접 수행해야하는 유형 : 완전 탐색 은 모든 경우의 수를 주저 없이 다 계산하는 해결방법 * 시뮬레이션 및 완전 탐색 문제에서는 2차원 공간에서의 방향 벡터가 자주 활용됨 ex) dx = [0, -1, 0, 1], dy = [1, 0, -1, 0] 1) 상하좌우 : 상하좌우로 이동가능 .. 2021. 9. 30.
그리디 * 현재 상황에서 지금 당장 좋은 것만 고르는 방법 * 암기한다고 해서 잘풀수 있는 문제는 아님 * 정렬 알고리즘문제와 짝을 이뤄 출제되는 경우가 많음 문제1) 거스름돈 - 500, 100, 50, 10 단위의 동전 무한히 존재 - 거슬러 줘야 할 돈은 N (단, N은 10의 배수) - 거슬러 줘야 할 동전의 최소 개수 문제2) 큰 수의 법칙 - N은 배열의 크기, M은 숫자가 더해지는 횟수, K는 특정 수가 연속해서 더해질수 있는 최대 횟수 문제3) 1이 될 때까지 - 어떠한 수 N이 1이 될 때까지 수행 - 1) N에서 1을 뺀다. 2) N을 K로 나눈다. 두가지 연산만 반복 선택하여 수행 (단, 2번째 연산은 K로 나눠질때만 가능) 2021. 9. 16.
Scaled-YOLOv4 3. Principles of model scaling : 질적인 요소의 파라미터, 양적인 요소를 변화하는것을 다뤄야한다. 양적인요소 1) image size 2) number of layers(depth) 3) number of channels(width) 3.1 General principle of model scaling : 효율적인 모델스케일링 방법을 디자인할때 중요한 원칙은 스케일이 up/down하면, increase/decrease 하고자하는 양적인 cost를 더낮추거나/더높이는 것이다. : 위 두 표를 비교해보면 각 scaling factor를 키우는것보다 CSP를 적용하는것이 계산량이 더 줄어든다. 따라서 CSP를 적용하는 것이 model scaling의 가장 좋은 모델이다. 3.2 Sca.. 2021. 7. 13.
MDSSD : Multi-scale Deconvolutional Single Shot Detector for Small Object To make the feature maps of the shallow layers contain more semantic information, we build several fusion layers between high-level and low-level feature maps through Fusion Blocks. conv11 and conv12 have totally lost the fine details of small objects, and therefore we apply the Fusion Block before conv11. In order to share the structure of Fusion Block, we delicately design symmetric topology b.. 2021. 4. 15.
Convert format of COCO to YOLO format 내가 진짜 울분을 담아서 작성한다. 이놈의 삽질 끝이 없다. 다 내가 꼼꼼하지 않아서그렇지 근데 뭘 알아야 꼼꼼하지!!!!! 신뢰있게 적어놔서 그대로 따라했더니 결국 틀린정보였어. 다른사람들은 나와같은 실수와 속음이 없기를 바라며 작성한다. 1. convet to yolo github.com/ssaru/convert2Yolo ssaru/convert2Yolo This project purpose is convert voc annotation xml file to yolo-darknet training file format - ssaru/convert2Yolo github.com 위 사이트를 들어가서 해당 자료를 다운받고 requirements.txt안에 들어있는 것들을 설치하여야하는데, 이때 주의할점은 .. 2021. 4. 10.
728x90
반응형
LIST