1. 지도학습
: 정답(labeling이되어있는)알고 있는 상태로 학습하여 결과를 도출
: classification, localization, Object Detection, Segmentation, pose estimation 이 지도학습에 해당
: 하지만, 꼭 지도학습으로만 결과를 도출하는 것이 아니라 다른 여러가지 방법으로도 가능하다!
2. 비지도학습
: 정답을 모르는 상태로 학습
: 군집화, 차원 축소같은 것이 해당된다.
3. 자기지도학습
: 정답을 알고 있는 데이터가 적을때 사용된다.
: downstream task(진짜해결해야하는 문제)를 풀기전, pretext task(다른 문제)를 새롭게 정의하여 학습한다.
: ex1) 고양이 사진 분류 문제
(1) 사진으로 패치단위로 나눠 번호를 매기고, 임의의 패치 2개의 위치문제를 학습시킨다. -> 이미지의 맥락을 학습하기 위함
(2) 위의 문제를 먼저 학습후에 downstream task에 문제를 넣어 고양이 임을 도출한다.
: ex2) 서로다른 이미지를 학습 -> Contrastive learning
(1) 서로다른 분류의 이미지를 각각 학습하여 분류할수 있게한다.
(2) 각 서로다른 이미지들을 넣어 서로 다른 분류임을 학습한다.
4. 강화학습
: 어떠한 State에 놓일때의 Action에 대한 score를 매긴다 -> Q(State, Action) = Score
: 한번의 학습후 매겨진 score에 대해서 두번째 학습시 다음 action을 하기전 매겨진 점수를 그대로 가져와 해당 action에 대한 평가를 먼저한후 action한다.
: 과적합이 나올수 있기때문에 해당 점수를 가져올때 discount factor를 곱하여 점수를 매겨 최적의 정답을 도출할 수 있게한다.
댓글