인공지능 분야에 있다보면 가끔 접하는 단어.
제로샷 학습.
데이터 사이언스 응용 수업을 수강하다가 갑자기 궁금해진 개념.
대강 이전에 본적 없는 제로. 제로를 겨냥하여 학습한다. 이런 개념으로만 해석이 되는데, 이 용어가 실무에서 사용되고 있기 때문에 명확하게 이 용어가 무슨 뜻인지 알아가보고자 한다.
1. One-shot learning/Few-shot learning/Zero-shot learning
먼저 이 개념을 알아보자.
딥러닝 모델에서 시작된 이 세가지 용어.
원샷, 퓨샷 학습은 데이터의 양을 나타내는 용어이다.
잘 되어있다.
- ZSL: 본 적 없는 새로운 클래스를 인식 할 수 있음. 클래스 간의 관계나 속성을 통해 일반화하는 능력을 활용.
- CV 분야에서 텍스트로 새로운 클래스에 대한 설명 정보를 제공할 때.
- OSL: 단 한나의 예시만 제공될 때 클래스를 인식할 수 있도록 유사도 학습, 메타 학습.
- 고양이를 인식 모델에서 새로운 특정 종에 대한 사진 한개만 제공할 때.
- FSL: 극소량의 데이터, 메타 학습, 일반화 능력을 갖추도록 학습.
2. 그럼 모델 학습은 어떻게 이뤄지는가?
먼저 어떤 목적없이 언어모델, 컴퓨터 비전 등 범용적이지만 성능이 높은 모델을 만듭니다. 이후 특정 업무를 잘하도록 도메인에 특화된 정보를 주어 파인튜닝을 진행합니다. 이후 특정 업무에 활용합니다. 정리하자면
- 사전 학습모델: 모델의 패턴, 구조, 특성을 이해하도록 학습
- 파인튜닝 모델: 특정 테스크나, 도메인에 맞는 지식 전달 및 전문화
- 인퍼런스: 활용, 예측
3. ZSL, OSL, FSL을 각각 단계에서 어떻게 활용?
- 보통 2,3 단계인 파인튜닝 인퍼런스 단계에서 중요한 역할을 한다. (적은 데이터가지고 학습 및 예측을 진행해야하므로)
- 그러나 사전학습 단계에서 패턴을 구성하고 적합한 클래스로 유사도를 분류해놔야 ZSL, OSL, FSL이 잘 수행됨.
요약
- ZSL은 주로 인퍼런스 단계에서 본 적 없는 클래스를 처리하는 모델의 능력
- OSL과 FSL은 파인튜닝 단계에서 모델을 특정 태스크에 최적화하는 데 중요한 역할
기본 개념은 다음과 같으며 더 자세한 사항은 위에 링크 참고!
(각 언어, 컴퓨터 비전 분야 관점에서 ZSL, OSL, FSL을 정리해두었다)
'공부 > 인공지능 모델' 카테고리의 다른 글
YOLOv8 모델 아키텍쳐 (0) | 2024.09.11 |
---|