공부/인공지능 모델

ZSL: Zero-shot learning

keum24 2024. 10. 7. 22:13

인공지능 분야에 있다보면 가끔 접하는 단어.

제로샷 학습.

 

데이터 사이언스 응용 수업을 수강하다가 갑자기 궁금해진 개념.

대강 이전에 본적 없는 제로. 제로를 겨냥하여 학습한다. 이런 개념으로만 해석이 되는데, 이 용어가 실무에서 사용되고 있기 때문에 명확하게 이 용어가 무슨 뜻인지 알아가보고자 한다.


1. One-shot learning/Few-shot learning/Zero-shot learning

먼저 이 개념을 알아보자.

딥러닝 모델에서 시작된 이 세가지 용어.

원샷, 퓨샷 학습은 데이터의 양을 나타내는 용어이다.

 

정리

 

[개념] 생성 AI의 학습 방식: 제로샷·원샷·퓨샷 러닝

최근 챗GPT로 인해 부상한 제로샷(zero-shot), 원샷(one-shot), 퓨샷(few-shot) 러닝 기법은 데이터를 일일이 라벨링하지 않고도 머신러닝 모델을 학습시킬 수 있도록 해줍니다. 이를 같이 살펴보시죠!

velog.io

잘 되어있다.

 

  1. ZSL: 본 적 없는 새로운 클래스를 인식 할 수 있음. 클래스 간의 관계나 속성을 통해 일반화하는 능력을 활용.
    • CV 분야에서 텍스트로 새로운 클래스에 대한 설명 정보를 제공할 때.
  2. OSL: 단 한나의 예시만 제공될 때 클래스를 인식할 수 있도록 유사도 학습, 메타 학습.
    • 고양이를 인식 모델에서 새로운 특정 종에 대한 사진 한개만 제공할 때.
  3. FSL: 극소량의 데이터, 메타 학습, 일반화 능력을 갖추도록 학습.

2. 그럼 모델 학습은 어떻게 이뤄지는가?

먼저 어떤 목적없이 언어모델, 컴퓨터 비전 등 범용적이지만 성능이 높은 모델을 만듭니다. 이후 특정 업무를 잘하도록 도메인에 특화된 정보를 주어 파인튜닝을 진행합니다. 이후 특정 업무에 활용합니다. 정리하자면

  1. 사전 학습모델: 모델의 패턴, 구조, 특성을 이해하도록 학습
  2. 파인튜닝 모델: 특정 테스크나, 도메인에 맞는 지식 전달 및 전문화
  3. 인퍼런스: 활용, 예측

3. ZSL, OSL, FSL을 각각 단계에서 어떻게 활용?

  • 보통 2,3 단계인 파인튜닝 인퍼런스 단계에서 중요한 역할을 한다. (적은 데이터가지고 학습 및 예측을 진행해야하므로)
  • 그러나 사전학습 단계에서 패턴을 구성하고 적합한 클래스로 유사도를 분류해놔야 ZSL, OSL, FSL이 잘 수행됨.

 

요약
- ZSL은 주로 인퍼런스 단계에서 본 적 없는 클래스를 처리하는 모델의 능력
- OSL과 FSL은 파인튜닝 단계에서 모델을 특정 태스크에 최적화하는 데 중요한 역할

 

 

기본 개념은 다음과 같으며 더 자세한 사항은 위에 링크 참고!

(각 언어, 컴퓨터 비전 분야 관점에서 ZSL, OSL, FSL을 정리해두었다)

'공부 > 인공지능 모델' 카테고리의 다른 글

YOLOv8 모델 아키텍쳐  (0) 2024.09.11