감독형 미세 조정(SFT)

감독형 미세 조정(SFT)

정의

지도 미세 조정(SFT)은 특정 작업을 위해 레이블이 지정된 데이터에 대해 사전 학습된 모델을 학습하고 매개변수의 일부 또는 전부를 조정하는 프로세스입니다.

목적

목적은 일반 용도 모델을 더 나은 정확도로 특수 작업에 적용하는 것입니다.

중요성

  • NLP 및 비전 작업의 핵심 기술입니다.
  • 고품질의 라벨이 지정된 데이터가 필요합니다.
  • 작은 데이터 세트에서는 과적합의 위험이 있습니다.
  • 종종 RLHF의 전조증상입니다.

작동 원리

  1. 선행 학습된 모델을 선택합니다.
  2. 대상 작업에 대한 레이블이 지정된 데이터를 수집합니다.
  3. 지도 학습으로 모델을 훈련합니다.
  4. 보류된 테스트 세트에서 검증합니다.
  5. 배포하고 성능을 모니터링합니다.

예시(실제 세계)

  • GPT는 고객 서비스 대화를 세부적으로 조정했습니다.
  • 명명된 엔터티 인식을 위해 미세 조정된 BERT.
  • 의료 이미지 분류에 맞춰 미세 조정된 비전 변환기.

참고문헌 / 추가 자료

  • Devlin 외. “BERT: 딥 양방향 변압기 사전 학습.” NAACL 2019.
  • 허깅 페이스 트랜스포머 문서.
  • 스탠포드 CS224N: 딥러닝을 활용한 NLP.
  • SFT란 무엇인가? 왜 중요한가?

다음 AI 이니셔티브를 지원하는 방법을 알려주세요.