정의
검색 증강 생성(RAG)은 생성 모델과 정보 검색 시스템을 결합하는 기술입니다. 외부 소스에서 얻은 결과를 기반으로 사실 정확도를 향상시킵니다.
목적
이 기술의 목적은 검색된 문서를 활용하여 응답을 보강함으로써 생성 AI에서 환각 현상을 줄이는 것입니다. 특히 질의응답 및 지식 집약적 작업에 유용합니다.
중요성
- LLM 출력의 사실적 정확성을 향상시킵니다.
- 도메인별 지식 통합을 가능하게 합니다.
- 신뢰할 수 있는 검색 시스템이 필요합니다.
- 하이브리드 검색 및 오픈 도메인 QA와 관련이 있습니다.
작동 원리
- 사용자가 질의나 프롬프트를 제공합니다.
- 검색 시스템은 관련 문서를 가져옵니다.
- 문서는 생성 모델로 전달됩니다.
- 모델은 검색된 콘텐츠를 기반으로 응답을 생성합니다.
- 피드백 루프는 향후 성과를 개선합니다.
예시(실제 세계)
- 탐색 또는 검색 플러그인이 포함된 OpenAI ChatGPT.
- 메타 RAG 모델: 검색 기반 LLM에 대한 연구.
- 퍼플렉시티 AI: 검색 기능이 강화된 대화형 검색.
참고문헌 / 추가 자료
- Lewis 외. "지식 집약적 NLP를 위한 검색 증강 생성." NeurIPS 2020.
- 허깅 페이스 RAG 구현.
- 스탠포드 HAI 검색 방법 연구.
- RAFT란 무엇인가? RAG + Fine-Tuning