Skip to content

Intro

Retrieval (문서 검색)

1. 청킹 전략 (전처리)

문서를 효과적으로 분할하는 다양한 기법을 활용하여 검색에 최적화된 형태로 변환함으로써 검색 품질과 처리 속도 향상

2. 질의 변형 (쿼리 재작성)

질문의 구체화, 가상의 답변 활용 등의 기법을 통해 사용자의 원래 질문을 검색에 효율적인 형태로 재구성

3. 검색 알고리즘 최적화

의미 기반의 벡터 검색과 키워드 기반 검색, 하이브리드 검색 등의 방식을 활용하여 관련성 높은 문서를 더 효율적으로 검색

4. 문서 후처리 (리랭킹)

1차 검색 결과와 질문의 연관성을 재평가하여 질문과 관련없는 문서 제거, 이를 통해 검색된 정보의 품질을 높이고 궁극적으로 더 신뢰할 수 있는 최종 프롬프트 제공

Generation (답변 생성)

1. Self-RAG

모델이 스스로 추가 검색 필요성을 판단하고 부족한 정보를 찾아 보안, 이를 바탕으로 더 깊이 있고 정확한 응답을 제공하여 사용자 경험 개선

2. 모델 파인튜닝

모델을 학습시켜 다양한 상황에 대한 대응 능력 강화, 이를 통해 검색된 정보를 더욱 효율적으로 활용하여 맥락에 맞는 적절한 응답 생성 기능