소설책용 RAG의 검색 품질 문제를 묻는 사례
한 Reddit 사용자가 소설책을 대상으로 만든 RAG에서 검색 결과 품질이 좋지 않다고 도움을 요청했습니다. 새 도구 발표는 아니지만, AI 에이전트를 만들 때 자료를 어떻게 찾아 넣느냐가 답변 품질과 비용에 직접 영향을 준다는 점을 보여줍니다.
이 항목에서 확인되는 핵심은 사용자가 소설책 자료로 RAG를 만들었지만, 원하는 수준의 검색 결과 품질을 얻지 못했다는 점입니다. RAG는 AI가 답하기 전에 관련 자료를 먼저 찾아서 참고하게 만드는 방식입니다. 검색이 빗나가면 AI는 엉뚱한 내용을 바탕으로 답하거나, 더 많은 토큰을 써도 품질이 나아지지 않을 수 있습니다.
특히 소설책은 인물, 사건, 장면, 문체처럼 단순 키워드로 찾기 어려운 정보가 많습니다. 그래서 자료를 어떻게 나누고, 어떤 단위로 저장하고, 질문과 가장 가까운 부분을 어떻게 고르는지가 중요합니다. AI 에이전트 관점에서는 검색 결과 품질을 높이면 불필요한 긴 문맥을 덜 보내도 되어 토큰과 비용을 줄이는 데 도움이 됩니다.
핵심 포인트
용어 한 줄 설명
- RAG
- AI가 답하기 전에 관련 자료를 검색해서 그 내용을 참고하게 하는 방식입니다.
- 검색 결과 품질
- 질문에 정말 맞는 자료가 얼마나 잘 찾아졌는지를 뜻합니다.
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
- 토큰
- AI가 글을 읽고 쓸 때 세는 작은 글자 조각 단위입니다.
- 맥락
- AI가 답을 만들 때 참고하는 설명, 파일, 이전 대화 같은 정보입니다.