벡터 검색형 RAG와 전체 문서 읽기형 RAG의 차이

벡터 검색형 RAG는 긴 데이터를 작은 조각으로 나눈 뒤, 질문과 가장 비슷한 조각을 벡터 데이터베이스에서 찾아 답을 만든다. 반대로 벡터 없는 RAG는 Gemini 2.5 Flash 같은 모델이 문서 전체를 읽고, 전체 내용을 바탕으로 트리 형태의 사고 구조를 만들려고 한다. 샘플로는 원피스 전체 줄거리의 요약본이 쓰였다.

벡터 검색형 RAG는 원하는 답을 잘 냈지만, 벡터 없는 RAG는 사고 트리를 만드는 단계에서 오류가 났다. 핵심 고민은 문서 전체를 한 번에 읽히는 방식이 제대로 작동하면 더 강력할 수 있지만, 실제로는 긴 입력과 구조화 과정에서 실패할 수 있다는 점이다.

핵심 포인트

  • 벡터 검색형 RAG는 문서를 조각으로 나누고 필요한 조각만 찾아 답을 만든다.
  • 벡터 없는 RAG는 모델이 문서 전체를 읽고 구조를 만들려고 한다.
  • 원피스 줄거리 요약본 테스트에서는 벡터 검색형 RAG가 정상 작동했다.
  • 벡터 없는 RAG는 사고 트리 생성 단계에서 오류가 났다.
  • AI 에이전트에서는 전체 문서 입력보다 필요한 정보만 찾는 방식이 비용과 안정성 면에서 유리할 수 있다.

용어 한 줄 설명

벡터 검색
문장의 뜻이 얼마나 비슷한지 숫자로 비교해 찾는 검색 방식입니다.
벡터 데이터베이스
텍스트나 이미지를 숫자 형태로 변환해 저장하고, 의미가 비슷한 내용을 빠르게 찾아주는 특수 저장소
데이터베이스
많은 정보를 체계적으로 모아두어 찾아보기 쉽게 만든 정보의 집합체입니다.
Gemini 2.5 Flash
구글의 Gemini 계열 인공지능 모델 중 빠른 응답을 목표로 한 모델입니다.
2.5
Gemini의 이전 버전으로 언급된 모델 버전 이름이다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
토큰 사용량
AI에게 보내고 받은 글의 양을 세는 단위 사용량입니다.
테스트
소프트웨어가 의도한 대로 작동하는지 확인하는 과정으로, 버그(오류)를 찾아내는 작업이다.
원문 보기