RAG에서 에이전트형 AI로 가기 전 정리할 우선순위

학습용으로 시작한 RAG 시스템에 이미 여러 기본 기능이 들어가 있다. 문장을 숫자 벡터로 바꾸는 임베딩, 문서를 작게 나누는 청킹, 벡터를 저장하는 ChromaDB, 문서를 읽어들이는 Docling, 출처 표시, 질문 다시 쓰기, 재정렬 기능까지 구현된 상태다.

아직 화면은 없다. 다음 단계로 질문 확장이나 하이브리드 검색 같은 기능을 더 넣을 수 있지만, 무엇을 먼저 해야 할지 불분명하다.

최종 목표는 단순 검색 답변 도구가 아니라 스스로 여러 단계를 처리하는 에이전트형 AI로 발전시키는 것이다. 핵심 고민은 기능을 너무 많이 붙이고 있는지, 에이전트형 AI로 가기 전에 어떤 기반을 먼저 다져야 하는지다.

핵심 포인트

  • 이미 임베딩, 청킹, 벡터 저장, 문서 수집, 출처 표시, 질문 다시 쓰기, 재정렬까지 구현되어 있다.
  • 아직 사용자가 보는 화면은 없는 상태다.
  • 다음 후보 기능으로 질문 확장과 하이브리드 검색을 고려하고 있다.
  • 최종 목표는 RAG에이전트형 AI로 발전시키는 것이다.
  • 기능을 더 넣기 전에 검색 품질과 실패 사례를 먼저 점검하는 것이 중요하다.

용어 한 줄 설명

RAG
AI가 답하기 전에 관련 자료를 검색해서 그 내용을 참고하게 하는 방식입니다.
임베딩
텍스트를 숫자 벡터로 변환해 의미가 비슷한 내용끼리 검색할 수 있게 만드는 과정입니다.
ChromaDB
문서의 의미를 담은 벡터를 저장하고 찾아주는 도구다.
ROM
옛 게임기 게임 파일을 가리킬 때 자주 쓰는 말입니다.
출처 표시
답변이 어떤 문서나 링크를 근거로 했는지 함께 보여주는 방식입니다.
에이전트형 AI
사람이 매번 지시하지 않아도 여러 단계를 스스로 이어서 처리하는 AI 방식입니다.
에이전트형
사용자의 지시를 받아 여러 단계를 스스로 처리하도록 만든 방식이다.
체크포인트
저장된 모델 상태 파일로, 바로 실행하거나 이어서 실험할 때 쓴다.
원문 보기