RAG와 메모리를 나누면 AI 에이전트가 더 오래된 맥락을 다룰 수 있다

AI 에이전트에서 검색메모리는 서로 관련이 있지만 같은 역할은 아니다. RAG는 지금 답변하는 데 어떤 문맥이 관련 있어 보이는지 찾는 데 가깝다. 메모리는 그 정보가 당시에는 사실이었는지, 나중에 낡은 정보가 되었는지, 중요하지 않아 사라져도 되는지, 어떤 결정을 설명하기 때문에 보존해야 하는지를 함께 판단해야 한다.

이 차이는 고정된 문서가 아니라 사람, 프로젝트, 메시지, 일정, 작업, 의사결정처럼 계속 바뀌는 업무 문맥을 다룰 때 더 커진다. OpenLoomi는 이런 문제를 실험하는 로컬 우선 오픈소스 메모리 계층이다.

핵심 포인트

  • RAG는 지금 필요한 관련 문맥을 찾는 데 초점이 있다.
  • 메모리는 정보의 시간, 신선도, 중요도, 보존 이유까지 다뤄야 한다.
  • 업무 메시지, 일정, 작업, 결정처럼 계속 변하는 데이터에서는 검색만으로 부족할 수 있다.
  • 좋은 메모리 계층은 에이전트가 불필요한 문맥을 덜 읽게 해 토큰 사용을 줄일 가능성이 있다.
  • OpenLoomi는 로컬 우선 오픈소스 메모리 계층으로 이 구분을 실험한다.

용어 한 줄 설명

AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
검색
AI가 답하는 데 필요한 관련 정보 조각을 찾아 가져오는 단계입니다.
메모리
컴퓨터가 정보를 일시적으로 기억하고 처리하는 데 사용하는 부품입니다.
RAG
AI가 답하기 전에 관련 자료를 검색해서 그 내용을 참고하게 하는 방식입니다.
로컬 우선
데이터를 먼저 인터넷 서버가 아니라 내 기기에 저장하고 다루는 방식입니다.
로컬
외부 서버가 아니라 해당 시스템이나 내부 환경 안에 있는 곳을 뜻합니다.
오픈소스
소스 코드를 공개해 누구나 보고 사용할 수 있게 한 방식입니다.
토큰
AI가 글을 읽고 쓸 때 세는 작은 글자 조각 단위입니다.
원문 보기