로컬 RAG용 그래프 메모리 도구 실험 공개
작성자는 turbovec 위에 turbo-graph라는 도구를 만들었다고 밝혔다. 이 도구는 작은 로컬 vector search 기능에 GraphMemoryIndex를 더해, tenant filters, 시간, 태그, 출처 같은 조건을 함께 다루게 한다. 작성자는 이것이 vector DB를 대체하려는 것이 아니라, 로컬이나 비공개 RAG 환경을 위한 Alpha 실험이라고 설명했다.
핵심 포인트
- turbovec 기반의 fork인 turbo-graph를 공개했다.
- GraphMemoryIndex로 조건이 많은 RAG 검색을 다루려 한다.
- tenant filters, 출처, 시간, 태그 같은 제약을 검색 과정에 넣는 것이 목표다.
- BM25 candidates, rerank, explainability도 병목으로 언급했다.
- 작성자는 vector DB 대체품이 아니라 Alpha 실험이라고 설명했다.
용어 한 줄 설명
- graph
- 여러 요소가 어떻게 연결되어 있는지 점과 선처럼 보여주는 구조입니다.
- vector search
- 글이나 데이터를 숫자 묶음으로 바꾼 뒤 비슷한 것을 찾는 검색 방식이다.
- GraphMemoryIndex
- 자료 사이의 관계와 조건을 함께 써서 기억을 찾게 하려는 색인 구조다.
- memory
- ChatGPT가 사용자의 정보나 취향을 다음 대화에 참고하는 기능입니다.
- vector DB
- 문서나 문장을 숫자 형태로 바꿔 비슷한 내용을 빠르게 찾는 데이터베이스다.
- alpha
- 정식 출시 전 시험판이라 문제가 남아 있을 수 있는 버전입니다.
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
- 클라우드
- 내 컴퓨터가 아니라 인터넷으로 연결된 외부 컴퓨터를 쓰는 방식입니다.