벡터 데이터베이스 없이 논문을 읽는 로컬 RAG 도구
Lumenfolio는 학술 논문 PDF를 컴퓨터 안에서 우선 처리하는 데스크톱 인공지능 리더다. 보통 PDF 기반 RAG는 문서를 잘게 나누고, 임베딩을 만들고, 에 넣은 뒤 질문에 답하게 한다. Lumenfolio는 단일 논문을 깊게 읽는 경우에는 이 과정을 기본값으로 쓰지 않고, PDF를 쪽, 블록, 줄, 조각, 구조 트리, 표, 그림, 위치 좌표로 나눈다.
검색은 , 문서 구조, 쪽과 블록 단위의 근거를 함께 사용한다. 답변에는 쪽 단위와 위치 좌표 단위의 출처가 붙어, 원본 PDF의 정확한 영역으로 돌아갈 수 있다. PDF 색인, 메모, , 는 기본적으로 로컬에 보관된다.
, 표, 그림을 위해 OCR, 표 근거, 시각적 잘라내기도 지원한다. 에이전트는 문서 도구를 통해 구절을 찾고, 쪽이나 섹션을 열고, 표와 그림을 확인한 뒤 근거에 맞춰 답할 수 있다.
핵심 포인트
- 단일 학술 PDF를 깊게 읽는 용도에 맞춘 로컬 우선 인공지능 리더다.
- 기본 구조는 임베딩과 대신 와 문서 구조를 쓴다.
- 답변은 쪽과 위치 좌표 출처를 붙여 원본 PDF의 정확한 근거로 돌아가게 한다.
- 색인, 메모, , 를 기본적으로 로컬에 저장한다.
- 에이전트가 구절, 쪽, 섹션, 표, 그림을 으로 확인한 뒤 답할 수 있다.