엑셀 표 데이터에는 RAG보다 Text-to-SQL이 나을 수 있다는 질문

한 Reddit 사용자가 여러 시트가 있는 약 20개의 Excel 파일을 다루고 있다고 설명했다. 사용자의 질문은 “몇 개가 있는가”처럼 대부분 표 형태 데이터에서 숫자나 조건을 찾는 내용이다. 팀은 Python 스크립트로 파일을 합치고 그 위에 LLM을 얹은 RAG 방식을 만들려 한다. 작성자는 이 경우 SQL에 데이터를 넣고 Text-to-SQL을 쓰는 구조가 더 나은지 물었다.

핵심 포인트

  • 대상 데이터는 약 20개의 Excel 파일과 여러 시트다.
  • 질문은 주로 개수 계산이나 특정 파일의 조건 확인처럼 구조화된 조회다.
  • 팀은 Python 스크립트로 파일을 합친 뒤 RAGLLM을 쓰려 한다.
  • 작성자는 RAG가 복잡도, 비용, 환각 위험을 키울 수 있다고 걱정한다.
  • 대안으로 SQL에 데이터를 넣고 Text-to-SQL로 자연어 질문을 쿼리로 바꾸는 방식을 제안했다.

용어 한 줄 설명

Excel
표 형태로 숫자와 글을 정리하는 스프레드시트 프로그램입니다.
Python
코드가 영어 문장처럼 읽혀 초보자도 배우기 쉬운 프로그래밍 언어입니다.
스크립트
반복 작업을 자동으로 처리하게 만든 작은 프로그램입니다.
LLM
글과 코드를 읽고 답을 만드는 대형 AI 모델입니다.
RAG
AI가 답하기 전에 관련 자료를 검색해서 그 내용을 참고하게 하는 방식입니다.
SQL
데이터베이스에게 정보를 찾아달라고 명령할 때 쓰는 전용 언어입니다.
Text-to-SQL
사람의 질문 문장을 데이터베이스 조회문으로 바꾸는 방식입니다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
원문 보기