무료 축구 데이터로 만든 저비용 RAG 질의응답 데모

국제 축구 데이터를 바탕으로 질문에 답하는 무료 RAG 데모가 공개됐다. 다루는 데이터는 2022년 월드컵, 유로 2024, 코파 아메리카 2024의 경기 세부 정보이며, 슈팅, 기대 득점, 득점자 같은 내용이 포함된다. 2026년 월드컵은 전체 일정이 들어가 있고, 실제 경기가 끝나면 결과가 추가되는 방식이다.

답변마다 사용한 경기 기록을 함께 보여주기 때문에 사용자가 근거를 직접 확인할 수 있다. 구성은 일부러 단순하다. 데이터를 작은 조각으로 나누고, 임베딩을 만든 뒤, 벡터를 SQLitesqlite-vec 확장에 저장하고, 질문에 맞는 상위 자료를 찾아 LLM에 넘긴다.

별도 벡터 데이터베이스 서비스나 무거운 프레임워크 없이 만들 수 있으며, 무료 공개 데이터로 돌아가고 Ollama를 쓰면 완전히 로컬에서도 실행할 수 있다.

핵심 포인트

  • 무료 공개 축구 데이터로 질문에 답하는 RAG 데모다.
  • 2022년 월드컵, 유로 2024, 코파 아메리카 2024의 경기 세부 정보를 사용한다.
  • 답변마다 근거가 된 경기 기록을 보여줘 확인이 가능하다.
  • SQLitesqlite-vec로 벡터를 저장해 별도 벡터 데이터베이스 서비스를 쓰지 않는다.
  • Ollama를 쓰면 로컬에서 실행할 수 있어 비용을 낮출 수 있다.

용어 한 줄 설명

기대 득점
슛이 골이 될 가능성을 숫자로 계산한 축구 지표다.
SQLite
작은 앱이나 브라우저 안에서도 쓸 수 있는 가벼운 데이터베이스입니다.
sqlite-vec
SQLite 안에서 임베딩 같은 벡터 데이터를 검색할 수 있게 해 주는 확장 기능이다.
벡터 데이터베이스
텍스트나 이미지를 숫자 형태로 변환해 저장하고, 의미가 비슷한 내용을 빠르게 찾아주는 특수 저장소
데이터베이스
많은 정보를 체계적으로 모아두어 찾아보기 쉽게 만든 정보의 집합체입니다.
Ollama
내 컴퓨터에 AI 모델을 내려받아 실행하게 해 주는 도구입니다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
운영 비용
사업이나 서비스를 유지하기 위해 계속해서 들어가는 돈입니다.
원문 보기