RAG 면접 준비용 오픈소스 자료: 구조, 실패 원인, 운영 지식 정리
GitHub에 공개된 RAG 학습 자료는 실제 운영 환경에서 자주 나오는 면접 질문과 답변을 한곳에 모은 저장소다. 12가지 RAG 구조를 다루며, 단순 검색형 RAG부터 에이전트형 RAG, 그래프 기반 RAG, 자가 점검형 RAG, 추측 생성형 RAG, 여러 형식의 데이터를 다루는 RAG까지 포함한다. 질문과 답변은 200개 이상이며, 난이도는 기초 13개, 중급 58개, 고급 129개로 나뉜다.
운영 중 자주 생기는 6가지 문제도 따로 설명한다. 예를 들어 문맥을 넣었는데도 틀린 답을 내는 경우, 필요한 정보를 못 찾는 경우, 임베딩이 맞지 않는 경우, 색인이 오래된 경우, 문맥 창이 넘치는 경우, 재정렬기가 정답을 뒤로 밀어내는 경우가 포함된다. 쪼개기, 임베딩, 벡터 데이터베이스, 재정렬, 평가 지표, 프롬프트 주입 같은 개념 설명도 들어 있다.
12가지 RAG 유형을 한 표로 비교하는 요약표와 1주 준비, 전화 면접, 시스템 설계 면접용 학습 경로도 제공된다. 앞으로 실습, 면접 시뮬레이터, 평가 도구를 더 추가할 계획이다.
핵심 포인트
- 200개 이상의 RAG 질문과 답변을 12가지 구조별로 정리했다.
- 기초 13개, 중급 58개, 고급 129개로 난이도를 나눴다.
- 문맥 오류, 검색 실패, 오래된 색인, 문맥 창 초과 같은 운영 문제를 다룬다.
- 12가지 RAG 유형을 한 표로 비교하는 요약표가 있다.
- 실습, 면접 시뮬레이터, 평가 도구를 추가할 계획이다.
용어 한 줄 설명
- 에이전트형 RAG
- AI가 스스로 검색 순서나 도구 사용을 정해 답을 만드는 RAG 방식이다.
- 에이전트형
- 사용자의 지시를 받아 여러 단계를 스스로 처리하도록 만든 방식이다.
- 벡터 데이터베이스
- 텍스트나 이미지를 숫자 형태로 변환해 저장하고, 의미가 비슷한 내용을 빠르게 찾아주는 특수 저장소
- 데이터베이스
- 많은 정보를 체계적으로 모아두어 찾아보기 쉽게 만든 정보의 집합체입니다.
- 프롬프트 주입
- 인공지능 도구가 외부 문장에 속아 원래 하면 안 되는 지시를 따르게 되는 공격이다.
- 시스템 설계
- 웹사이트나 앱의 여러 구성 요소가 데이터와 사용자를 잘 처리하도록 구조를 짜는 일입니다.
- 시뮬레이터
- 실제와 비슷한 상황을 가상으로 만들어 연습이나 훈련을 할 수 있게 해주는 프로그램입니다.
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.