뉴스 묶음을 더 정확히 만들기 위한 3단계 RAG 방식
작성자는 브라질 뉴스 모음 서비스를 만들고 있다고 말합니다. 이 서비스는 같은 사건을 다룬 좌우 성향 매체의 기사를 한데 묶는 것을 목표로 합니다. 작성자는 제목이나 본문을 그대로 비교하는 방식은 표현이 달라 잘 맞지 않았다고 설명합니다. 그래서 먼저 LLM으로 중립적인 설명문을 만든 뒤 embedding에 쓰는 방식을 제안합니다.
핵심 포인트
용어 한 줄 설명
- LLM
- 글과 코드를 읽고 답을 만드는 대형 AI 모델입니다.
- embedding
- 글의 뜻을 숫자 형태로 바꿔 비슷한 글을 찾기 쉽게 만든 것입니다.
- DDI
- DNS·DHCP·IP 주소 관리를 합쳐서 부르는 말
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
- 검색
- AI가 답하는 데 필요한 관련 정보 조각을 찾아 가져오는 단계입니다.
- 토큰 사용량
- AI에게 보내고 받은 글의 양을 세는 단위 사용량입니다.
- 토큰
- AI가 글을 읽고 쓸 때 세는 작은 글자 조각 단위입니다.
- 평가
- AI의 답이나 행동이 기준에 맞는지 점수로 확인하는 과정이다.