AI 에이전트 재시도 중복 실행을 막는 오픈소스 도구 Replaysafe
한 개발자가 AI 에이전트가 작업 중 멈춘 뒤 다시 실행될 때 같은 결제, 이메일, CRM 입력이 두 번 생기는 문제를 겪었다고 밝혔다. 이를 막기 위해 비멱등 호출을 감싸고, 작업 내용을 fingerprint로 기록해 이미 실행된 작업이면 저장된 결과를 돌려주는 Replaysafe를 오픈소스로 공개했다. 이 도구는 LangGraph, CrewAI, Inngest, n8n, Airflow와 함께 쓸 수 있는 npm 패키지이며 별도 인프라는 필요 없다고 설명했다. 관련 글에서는 세션별 retry budget을 두어 재시도 폭주로 인한 도구 호출 비용을 막은 사례도 함께 나왔다.
핵심 포인트
- AI 에이전트가 실패 후 재시도할 때 같은 작업을 두 번 실행할 수 있다.
- Replaysafe는 작업의 type, target, input을 바탕으로 fingerprint를 만들고 실행 기록을 확인한다.
- 이미 실행된 작업이면 다시 실행하지 않고 저장된 결과를 반환한다.
- 재시도 폭주를 막기 위한 circuit breakers와 일부 실패를 되돌리기 위한 rollback hooks를 포함한다고 설명했다.
- 관련 사례는 세션별 retry budget이 runaway agent bill을 줄이는 데 도움이 됐다고 말한다.
용어 한 줄 설명
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
- 비멱등 호출
- 한 번 더 실행하면 결과가 달라지거나 문제가 생길 수 있는 작업이다.
- fingerprint
- 같은 작업인지 알아보기 위해 입력 내용을 바탕으로 만든 고유한 표시다.
- LangGraph
- AI가 여러 단계를 순서대로 처리하도록 흐름을 설계하는 오픈소스 프레임워크로, 복잡한 에이전트 로직을 그래프 구조로 표현한다.
- Airflow
- 여러 데이터 작업을 정해진 순서와 시간에 실행하도록 관리하는 오픈소스 도구다.
- retry budget
- 한 세션에서 재시도를 몇 번까지 허용할지 정한 한도다.
- API 호출
- Cursor가 AI 서버에 답을 요청하는 행위로, 호출 횟수만큼 비용이 쌓인다
- circuit breakers
- 오류가 계속될 때 더 큰 문제를 막기 위해 실행을 잠시 멈추는 장치다.