AI 에이전트 재시도 중복 실행을 막는 오픈소스 도구 Replaysafe

한 개발자가 AI 에이전트가 작업 중 멈춘 뒤 다시 실행될 때 같은 결제, 이메일, CRM 입력이 두 번 생기는 문제를 겪었다고 밝혔다. 이를 막기 위해 비멱등 호출을 감싸고, 작업 내용을 fingerprint로 기록해 이미 실행된 작업이면 저장된 결과를 돌려주는 Replaysafe를 오픈소스로 공개했다. 이 도구는 LangGraph, CrewAI, Inngest, n8n, Airflow와 함께 쓸 수 있는 npm 패키지이며 별도 인프라는 필요 없다고 설명했다. 관련 글에서는 세션별 retry budget을 두어 재시도 폭주로 인한 도구 호출 비용을 막은 사례도 함께 나왔다.

핵심 포인트

  • AI 에이전트가 실패 후 재시도할 때 같은 작업을 두 번 실행할 수 있다.
  • Replaysafe는 작업의 type, target, input을 바탕으로 fingerprint를 만들고 실행 기록을 확인한다.
  • 이미 실행된 작업이면 다시 실행하지 않고 저장된 결과를 반환한다.
  • 재시도 폭주를 막기 위한 circuit breakers와 일부 실패를 되돌리기 위한 rollback hooks를 포함한다고 설명했다.
  • 관련 사례는 세션별 retry budget이 runaway agent bill을 줄이는 데 도움이 됐다고 말한다.

용어 한 줄 설명

AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
비멱등 호출
한 번 더 실행하면 결과가 달라지거나 문제가 생길 수 있는 작업이다.
fingerprint
같은 작업인지 알아보기 위해 입력 내용을 바탕으로 만든 고유한 표시다.
LangGraph
AI가 여러 단계를 순서대로 처리하도록 흐름을 설계하는 오픈소스 프레임워크로, 복잡한 에이전트 로직을 그래프 구조로 표현한다.
Airflow
여러 데이터 작업을 정해진 순서와 시간에 실행하도록 관리하는 오픈소스 도구다.
retry budget
한 세션에서 재시도를 몇 번까지 허용할지 정한 한도다.
API 호출
Cursor가 AI 서버에 답을 요청하는 행위로, 호출 횟수만큼 비용이 쌓인다
circuit breakers
오류가 계속될 때 더 큰 문제를 막기 위해 실행을 잠시 멈추는 장치다.

이 사건을 다룬 원문 (2)

원문 보기