Claude Code로 에이전트 성능을 하루 만에 23.7% 높였다는 사례
Reddit 글쓴이는 Claude Code를 써서 에이전트를 반복 개선하는 작업을 해왔다고 말합니다. 같은 방식으로 Fable을 사용했더니 가장 어려운 내부 에이전트 벤치마크 점수가 하루 만에 23.7% 올랐다고 주장합니다. 글쓴이는 이 흐름을 직접 시험해볼 수 있도록 자신들이 만든 구조를 공유하겠다고 말합니다.
핵심 포인트
용어 한 줄 설명
- DDI
- DNS·DHCP·IP 주소 관리를 합쳐서 부르는 말
- Fable
- 이 글에서 사용자가 기대하며 써보려던 Claude 관련 기능 또는 모델 이름입니다.
- BLE
- 기기끼리 가까운 거리에서 적은 전력으로 연결하는 블루투스 방식입니다.
- 벤치마크
- 성능을 비교하려고 정해진 방식으로 해보는 시험입니다.
- 1인 개발자
- 회사에 소속되지 않고 혼자서 기획부터 제작까지 모든 과정을 책임지는 제작자.
- 작업 흐름
- 사용자가 어떤 일을 끝내기 위해 거치는 순서와 과정입니다.
- 루프
- 같은 과정을 반복해서 결과를 조금씩 고치는 방식입니다.
- Opus
- Anthropic의 Claude 계열 고성능 모델 이름으로 쓰입니다.