Rayline, Claude Code 하위 작업을 더 싼 모델로 나눠 실행

Rayline, Claude Code 하위 작업을 더 싼 모델로 나눠 실행

Hacker News에 소개된 Rayline은 Claude Code와 함께 쓰는 LLM gateway입니다. 이 도구는 Claude Code 안의 subagent 호출을 가로채서, 작업별로 다른 모델을 쓰게 합니다. 예를 들어 मुख्य 작업은 Opus로 돌리고, 일부 작은 작업은 클라우드의 저렴한 모델이나 기기 안의 모델로 보낼 수 있다고 설명합니다.

핵심 포인트

  • Rayline은 Claude Code와 호환되는 LLM gateway라고 소개됐습니다.
  • Claude Code의 subagent 호출을 작업별로 다른 모델에 보낼 수 있습니다.
  • 메인 agent는 Opus를 쓰고, 일부 보조 작업은 더 저렴한 모델이나 on-device 모델로 보낼 수 있다고 합니다.
  • 라우팅 결정을 agent가 매번 생각하게 하지 않고, 사용자가 정한 규칙으로 처리할 수 있다고 설명합니다.
  • 별도 작업 도구가 아니라 Claude Code 사용 흐름을 유지하는 방식이라고 합니다.

용어 한 줄 설명

LLM gateway
AI 모델 호출 앞단에서 어떤 모델을 쓸지, 비용을 어떻게 줄일지 관리하는 중간 층이다.
gateway
여러 도구나 서비스가 오가도록 연결해 주는 중간 통로다.
GATE
인도에서 공학·과학 분야 대학원 진학이나 공공기관 채용에 쓰이는 시험입니다.
subagent
큰 작업 안에서 따로 맡겨진 작은 AI 작업자다.
Opus
Anthropic의 Claude 계열 고성능 모델 이름으로 쓰입니다.
클라우드
내 컴퓨터가 아니라 인터넷으로 연결된 외부 컴퓨터를 쓰는 방식입니다.
1인 개발자
회사에 소속되지 않고 혼자서 기획부터 제작까지 모든 과정을 책임지는 제작자.
라우팅
요청의 특성에 따라 어떤 AI 모델로 보낼지 자동으로 결정하는 방식.
원문 보기