AI 에이전트 업체 문서를 15개 기준으로 비교한 공개 평가표

한 Reddit 사용자가 에이전트형 AI 업체 문서를 15개 질문으로 평가하는 도구를 만들었다고 말했습니다. 이 도구는 공개 문서 폴더를 넣으면 점수와 근거 인용을 담은 보고서를 만든다고 합니다. 작성자는 Anthropic Claude Agent SDK, OpenAI Agents SDK, LangGraph, Sierra, Salesforce Agentforce를 비교했고, 공개 자료 기준 점수도 함께 공개했습니다. 평가 기준에는 도구 호출 정확성, 반복 작업 종료, 여러 단계의 상태 유지, 비용 상한 공개 여부 등이 포함됐습니다.

핵심 포인트

  • 작성자는 15개 질문으로 에이전트형 AI 업체 문서를 평가하는 도구를 만들었다고 설명했습니다.
  • 평가는 업체의 공개 문서만 사용했다고 합니다.
  • OpenAI Agents SDK는 3.20점, Anthropic Claude Agent SDK는 3.27점으로 공개됐습니다.
  • Salesforce Agentforce는 넓은 기업용 인증을 갖췄지만, 비용 상한과 일부 기술 공개 부족으로 낮은 점수를 받았다고 합니다.
  • 작성자는 평가 방식이 공개 문서가 많은 업체에 유리한지 피드백을 요청했습니다.

용어 한 줄 설명

에이전트형 AI
사람이 매번 지시하지 않아도 여러 단계를 스스로 이어서 처리하는 AI 방식입니다.
Claude Agent SDK
Claude를 이용해 도구를 쓰고 작업을 진행하는 AI 에이전트를 만들기 위한 개발 도구입니다.
agent SDK
AI 에이전트 기능을 앱에 붙이기 쉽게 해 주는 개발 도구 묶음입니다.
AI agents
사람이 매번 시키지 않아도 목표에 맞춰 스스로 일을 진행하는 AI입니다.
AI agent
사용자가 매번 시키지 않아도 정해진 일을 계속 살피고 처리하는 AI 기능입니다.
agents
사용자 지시를 받아 코드를 고치거나 작업을 진행하는 AI 도구입니다.
LangGraph
AI가 여러 단계를 순서대로 처리하도록 흐름을 설계하는 오픈소스 프레임워크로, 복잡한 에이전트 로직을 그래프 구조로 표현한다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
원문 보기