Hermes가 작업 종류에 따라 AI 모델을 자동으로 골라주는 스킬 등장

'model-task-router'는 Hermes에서 쓸 수 있는 스킬로, 들어온 작업을 보고 어떤 AI 모델이 가장 적합한지 자동으로 판단해 연결해준다. 코딩 실력 비교에서 현재 V4-Pro는 실제 코딩 과제 중 8%만 해결한 반면, GPT-5.5는 70%를 해결해 모델 간 격차가 크다는 점이 드러났다.

지금까지는 Hermes를 쓸 때 어떤 AI 모델을 쓸지 사용자가 직접 골라야 했다. 이 스킬은 그 선택을 자동화한다. 작업 내용을 분석해 '이 작업엔 이 모델이 낫다'고 판단하고 자동으로 연결해주는 방식이다.

스킬 제작자는 DeepSWE라는 실제 소프트웨어 개발 과제 벤치마크 데이터를 근거로 성능을 비교했다. 현재 Hermes V4-Pro는 이 과제의 8%만 통과했고, GPT-5.5는 70%를 통과했다. 코딩처럼 어려운 작업은 외부 모델로 넘기고, Hermes가 잘 하는 작업은 그대로 처리하는 전략이 이 스킬의 핵심이다.

핵심 포인트

  • Hermes 스킬 형태로 설치해 바로 사용 가능하다.
  • 작업 유형을 자동 판단해 적합한 AI 모델로 연결해준다.
  • 코딩 벤치마크(DeepSWE)에서 V4-Pro 8% vs GPT-5.5 70% — 모델별 격차가 크다.
  • 코딩처럼 특정 모델이 강한 작업은 해당 모델로 자동 위임할 수 있다.
  • Hermes를 허브로 삼아 여러 모델의 장점을 함께 활용하는 구조를 만들 수 있다.

용어 한 줄 설명

Hermes
AI 에이전트가 웹이나 도구를 써서 작업하도록 돕는 서비스입니다.
스킬
AI가 특정 일을 더 잘 하도록 만든 지시문이나 작업 묶음입니다.
AI 모델
질문에 답하거나 글을 만드는 방법을 배운 프로그램입니다.
코딩
컴퓨터가 이해할 수 있는 언어로 명령을 작성하여 프로그램을 만드는 일입니다.
자동화
사람이 반복해서 하던 일을 도구가 대신 하게 만드는 것입니다.
DeepSWE
실제 소프트웨어 개발 과제로 AI 모델의 코딩 실력을 측정하는 공개 벤치마크(테스트 기준).
소프트웨어
컴퓨터나 스마트 장치에서 작업을 수행하는 프로그램입니다.
벤치마크
성능을 비교하려고 정해진 방식으로 해보는 시험입니다.

이 사건을 다룬 원문 (3)

원문 보기