Hermes Agent중요도: 높음

Hermes가 작업 종류에 따라 AI 모델을 자동으로 골라주는 스킬 등장

r/hermesagent2026년 6월 10일 · 4시간 전

'model-task-router'는 Hermes에서 쓸 수 있는 스킬로, 들어온 작업을 보고 어떤 AI 모델이 가장 적합한지 자동으로 판단해 연결해준다. 코딩 실력 비교에서 현재 V4-Pro는 실제 코딩 과제 중 8%만 해결한 반면, GPT-5.5는 70%를 해결해 모델 간 격차가 크다는 점이 드러났다.

지금까지는 Hermes를 쓸 때 어떤 AI 모델을 쓸지 사용자가 직접 골라야 했다. 이 스킬은 그 선택을 자동화한다. 작업 내용을 분석해 '이 작업엔 이 모델이 낫다'고 판단하고 자동으로 연결해주는 방식이다.

스킬 제작자는 DeepSWE라는 실제 소프트웨어 개발 과제 벤치마크 데이터를 근거로 성능을 비교했다. 현재 Hermes V4-Pro는 이 과제의 8%만 통과했고, GPT-5.5는 70%를 통과했다. 코딩처럼 어려운 작업은 외부 모델로 넘기고, Hermes가 잘 하는 작업은 그대로 처리하는 전략이 이 스킬의 핵심이다.

핵심 포인트

Hermes 스킬 형태로 설치해 바로 사용 가능하다.
작업 유형을 자동 판단해 적합한 AI 모델로 연결해준다.
코딩 벤치마크(DeepSWE)에서 V4-Pro 8% vs GPT-5.5 70% — 모델별 격차가 크다.
코딩처럼 특정 모델이 강한 작업은 해당 모델로 자동 위임할 수 있다.
Hermes를 허브로 삼아 여러 모델의 장점을 함께 활용하는 구조를 만들 수 있다.

용어 한 줄 설명

Hermes: AI 에이전트가 웹이나 도구를 써서 작업하도록 돕는 서비스입니다.
스킬: AI가 특정 일을 더 잘 하도록 만든 지시문이나 작업 묶음입니다.
AI 모델: 질문에 답하거나 글을 만드는 방법을 배운 프로그램입니다.
코딩: 컴퓨터가 이해할 수 있는 언어로 명령을 작성하여 프로그램을 만드는 일입니다.
자동화: 사람이 반복해서 하던 일을 도구가 대신 하게 만드는 것입니다.
DeepSWE: 실제 소프트웨어 개발 과제로 AI 모델의 코딩 실력을 측정하는 공개 벤치마크(테스트 기준).
소프트웨어: 컴퓨터나 스마트 장치에서 작업을 수행하는 프로그램입니다.
벤치마크: 성능을 비교하려고 정해진 방식으로 해보는 시험입니다.

이 사건을 다룬 원문 (3)

원문 보기 ↗