에이전트 검증 특화 초소형 오픈 모델 Apodex-1.0 공개 (0.8B·2B·4B)

AI 에이전트가 자신의 출력을 스스로 검증하는 작업에 최적화된 아주 작은 오픈소스 언어 모델 3종이 공개됐습니다. 가장 작은 모델은 0.8B로, 노트북에서도 무료로 실행할 수 있습니다. 고가의 대형 API 대신 로컬에서 저비용으로 에이전트 검증 단계를 처리하는 용도로 쓸 수 있습니다.

AI 에이전트 시스템에서 '검증' 단계는 생성된 결과가 올바른지 다시 확인하는 역할을 합니다. 지금까지는 이 단계에도 GPT-4급 대형 모델을 쓰는 경우가 많아 비용이 높았습니다. Apodex-1.0은 이 검증 역할만 잘 하도록 집중적으로 학습한 모델로, 크기가 0.8B·2B·4B 세 가지라 개인 컴퓨터에서도 무료로 돌릴 수 있습니다.

모델 성능은 AgentHarness라는 에이전트 전용 평가 도구로 측정됐습니다. 오픈 웨이트(가중치 공개) 방식이어서 누구나 내려받아 수정하거나 자신의 파이프라인에 통합할 수 있습니다. 에이전트를 많이 돌리는 환경에서 검증 단계만 이 모델로 교체하면 API 비용을 크게 줄일 수 있습니다.

핵심 포인트

  • 0.8B·2B·4B 세 가지 크기로 개인 PC·서버 어디서나 무료 실행 가능
  • 에이전트가 출력 결과를 스스로 확인하는 '검증' 단계에 특화
  • 오픈 웨이트 공개 — 자유롭게 내려받아 수정·통합 가능
  • AgentHarness 벤치마크로 에이전트 성능 검증
  • 대형 API 호출을 로컬 소형 모델로 대체해 비용 절감 가능

용어 한 줄 설명

AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
오픈소스
소스 코드를 공개해 누구나 보고 사용할 수 있게 한 방식입니다.
AgentHarness
AI 에이전트의 성능을 측정하기 위해 만들어진 평가(벤치마크) 도구입니다.
harness
도구나 프로그램을 실행하고 살펴보기 쉽게 묶어 주는 보조 시스템입니다.
오픈 웨이트
모델 내부 숫자(가중치)를 누구나 내려받을 수 있도록 공개한 방식으로, 자유롭게 실행·수정할 수 있습니다.
파이프라인
데이터를 가져오고 바꾸고 내보내는 여러 작업을 순서대로 묶은 흐름입니다.
API 비용
서비스 기능을 프로그램으로 호출할 때 사용량에 따라 내는 돈입니다.
벤치마크
성능을 비교하려고 정해진 방식으로 해보는 시험입니다.

이 사건을 다룬 원문 (2)

원문 보기