작은 연구용 AI 모델이 더 큰 공개 모델을 앞섰다는 주장

Apodex 팀은 작은 딥리서치 모델 제품군을 공개했다고 밝혔습니다. 글에 따르면 Apodex-1.0-4B-SFT는 BrowseCompBrowseComp-ZH에서 공개 30B급 모델들을 앞섰습니다. 팀은 모델 크기보다 학습 데이터 구성이 연구 능력에 큰 영향을 준다고 설명합니다. 가중치는 Apache 2.0으로 공개됐다고 말합니다.

핵심 포인트

  • Apodex는 0.8B, 2B, 4B, 35B-A3B 모델을 공개했다고 말합니다.
  • Apodex-1.0-4B-SFT가 BrowseCompBrowseComp-ZH에서 공개 30B급 모델보다 높았다고 주장합니다.
  • 팀은 신중한 데이터 구성이 모델 크기만큼 중요하다고 설명합니다.
  • 일반 지식, 수학, 지시 따르기, 긴 문맥 평가에서 기본 Qwen3.5 성능을 크게 잃지 않았다고 말합니다.
  • 가중치는 Apache 2.0으로 공개됐다고 합니다.

용어 한 줄 설명

BrowseComp
AI가 웹을 살펴보며 어려운 질문에 답하는 능력을 재는 평가입니다.
30B급 모델
대략 300억 개 규모의 내부 숫자를 가진 큰 AI 모델을 뜻합니다.
30B급
모델 안의 계산 단위가 약 300억 개인 크기라는 뜻입니다.
학습 데이터
AI가 공부하고 배우는 데 사용되는 엄청난 양의 정보나 자료들을 말합니다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
지연 시간
사용자 입력 후 AI가 응답을 시작할 때까지 걸리는 시간
도구 호출
AI가 검색, 파일 읽기 같은 외부 기능을 부르는 일입니다.
Qwen
알리바바가 만든 AI 모델 계열 이름입니다.
원문 보기