Kimi K2.7 Code, 코딩 에이전트 비용 절감 신호

Moonshot이 이번 주 Kimi K2.7 Code를 오픈소스로 공개했다. 성능 수치는 Kimi Code Bench v2 50.9에서 62.0, Program Bench 48.3에서 53.6, MLS Bench Lite 26.7에서 35.1, MCP Mark Verified 72.8에서 81.1로 올랐다. 모델 구조는 같은 1T MoE 계열이며, 한 번에 실제로 쓰는 활성 매개변수는 32B이고, 256k 컨텍스트를 처리한다.

더 중요한 변화는 K2.6보다 추론 토큰 사용량이 30% 줄었다는 점이다. 코딩 에이전트는 문제를 살피고, 코드를 고치고, 테스트하고, 실패하면 다시 시도하는 과정을 반복하기 때문에 추론 토큰이 비용 병목이 되기 쉽다. 최고급 모델인 GPT-5.5나 Opus와의 코딩 성능 격차는 아직 남아 있다.

다만 Moonshot 표 기준 MCP Mark Verified에서는 K2.7이 81.1로 Opus 4.8의 76.4보다 높아, 에이전트형 평가에서는 꽤 경쟁력이 있어 보인다. 앞으로 나올 고속 모드는 같은 모델에서 출력 속도를 약 5~6배 높인다고 하며, 사실이라면 최고 모델을 완전히 대체하기보다 반복 작업의 비용과 시간을 줄이는 용도에 더 맞다.

핵심 포인트

  • Kimi K2.7 Code는 Moonshot이 오픈소스로 공개한 코딩용 모델이다.
  • K2.6보다 추론 토큰 사용량이 30% 줄었다고 제시됐다.
  • 여러 코딩 벤치마크 점수가 올랐고, MCP Mark Verified는 72.8에서 81.1로 상승했다.
  • Moonshot 표에서는 MCP Mark Verified 기준 K2.7이 Opus 4.8보다 높은 점수를 보였다.
  • 예정된 고속 모드는 같은 모델에서 출력 속도를 약 5~6배 높이는 것이 목표다.

용어 한 줄 설명

활성 매개변수
모델 전체가 아니라 한 번의 답변 생성에 실제로 쓰이는 계산 부분의 크기다.
토큰 사용량
AI에게 보내고 받은 글의 양을 세는 단위 사용량입니다.
코딩 에이전트
사람의 요청을 받아 코드를 작성하거나 고치는 AI 도구입니다.
GPT-5.5
Codex에 쓰인다고 소개된 OpenAI의 AI 모델 이름이다.
Opus 4.8
Claude 계열의 고성능 AI 모델 이름입니다.
에이전트형
사용자의 지시를 받아 여러 단계를 스스로 처리하도록 만든 방식이다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
작업 흐름
사용자가 어떤 일을 끝내기 위해 거치는 순서와 과정입니다.
원문 보기