Gemini 3.1 Pro, 토큰 단가는 비싸도 실제 비용은 Flash보다 저렴

도구를 만드는 Tessl 팀이 4종을 약 3,300번의 코딩 작업에 걸쳐 비교한 결과를 공개했다. 는 작업당 87.9점에 0.66달러, 는 88.6점에 1.05달러가 들었다. 점수 차이는 0.7점에 불과한데 비용은 Flash가 59% 더 비쌌다.

역설적인 점은 3.1 Pro의 토큰(글자 단위 처리 묶음) 단가 자체는 Flash보다 높다는 것이다. 실제 비용 차이는 모델이 문제를 푸는 방식에서 나왔다. 3.1 Pro는 작업 하나에 평균 26번 대화를 주고받으며 약 65만 토큰을 처리한 반면, Flash는 39번 대화에 약 140만 토큰을 썼다.

Flash가 더 많은 정보를 끌어들이고 더 많은 단계를 거치다 보니 총비용이 역전된 것이다. 추가로, 관련 기술 정보(스킬)를 레지스트리에서 제공했을 때 3.1 Pro는 비용이 23% 줄면서 점수도 크게 올랐지만, Flash 계열은 변화가 거의 없었다.

핵심 포인트

  • 는 토큰 단가가 높아도 실제 작업당 비용은 Flash보다 39% 저렴했다
  • Flash가 비싼 이유는 한 작업에 더 많은 대화 단계와 더 많은 토큰을 소비했기 때문이다
  • 관련 정보를 미리 제공하면 3.1 Pro의 비용이 추가로 23% 절감되고 성능도 향상됐다
  • 에이전트 작업에서는 '토큰 단가'보다 '작업당 실제 비용'을 직접 측정해야 한다
  • 이 벤치마크는 Tessl 팀의 작업 기준이므로 다른 용도에서는 결과가 다를 수 있다
원문 보기