새 Mythos 벤치마크 공개 — AI 코딩 능력 측정 기준 추가
라는 새 벤치마크가 공개됐다. 벤치마크란 의 능력을 일관된 기준으로 측정하는 테스트 세트다.
커뮤니티에서 공유된 이 소식은 의 성능을 비교하는 새로운 척도로 주목받고 있다. 다만 게시글 본문에 구체적인 수치나 방법론이 포함되지 않아 상세 내용은 원문 링크를 통해 확인이 필요하다.
핵심 포인트
- 라는 새 가 공개됐다
- 관련 커뮤니티에서 공유된 소식이다
- 벤치마크는 의 성능을 객관적으로 비교하는 테스트 기준이다
- 게시글 자체에 세부 내용이 없어 원문 확인이 필요하다