72GB 비디오 메모리에서 쓰기 좋은 로컬 대형 언어 모델 후보

72GB 가 있는 3장짜리 컴퓨터에서는 큰 을 비교적 빠르게 올려 쓸 수 있다. GPT-OSS 120B는 여전히 안정적인 선택으로 쓰이고 있다.

Qwen3.5 122B는 한 번의 지시로 코드를 만드는 작업에는 매우 강하지만, 필요 이상으로 오래 생각하는 경향이 있다고 평가된다. GLM Air 4.5 106B는 기본적으로 생각 과정을 길게 쓰지 않는 방식이라 빠른 답변에 자주 쓰인다.

31B와 는 더 작아서 빠르게 올리고 내리기 좋고, 48GB에서도 Q8 형식으로 잘 들어가며, 남는 그래픽카드를 음성·이미지 작업에 쓸 수 있게 해준다. Nematron Nano Omni 30B A3B와 Devstral Small 2 24B도 좋은 모델로 언급되지만, 실제 사용에서는 더 큰 범용 모델이나 Qwen 27B로 대체되고 있다.

핵심 포인트

  • 72GB 환경에서는 100B급 도 올려 쓸 수 있다.
  • Qwen3.5 122B는 에 강하지만 답이 느려질 수 있다.
  • GLM Air 4.5 106B는 빠른 답변용으로 자주 쓰이는 선택지다.
  • 31B와 는 작고 빨라서 그래픽카드를 다른 작업과 나눠 쓰기 쉽다.
  • 에이전트 비용을 줄이려면 큰 모델 하나보다 작업별 모델 조합이 더 현실적일 수 있다.
원문 보기