애플 실리콘 맥에서 맞는 로컬 LLM을 고르는 도구 paddock

한 Reddit 사용자가 애플 실리콘 맥에서 로컬 LLM을 고르는 Rust 도구인 paddock을 공개했다. 이 도구는 맥의 칩, RAM, Metal 메모리 한계를 읽고 어떤 모델이 맞는지 계산한다. Ollama, Hugging Face GGUF, mlx-community 모델을 비교하고, 실행 명령이나 OpenAI 호환 endpoint도 만든다고 설명했다.

핵심 포인트

  • paddock은 애플 실리콘 맥의 칩과 RAM 정보를 읽어 로컬 LLM 적합성을 계산한다.
  • macOS의 Metal 메모리 한계를 반영해 모델이 실제로 들어갈지 추정한다.
  • Ollama, Hugging Face GGUF, mlx-community 모델을 비교한다고 설명했다.
  • paddock run과 paddock serve는 실행 명령이나 OpenAI 호환 endpoint를 만든다.
  • GGUF 파일의 앞부분만 읽어 모델 정보를 파악해 큰 파일을 모두 내려받지 않아도 된다고 한다.

용어 한 줄 설명

애플 실리콘
애플이 직접 만든 맥 전용 칩으로, 인공지능 작업을 빠르게 처리하는 기능이 포함되어 있습니다.
로컬 LLM
클라우드 서버가 아닌 내 컴퓨터에서 직접 실행하는 AI 언어 모델.
Metal
애플 기기에서 그래픽 칩을 쓰게 해주는 애플의 기술이다.
Ollama
내 컴퓨터에 AI 모델을 내려받아 실행하게 해 주는 도구입니다.
Hugging Face
AI 모델과 데이터셋을 공개하고 내려받는 온라인 저장소입니다.
Unity
게임을 만들 때 널리 쓰이는 소프트웨어 개발 환경.
endpoint
프로그램이 다른 서비스에 요청을 보내는 인터넷 주소나 접속 지점이다.
맥미니 서버
맥 미니를 집이나 사무실에서 계속 켜 두고 파일, 앱, 자동화 작업 등에 쓰는 방식입니다.
원문 보기