외장 GPU로 노트북에서 72GB AI 모델 돌리기 — eGPU 설정기
씽크패드 노트북에 RTX Pro 5000 외장 GPU(72GB 메모리)를 연결해 대형 AI 모델을 로컬에서 실행하는 설정 과정을 공유한 글입니다. Tailscale로 외부에서도 접근할 수 있게 했습니다. 고사양 장비가 있어야 하는 틈새 사례입니다.
일반적으로 대형 언어 모델(LLM)을 로컬에서 돌리려면 메모리가 많은 GPU가 필요합니다. 이 글의 작성자는 씽크패드 P52 노트북에 RTX Pro 5000 Blackwell(VRAM 72GB)을 eGPU(외장 그래픽 카드) 방식으로 연결해 이 문제를 해결했습니다. 노트북 자체 GPU 대신 외부 박스에 고성능 카드를 꽂고 Thunderbolt 등으로 연결하는 방식입니다.
Tailscale을 사용해 집 밖에서도 이 서버에 안전하게 접속할 수 있도록 구성했습니다. hermes-agent 같은 고용량 모델을 자체 장비에서 운영하고 싶은 사람에게 참고가 될 수 있지만, 수백만 원대 장비가 전제여서 실용 범위는 좁습니다.
핵심 포인트
용어 한 줄 설명
- AI 모델
- 질문에 답하거나 글을 만드는 방법을 배운 프로그램입니다.
- Tailscale
- 인터넷을 통해 집 안의 기기에 안전하게 접속할 수 있게 해주는 가상 네트워크 도구
- 대형 언어 모델
- ChatGPT, Claude처럼 글을 읽고 쓰고 코드를 짜는 데 쓰이는 대규모 AI 프로그램.
- eGPU
- 노트북 외부에 그래픽 카드를 연결하는 박스로, 노트북 성능을 데스크톱 수준으로 끌어올리는 장치입니다.
- 그래픽 카드
- 컴퓨터에서 화면 출력과 게임 그래픽 처리를 담당하는 부품입니다.
- hermes-agent
- Nous Research의 에이전트형 AI 도구로 보이는 서비스 이름입니다.
- Hermes
- AI 에이전트가 웹이나 도구를 써서 작업하도록 돕는 서비스입니다.
- 로컬 AI
- 인터넷 연결 없이 내 컴퓨터 안에서 직접 실행하는 AI 프로그램.