Hermes Agent중요도: 낮음

외장 GPU로 노트북에서 72GB AI 모델 돌리기 — eGPU 설정기

r/eGPU2026년 6월 11일 · 4시간 전

씽크패드 노트북에 RTX Pro 5000 외장 GPU(72GB 메모리)를 연결해 대형 AI 모델을 로컬에서 실행하는 설정 과정을 공유한 글입니다. Tailscale로 외부에서도 접근할 수 있게 했습니다. 고사양 장비가 있어야 하는 틈새 사례입니다.

일반적으로 대형 언어 모델(LLM)을 로컬에서 돌리려면 메모리가 많은 GPU가 필요합니다. 이 글의 작성자는 씽크패드 P52 노트북에 RTX Pro 5000 Blackwell(VRAM 72GB)을 eGPU(외장 그래픽 카드) 방식으로 연결해 이 문제를 해결했습니다. 노트북 자체 GPU 대신 외부 박스에 고성능 카드를 꽂고 Thunderbolt 등으로 연결하는 방식입니다.

Tailscale을 사용해 집 밖에서도 이 서버에 안전하게 접속할 수 있도록 구성했습니다. hermes-agent 같은 고용량 모델을 자체 장비에서 운영하고 싶은 사람에게 참고가 될 수 있지만, 수백만 원대 장비가 전제여서 실용 범위는 좁습니다.

핵심 포인트

RTX Pro 5000은 VRAM이 72GB로, 대부분의 대형 AI 모델을 한 번에 메모리에 올릴 수 있습니다
eGPU는 노트북에 외부 그래픽 카드 박스를 연결해 GPU 성능을 높이는 방식입니다
Tailscale을 쓰면 집 밖에서도 자신의 로컬 AI 서버에 안전하게 접속할 수 있습니다
이 설정은 고가 장비가 필요해 일반 사용자가 바로 따라 하기는 어렵습니다

용어 한 줄 설명

AI 모델: 질문에 답하거나 글을 만드는 방법을 배운 프로그램입니다.
Tailscale: 인터넷을 통해 집 안의 기기에 안전하게 접속할 수 있게 해주는 가상 네트워크 도구
대형 언어 모델: ChatGPT, Claude처럼 글을 읽고 쓰고 코드를 짜는 데 쓰이는 대규모 AI 프로그램.
eGPU: 노트북 외부에 그래픽 카드를 연결하는 박스로, 노트북 성능을 데스크톱 수준으로 끌어올리는 장치입니다.
그래픽 카드: 컴퓨터에서 화면 출력과 게임 그래픽 처리를 담당하는 부품입니다.
hermes-agent: Nous Research의 에이전트형 AI 도구로 보이는 서비스 이름입니다.
Hermes: AI 에이전트가 웹이나 도구를 써서 작업하도록 돕는 서비스입니다.
로컬 AI: 인터넷 연결 없이 내 컴퓨터 안에서 직접 실행하는 AI 프로그램.

원문 보기 ↗