GPU 없이 AI 에이전트에 목소리 달기 — 원커맨드 설치

GPU 없이 CPU만으로 Claude Code·Codex 같은 AI 코딩 도구에 음성 입출력을 붙이는 오픈소스 스택이 공개됐다. 설치 명령어 한 줄로 macOS·Linux·Windows 모두 동작한다.

이 프로젝트는 세 가지 오픈소스 도구를 조합해 완전히 로컬에서 돌아가는 음성 파이프라인을 만든다. Silero VAD가 마이크 입력에서 사람 목소리만 골라내고, Parakeet STT가 그 음성을 텍스트로 변환하며, Supertonic TTS가 AI의 답변을 다시 음성으로 읽어준다. 인터넷 연결이나 유료 API가 전혀 필요 없고, 일반 노트북 CPU로도 충분히 동작한다는 점이 핵심이다.

실용적인 의미는 크다. Claude Code나 OpenCode를 터미널 앞에서 키보드 없이 말로 조작하거나, 코드 리뷰 결과를 귀로 들을 수 있게 된다. 클라우드 음성 API 비용 걱정 없이 개인 서버나 오프라인 환경에서도 쓸 수 있어 프라이버시에도 유리하다.

핵심 포인트

  • GPU 없는 일반 CPU 환경에서 동작 — 고사양 장비 불필요
  • 명령어 한 줄로 설치 완료, macOS·Linux·Windows 지원
  • Silero VAD로 목소리 감지 → Parakeet STT로 텍스트 변환 → Supertonic TTS로 음성 출력
  • Claude Code, OpenCode, Codex 등 주요 AI 코딩 도구와 바로 연결 가능
  • 완전 로컬 실행 — 인터넷·유료 API 불필요

용어 한 줄 설명

Codex
코드 작성과 개발 업무를 돕는 OpenAI의 AI 도구입니다.
AI 코딩 도구
사람의 설명을 바탕으로 코드를 쓰거나 고치는 프로그램입니다.
macOS
애플의 맥 컴퓨터에서 쓰는 운영체제입니다.
파이프라인
데이터를 가져오고 바꾸고 내보내는 여러 작업을 순서대로 묶은 흐름입니다.
OpenCode
AI 모델을 연결해 코드 작성과 수정을 돕는 개발 도구입니다.
코드 리뷰
코드를 배포하기 전에 문제나 개선점을 확인하는 과정입니다.
API 비용
서비스 기능을 프로그램으로 호출할 때 사용량에 따라 내는 돈입니다.
로컬 실행
인터넷 서버가 아닌 자신의 컴퓨터에서 직접 프로그램을 돌리는 것을 말합니다.

이 사건을 다룬 원문 (2)

원문 보기