화면을 읽고 음성으로 돕는 로컬 AI 비서 Hitoku Draft

Hitoku Draft는 내 컴퓨터에서만 실행되는 로컬 AI 비서입니다. 화면, 문서, 현재 쓰는 앱을 보고 상황을 이해한 뒤 음성으로 이메일 답장, PDF 질문, 일정 만들기 등을 도와줍니다. 혼자 일하는 메이커에게는 개인정보를 밖으로 덜 보내면서 AI 비서를 써볼 수 있다는 점이 의미 있습니다.

핵심 포인트

  • 오픈소스로 공개된 음성 중심 AI 비서입니다.
  • PDF 질문, 이메일 답장, 일정 생성, 웹 검색, 글 수정 등을 음성으로 처리할 수 있습니다.
  • Gemma 4, Qwen 3.5 같은 모델과 여러 STT 기능을 지원합니다.
  • Hacker News 사용자를 위한 무료 다운로드 코드가 공개됐습니다.

용어 한 줄 설명

로컬
외부 서버가 아니라 해당 시스템이나 내부 환경 안에 있는 곳을 뜻합니다.
PDF
문서 모양을 거의 그대로 보존해서 공유하는 파일 형식입니다.
오픈소스
소스 코드를 공개해 누구나 보고 사용할 수 있게 한 방식입니다.
STT
사람의 말을 컴퓨터가 글자로 바꾸는 기술입니다.
원문 보기