오픈소스중요도: 보통

AI 에이전트 도구 실행을 빠르게 막는 보안 게이트웨이

r/LLMDevs2026년 6월 13일 · 6시간 전

AI 에이전트가 데이터베이스, 로컬 셸, 응용프로그램 인터페이스 같은 도구에 연결되면, 예측이 어려운 모델에게 실제 실행 권한을 주는 셈이다. 기존 방식은 모델의 답을 보고 위험한 행동이 없는지 추측하거나, 다른 거대 언어 모델이 중간에서 검사하게 해 시간이 크게 늘어나는 문제가 있다.

Trajeckt는 프롬프트 문장을 고치거나 위험한 단어를 찾는 대신, 실제 도구 호출이 실행되는 단계 아래에서 막는 게이트웨이다. 도구 호출이나 실행 경로가 미리 정한 명세와 정확히 맞지 않으면 바로 버린다.

보안 계층의 지연 시간은 약 1.6밀리초로 제시되며, 500밀리초처럼 큰 추가 대기 시간을 피하는 것이 핵심이다. 이 구조는 모델이 직접 허락을 요청하는 방식이 아니어서 프롬프트 인젝션이나 탈옥 시도로 샌드박스를 벗어나기 어렵다는 주장이다.

핵심 포인트

AI 에이전트가 데이터베이스, 로컬 셸, 응용프로그램 인터페이스를 직접 쓰면 실행 위험이 커진다.
다른 거대 언어 모델로 매번 검사하는 방식은 지연 시간과 비용을 늘릴 수 있다.
Trajeckt는 프롬프트가 아니라 실제 도구 호출 실행 단계에서 차단한다.
명세와 맞지 않는 도구 호출은 실패로 처리하고 실행하지 않는다.
제시된 지연 시간은 약 1.6밀리초다.

용어 한 줄 설명

AI 에이전트: 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
데이터베이스: 많은 정보를 체계적으로 모아두어 찾아보기 쉽게 만든 정보의 집합체입니다.
응용프로그램 인터페이스: 프로그램끼리 정해진 방식으로 데이터를 주고받게 해주는 연결 규칙이다.
거대 언어 모델: 많은 글을 학습해 질문에 답하거나 글과 코드를 만드는 AI 모델이다.
게이트웨이: Hermes Agent와 외부 서비스 사이에서 연결을 중계하는 실행 환경입니다.
지연 시간: 사용자 입력 후 AI가 응답을 시작할 때까지 걸리는 시간
프롬프트 인젝션: 외부 텍스트에 숨긴 명령어로 AI를 속여 원래 지시와 다른 행동을 하게 만드는 공격 기법
독립 검증: 만든 쪽이 아닌 다른 사람이 사실인지 따로 확인하는 일입니다.

원문 보기 ↗