환각을 줄이는 로컬 모델용 응답 차단 도구 공개
글쓴이는 증거를 주는 순서에 따라 모델 답변이 달라지는 문제를 다룬 ICML 2026 논문이 채택됐다고 밝혔다. 함께 공개한 ntkMirror는 로컬 open-weight models에서 답할지 abstain할지 판단하는 training-free 도구라고 설명했다. 논문 실험에서는 약 24%를 abstain하면서 hallucination을 0.0~0.7%로 낮췄다고 주장했다. 새 테스트에서는 fused kernel이 정확도는 거의 유지하면서 처리 속도를 2.6~10배 높였다고 밝혔다.
핵심 포인트
- ntkMirror는 로컬 open-weight models에서 실행되는 공개 도구다.
- 이 도구는 답변을 내기 전에 여러 증거 순서로 같은 주장을 점검한다.
- 정보가 부족하다고 판단하면 답하지 않고 abstain한다.
- 글쓴이는 fine-tuning이나 두 번째 모델 없이 쓸 수 있다고 설명했다.
- fused kernel은 같은 작업을 더 빠르게 묶어 처리한다고 주장했다.
용어 한 줄 설명
- open-weight models
- 모델 내부 가중치가 공개되어 로컬에서 직접 실행할 수 있는 AI 모델이다.
- open-weight
- 모델의 핵심 가중치가 공개되어 직접 내려받아 운영할 수 있는 형태를 말한다.
- models
- AI 도구 안에서 답변이나 코드를 만드는 각각의 AI 엔진을 뜻합니다.
- abstain
- 모델이 답을 내지 않고 모른다고 멈추는 선택이다.
- training-free
- 모델을 새로 학습시키지 않고 바로 쓰는 방식이다.
- hallucination
- AI가 사실이 아닌 내용을 그럴듯하게 말하는 현상이다.
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
- fine-tuning
- 기존 인공지능 모델을 특정 목적에 맞게 추가로 학습시키는 일입니다.