환각을 줄이는 로컬 모델용 응답 차단 도구 공개

글쓴이는 증거를 주는 순서에 따라 모델 답변이 달라지는 문제를 다룬 ICML 2026 논문이 채택됐다고 밝혔다. 함께 공개한 ntkMirror는 로컬 open-weight models에서 답할지 abstain할지 판단하는 training-free 도구라고 설명했다. 논문 실험에서는 약 24%를 abstain하면서 hallucination을 0.0~0.7%로 낮췄다고 주장했다. 새 테스트에서는 fused kernel이 정확도는 거의 유지하면서 처리 속도를 2.6~10배 높였다고 밝혔다.

핵심 포인트

  • ntkMirror는 로컬 open-weight models에서 실행되는 공개 도구다.
  • 이 도구는 답변을 내기 전에 여러 증거 순서로 같은 주장을 점검한다.
  • 정보가 부족하다고 판단하면 답하지 않고 abstain한다.
  • 글쓴이는 fine-tuning이나 두 번째 모델 없이 쓸 수 있다고 설명했다.
  • fused kernel은 같은 작업을 더 빠르게 묶어 처리한다고 주장했다.

용어 한 줄 설명

open-weight models
모델 내부 가중치가 공개되어 로컬에서 직접 실행할 수 있는 AI 모델이다.
open-weight
모델의 핵심 가중치가 공개되어 직접 내려받아 운영할 수 있는 형태를 말한다.
models
AI 도구 안에서 답변이나 코드를 만드는 각각의 AI 엔진을 뜻합니다.
abstain
모델이 답을 내지 않고 모른다고 멈추는 선택이다.
training-free
모델을 새로 학습시키지 않고 바로 쓰는 방식이다.
hallucination
AI가 사실이 아닌 내용을 그럴듯하게 말하는 현상이다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
fine-tuning
기존 인공지능 모델을 특정 목적에 맞게 추가로 학습시키는 일입니다.
원문 보기