로봇용 AI 데이터 정리 도구 Refiner 공개

Hugging Face에서 사전학습을 맡았던 팀 출신들이 로봇 데이터 정리용 라이브러리 Refiner를 공개했다. Refiner는 Parquet, HDF5, MCAP, Zarr, RLDS, LeRobot 같은 여러 로봇 데이터 형식을 한곳에서 받아들일 수 있다.

로봇이 본 영상에서 손 움직임을 추적하고, 긴 작업을 작은 단계로 나누어 표시하고, 보상 모델을 실행하는 흐름도 지원한다. 로봇용 AI를 만들 때 데이터 형식이 제각각이면 준비 시간이 길어지는데, Refiner는 이 과정을 표준화하려는 도구에 가깝다.

핵심 포인트

  • Refiner는 로봇 데이터 정리를 위한 새 오픈소스 라이브러리다.
  • Parquet, HDF5, MCAP, Zarr, RLDS, LeRobot 형식을 지원한다.
  • 영상 기반 손 추적, 세부 작업 표시, 보상 모델 실행을 지원한다.
  • 로봇 AI 개발에서 데이터 준비 시간을 줄이는 데 도움이 될 수 있다.

용어 한 줄 설명

Hugging Face
AI 모델과 데이터셋을 공개하고 내려받는 온라인 저장소입니다.
사전학습
AI 모델이 특정 작업을 배우기 전에 많은 데이터로 기본 능력을 먼저 익히는 과정입니다.
라이브러리
자주 쓰는 기능을 미리 만들어 놓아서 가져다 쓸 수 있는 코드 모음입니다.
Parquet
큰 데이터를 빠르게 읽고 저장하기 위해 자주 쓰는 파일 형식이다.
LeRobot
로봇 학습 데이터를 다루기 위한 Hugging Face 쪽 도구와 데이터 형식이다.
데이터 형식
정보가 일정한 규칙에 따라 적힌 모양이나 구조를 뜻합니다.
AI 에이전트
사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
오픈소스
소스 코드를 공개해 누구나 보고 사용할 수 있게 한 방식입니다.
원문 보기