로봇용 AI 데이터 정리 도구 Refiner 공개
Hugging Face에서 사전학습을 맡았던 팀 출신들이 로봇 데이터 정리용 라이브러리 Refiner를 공개했다. Refiner는 Parquet, HDF5, MCAP, Zarr, RLDS, LeRobot 같은 여러 로봇 데이터 형식을 한곳에서 받아들일 수 있다.
로봇이 본 영상에서 손 움직임을 추적하고, 긴 작업을 작은 단계로 나누어 표시하고, 보상 모델을 실행하는 흐름도 지원한다. 로봇용 AI를 만들 때 데이터 형식이 제각각이면 준비 시간이 길어지는데, Refiner는 이 과정을 표준화하려는 도구에 가깝다.
핵심 포인트
용어 한 줄 설명
- Hugging Face
- AI 모델과 데이터셋을 공개하고 내려받는 온라인 저장소입니다.
- 사전학습
- AI 모델이 특정 작업을 배우기 전에 많은 데이터로 기본 능력을 먼저 익히는 과정입니다.
- 라이브러리
- 자주 쓰는 기능을 미리 만들어 놓아서 가져다 쓸 수 있는 코드 모음입니다.
- Parquet
- 큰 데이터를 빠르게 읽고 저장하기 위해 자주 쓰는 파일 형식이다.
- LeRobot
- 로봇 학습 데이터를 다루기 위한 Hugging Face 쪽 도구와 데이터 형식이다.
- 데이터 형식
- 정보가 일정한 규칙에 따라 적힌 모양이나 구조를 뜻합니다.
- AI 에이전트
- 사람 대신 정보를 찾거나 작업을 처리하도록 만든 AI 프로그램입니다.
- 오픈소스
- 소스 코드를 공개해 누구나 보고 사용할 수 있게 한 방식입니다.