so101-self-replica-test-rewards

Name: so101-self-replica-test-rewards
Creator: k1000dai
Published: 2026-06-30 18:29:07
License: 暂无描述

Hugging Face2026-06-30 更新2026-06-30 收录

下载链接：

https://huggingface.co/datasets/k1000dai/so101-self-replica-test-rewards

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学数据集，使用LeRobot工具创建，包含10个episodes和8969帧数据，帧率为30fps。数据集特征包括机器人状态观测（6个关节角度）、动作（6个关节控制）、来自手腕、顶部和头顶摄像头的视频观测（分辨率分别为480x640和480x848），以及时间戳、帧索引、episode索引等元数据。奖励标签通过Robometer零样本任务进度生成，平均进度为0.529，平均奖励为0.0004。数据集结构以Parquet文件格式存储，总数据大小为100MB，视频文件大小为200MB，适用于机器人强化学习任务。

This dataset is a robotics dataset created using the LeRobot tool, containing 10 episodes and 8969 frames with a frame rate of 30fps. Features include robot state observations (6 joint angles), actions (6 joint controls), video observations from wrist, top, and overhead cameras (resolutions of 480x640 and 480x848), and metadata such as timestamps, frame indices, and episode indices. Reward labels are generated via Robometer zero-shot task progress, with an average progress of 0.529 and an average reward of 0.0004. The dataset is structured in Parquet format, with a total data size of 100MB and video file size of 200MB, suitable for robotic reinforcement learning tasks.

提供机构：

k1000dai

创建时间：

2026-06-30

原始信息汇总

数据集概述：so101-self-replica-test-rewards

许可证：Apache-2.0
任务类别：机器人学 (Robotics)
标签：LeRobot

数据集结构

该数据集由 LeRobot 创建，包含 10 个 episode，共 8969 帧，1 个任务。

数据格式：数据文件为 Parquet 格式，视频文件为 MP4 格式。

数据结构特征：

特征名	数据类型	形状	说明
`observation.state`	float32	(6,)	机器人关节状态：shoulder_pan, shoulder_lift, elbow_flex, wrist_flex, wrist_roll, gripper
`action`	float32	(6,)	机器人动作指令：与 state 对应的 6 个维度
`observation.images.wrist`	video	(480, 640, 3)	腕部摄像头视频，30 FPS，AV1 编码
`observation.images.top`	video	(480, 848, 3)	顶部摄像头视频，30 FPS，AV1 编码
`observation.images.overhead`	video	(480, 848, 3)	俯视摄像头视频，30 FPS，AV1 编码
`timestamp`	float32	(1,)	时间戳
`frame_index`	int64	(1,)	帧索引
`episode_index`	int64	(1,)	Episode 索引
`index`	int64	(1,)	全局索引
`task_index`	int64	(1,)	任务索引
`next.reward`	float32	(1,)	下一帧的奖励值

机器人类型：so101_follower
数据分割：全部 10 个 episode 均作为训练集（train: "0:10"）。
数据文件大小：约 100 MB (Parquet) + 200 MB (视频)。

奖励标注

数据集中的每帧奖励通过 reward-train-pipeline 中的 Robometer 零样本任务进度模型生成。

奖励类型：progress_delta (进度增量)
平均进度：0.529
平均奖励：0.0004

可视化

可通过 Hugging Face Space 可视化该数据集：visualize_dataset