can-drink-to-cupholder-right-arm-bimanual2
收藏Hugging Face2026-05-08 更新2026-05-08 收录
下载链接:
https://huggingface.co/datasets/notstrober/can-drink-to-cupholder-right-arm-bimanual2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人技术领域。数据集包含200个episodes和102778帧数据,数据以parquet格式存储,视频以mp4格式存储。数据集结构包含多个特征,如动作(12个关节位置)、观察状态(12个关节位置)、来自三个不同视角的图像(左前、右前、右顶)以及时间戳、帧索引、episode索引等元数据。图像分辨率为480x640,帧率为30fps。数据集采用apache-2.0许可证。
This dataset was developed by LeRobot, primarily intended for robotics-related research and applications. It consists of 200 episodes and 102,778 frames of data, where the tabular data is stored in Parquet format and video files are stored in MP4 format. The dataset structure includes multiple features: actions (12 joint positions), observation states (12 joint positions), images captured from three distinct viewpoints (front-left, front-right, and top-right), as well as metadata such as timestamps, frame indices, and episode indices. The images have a resolution of 480×640 and a frame rate of 30 fps. This dataset is released under the Apache-2.0 license.
提供机构:
notstrober
创建时间:
2026-05-08
原始信息汇总
数据集概述:can-drink-to-cupholder-right-arm-bimanual2
该数据集是一个用于机器人操作学习的多模态数据集,由 LeRobot 框架创建,专注于双臂协作场景,具体任务为将饮料罐放入杯托。数据集采用 Apache-2.0 许可证。
一、基本信息
- 任务类型:机器人学(Robotics)
- 机器人类型:
bi_so_follower(双臂从动机器人) - 总任务数:1
- 总回合数 (Episodes):200
- 总帧数 (Frames):102,778
- 帧率 (FPS):30
- 数据分割:
- 训练集:回合 0 至 199(共 200 回合),无验证/测试集划分。
二、数据规模与存储
- 数据集版本:codebase v3.0
- 数据块大小:每个块 1000 帧
- 数据文件:Parquet 格式,总大小约 100 MB
- 视频文件:MP4 格式,总大小约 200 MB
- 存储路径:
- 数据:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
- 数据:
三、数据特征结构
每个样本包含以下特征:
1. 动作与状态(Action & Observation State)
- 类型:float32 向量,维度 12
- 内容:双臂各 6 个关节位置(肩关节俯仰/偏航、肘关节屈曲、腕关节屈曲/旋转、夹爪开合)
- 命名:
- 左臂:
left_shoulder_pan、left_shoulder_lift、left_elbow_flex、left_wrist_flex、left_wrist_roll、left_gripper - 右臂:
right_shoulder_pan、right_shoulder_lift、right_elbow_flex、right_wrist_flex、right_wrist_roll、right_gripper
- 左臂:
2. 机器人观察图像(3 个摄像头视角)
- 分辨率:480×640 像素(3 通道 RGB)
- 视频编码:AV1,像素格式 yuv420p
- 帧率:30 FPS
- 视角:
observation.images.left_front:左前摄像头observation.images.right_front:右前摄像头observation.images.right_top:右上方摄像头
- 是否为深度图:否
3. 元数据
- timestamp:时间戳 (float32)
- frame_index:帧索引 (int64)
- episode_index:回合索引 (int64)
- index:全局索引 (int64)
- task_index:任务索引 (int64)
四、相关链接
- 可视化工具:在 Hugging Face Spaces 上可视化数据集
- 论文:待补充
- 主页:待补充



