five

vr_test_single_arm

收藏
Hugging Face2026-03-05 更新2026-03-06 收录
下载链接:
https://huggingface.co/datasets/vladfatu/vr_test_single_arm
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人技术领域。数据集包含17个episodes,总计6382帧数据,数据以parquet格式存储,总数据量为100MB,视频文件大小为200MB。数据帧率为30fps。数据集包含多个特征字段,如动作(action)和观察状态(observation.state),其中动作和观察状态均包含6个关节位置信息。此外,数据集还包含主摄像头图像(observation.images.main),图像分辨率为480x640,3通道,视频编码为av1。其他字段包括时间戳(timestamp)、帧索引(frame_index)、episode索引(episode_index)等。数据集适用于机器人控制、行为克隆等任务。
创建时间:
2026-02-28
原始信息汇总

数据集概述

基本信息

  • 数据集名称: vr_test_single_arm
  • 托管地址: https://huggingface.co/datasets/vladfatu/vr_test_single_arm
  • 创建工具: 使用 LeRobot (https://github.com/huggingface/lerobot) 创建。
  • 可视化链接: https://huggingface.co/spaces/lerobot/visualize_dataset?path=vladfatu/vr_test_single_arm
  • 许可证: Apache-2.0
  • 任务类别: 机器人学

数据集结构

  • 配置名称: default
  • 数据文件格式: Parquet 文件,路径模式为 data/*/*.parquet
  • 代码库版本: v3.0
  • 机器人类型: so_follower
  • 总任务数: 1
  • 总情节数: 17
  • 总帧数: 6382
  • 数据块大小: 1000
  • 帧率: 30 FPS
  • 数据文件大小: 100 MB
  • 视频文件大小: 200 MB
  • 数据分割: 训练集包含所有17个情节 (splits: "train": "0:17")

数据特征

数据以 Parquet 文件存储,主要包含以下特征:

动作

  • 数据类型: float32
  • 形状: [6]
  • 描述: 代表机器人关节位置,具体包括:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测状态

  • 数据类型: float32
  • 形状: [6]
  • 描述: 代表机器人关节位置观测,具体包括:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测图像

  • 数据类型: 视频
  • 形状: [480, 640, 3] (高度, 宽度, 通道)
  • 描述: 主摄像头图像,具体信息如下:
    • 视频高度: 480 像素
    • 视频宽度: 640 像素
    • 视频编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 视频帧率: 30 FPS
    • 视频通道数: 3
    • 包含音频: false

元数据

  • 时间戳: float32 类型,形状为 [1]
  • 帧索引: int64 类型,形状为 [1]
  • 情节索引: int64 类型,形状为 [1]
  • 索引: int64 类型,形状为 [1]
  • 任务索引: int64 类型,形状为 [1]

文件路径模式

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

补充说明

  • 主页: 信息缺失
  • 论文: 信息缺失
  • 引用格式: 信息缺失
搜集汇总
数据集介绍
构建方式
在机器人学习领域,高质量的数据集是推动算法发展的基石。vr_test_single_arm数据集依托LeRobot开源框架构建,通过记录单臂机器人(so_follower类型)在真实或仿真环境中的交互过程生成。数据采集以任务执行为导向,共包含17个完整情节,总计6382帧观测数据,并以30帧每秒的频率同步记录机器人关节状态与视觉图像。原始数据经过结构化处理,被分割为大小约1000帧的数据块,并存储为Parquet格式,确保了高效存取与处理。
特点
该数据集的核心特征在于其多模态与细粒度的数据组织。它同时提供了机器人的六维关节动作指令、对应的关节状态观测以及分辨率为480x640的三通道主摄像头视频流,实现了动作、状态与视觉感知的严格对齐。数据字段设计严谨,包含时间戳、帧索引、情节索引等元信息,支持对时序交互行为的深入分析。其采用的高效视频编码与列式存储格式,在保证数据质量的同时,也兼顾了存储效率与加载速度。
使用方法
为便于研究者利用,数据集已预先划分为训练集。用户可通过Hugging Face平台直接访问,并利用LeRobot提供的专用工具进行可视化与加载。典型的使用流程包括:解析meta/info.json文件以了解数据结构,按照指定路径加载Parquet数据文件及对应的MP4视频文件。该数据集适用于机器人模仿学习、视觉运动策略学习等任务的模型训练与评估,其清晰的结构定义使得集成到现有机器学习管道中变得直接而高效。
背景与挑战
背景概述
在机器人学习领域,模仿学习与视觉运动控制是推动智能体在现实环境中执行复杂任务的核心研究方向。vr_test_single_arm数据集依托LeRobot开源框架构建,专注于单臂机器人操作任务的数据采集与模型验证。该数据集由HuggingFace社区成员vladfatu于近期发布,旨在为机器人控制算法提供高质量的视觉与关节状态同步记录,其数据涵盖机械臂的六自由度关节位置、高帧率视觉观测及时间戳信息,为端到端策略学习与仿真到实物的迁移研究奠定了实证基础。
当前挑战
该数据集致力于解决单臂机器人基于视觉的精细操作问题,其核心挑战在于如何从高维视觉输入中提取鲁棒的特征表示,并生成精确且平滑的关节空间动作序列。在数据构建过程中,面临多模态数据同步对齐的复杂性,需确保图像帧与机械臂状态在时间维度上严格一致;同时,数据规模相对有限,仅包含17个任务片段,可能影响模型泛化能力。此外,真实世界的光照变化、遮挡及传感器噪声等因素,对数据质量与算法鲁棒性提出了更高要求。
常用场景
经典使用场景
在机器人学习领域,vr_test_single_arm数据集为单臂机器人操作任务提供了宝贵的实验数据。该数据集通过记录机器人关节位置、图像观察及时间戳等信息,典型应用于模仿学习与强化学习算法的训练与验证。研究者可利用其结构化轨迹数据,构建端到端的控制模型,模拟真实环境中的抓取、放置等精细操作,从而推动机器人自主决策能力的发展。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在机器人模仿学习与视觉运动策略的改进上。例如,利用其多模态特征进行行为克隆算法的基准测试,或结合深度强化学习框架探索样本高效的离线训练方法。这些工作不仅拓展了数据集的利用率,还催生了新的模型架构与评估标准,持续丰富着机器人学习社区的工具与理论体系。
数据集最近研究
最新研究方向
在机器人学习领域,视觉与动作数据的融合已成为推动智能体泛化能力提升的关键路径。vr_test_single_arm数据集凭借其包含的机械臂关节位置与同步视觉观测,为模仿学习与强化学习算法的训练提供了宝贵资源。当前研究热点聚焦于如何利用此类多模态数据,通过端到端模型实现从视觉输入到连续动作空间的直接映射,从而在复杂动态环境中增强机械臂的操作灵活性与适应性。这一方向不仅呼应了具身智能的发展趋势,也为工业自动化与家庭服务机器人的实际应用奠定了数据基础,具有显著的实践价值与学术意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作